FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5578, 458 aa 1>>>pF1KE5578 458 - 458 aa - 458 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.4093+/-0.000777; mu= 13.6637+/- 0.047 mean_var=101.4899+/-20.684, 0's: 0 Z-trim(111.8): 28 B-trim: 279 in 1/48 Lambda= 0.127310 statistics sampled from 12648 (12670) to 12648 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.726), E-opt: 0.2 (0.389), width: 16 Scan time: 2.720 The best scores are: opt bits E(32554) CCDS10714.1 SLC5A2 gene_id:6524|Hs108|chr16 ( 672) 2550 478.6 8.4e-135 CCDS13902.1 SLC5A1 gene_id:6523|Hs108|chr22 ( 664) 1736 329.1 8.4e-90 CCDS30709.2 SLC5A9 gene_id:200010|Hs108|chr1 ( 681) 1600 304.1 2.9e-82 CCDS13903.1 SLC5A4 gene_id:6527|Hs108|chr22 ( 659) 1581 300.6 3.1e-81 CCDS10625.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 675) 1490 283.9 3.4e-76 CCDS42275.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 596) 1489 283.7 3.5e-76 CCDS11201.2 SLC5A10 gene_id:125206|Hs108|chr17 ( 612) 1447 276.0 7.5e-74 CCDS33549.1 SLC5A3 gene_id:6526|Hs108|chr21 ( 718) 1394 266.3 7.3e-71 CCDS58439.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 611) 1329 254.3 2.5e-67 CCDS59277.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 560) 1293 247.7 2.3e-65 CCDS44136.1 SLC5A9 gene_id:200010|Hs108|chr1 ( 706) 1204 231.4 2.3e-60 CCDS58805.1 SLC5A1 gene_id:6523|Hs108|chr22 ( 537) 1163 223.8 3.4e-58 CCDS58438.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 605) 885 172.8 8.8e-43 CCDS58437.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 640) 877 171.3 2.6e-42 CCDS59278.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 569) 785 154.4 2.8e-37 CCDS58440.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 519) 714 141.3 2.2e-33 CCDS74008.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 566) 615 123.2 7.1e-28 >>CCDS10714.1 SLC5A2 gene_id:6524|Hs108|chr16 (672 aa) initn: 2550 init1: 2550 opt: 2550 Z-score: 2533.6 bits: 478.6 E(32554): 8.4e-135 Smith-Waterman score: 2550; 100.0% identity (100.0% similar) in 377 aa overlap (1-377:1-377) 10 20 30 40 50 60 pF1KE5 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFLAGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFLAGR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 SMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVYLTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 SMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVYLTA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 GVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVIA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 LLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATSL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 TVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 CLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGTEVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 CLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGTEVG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 CSNIAYPRLVVKLMPNGRLLGTHRGPADGPGTPDSRVLLRLGQLCAALGVPSFPLRRALP ::::::::::::::::: CCDS10 CSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMDIYTRLRPRAGDR 370 380 390 400 410 420 >>CCDS13902.1 SLC5A1 gene_id:6523|Hs108|chr22 (664 aa) initn: 1741 init1: 1064 opt: 1736 Z-score: 1725.7 bits: 329.1 E(32554): 8.4e-90 Smith-Waterman score: 1736; 66.3% identity (89.2% similar) in 362 aa overlap (19-377:22-377) 10 20 30 40 50 pF1KE5 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFL :: : ::: .:. ::..:..::::.: ::::::::.:: CCDS13 MDSSTWSPKTTAVTRPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFFL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE5 AGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVY :::::::::.:::::::::::::::::::::::::.:..::::::: .:..:::::.:.: CCDS13 AGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPIY 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE5 LTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYAS . :::.:::.::::::::.::..:::.:::.::::::::.:.::::.::. ::: :.: . CCDS13 IKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYLA 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE5 VIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAA .. ::.:: .::.::::::..::::.:: ..: :. :: :.::::::::.....::. : CCDS13 IFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKAI 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE5 TSLTVSEDPAVGNISSF---CYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSD .. ::. :: ..: :: :: ::.:..: :.:::::::....:..:.. ::::.: CCDS13 PTI-VSD----GN-TTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTD 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 QVIVQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRV ::::::::..:...:.:.:::::::::: :::.:::::::::::: ...::::: :.. CCDS13 QVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKY 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 CGTEVGCSNIAYPRLVVKLMPNGRLLGTHRGPADGPGTPDSRVLLRLGQLCAALGVPSFP :::.:::.::::: :::.::::: CCDS13 CGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVR 360 370 380 390 400 410 >>CCDS30709.2 SLC5A9 gene_id:200010|Hs108|chr1 (681 aa) initn: 1599 init1: 983 opt: 1600 Z-score: 1590.5 bits: 304.1 E(32554): 2.9e-82 Smith-Waterman score: 1600; 59.9% identity (85.6% similar) in 369 aa overlap (9-377:21-381) 10 20 30 40 pF1KE5 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTN .::... .. . . :: :.. ::..::.::.:: :.. CCDS30 MSKELAAMGPGASGDGVRTETAPHIALDSRVGLHAYDISVVVIYFVFVIAVGIWSSIRAS 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE5 RGTVGGYFLAGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLL :::.:::::::::: :::.::::..::.::: :.::::::::.::::.:::::: ...: CCDS30 RGTIGGYFLAGRSMSWWPIGASLMSSNVGSGLFIGLAGTGAAGGLAVGGFEWNATWLLLA 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE5 LGWLFAPVYLTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQ :::.:.:::..:::.::::::.:::::.::..:.:::::.::::::::.:.::::.:::. CCDS30 LGWVFVPVYIAAGVVTMPQYLKKRFGGQRIQVYMSVLSLILYIFTKISTDIFSGALFIQM 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE5 ALGWNIYASVIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSG :::::.: :. :: .: .::..::: :..:::..:: ...::: .:: .:..:: : : CCDS30 ALGWNLYLSTGILLVVTAVYTIAGGLMAVIYTDALQTVIMVGGALVLMFLGFQDVGWYPG 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE5 LFDKYLGAATSLTVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSG : ..: : ..:: : .. :. ::::..:.:: ::.::.:::.:..:::... CCDS30 LEQRYRQAIPNVTV---P-----NTTCHLPRPDAFHILRDPVSGDIPWPGLIFGLTVLAT 250 260 270 280 290 290 300 310 320 330 340 pF1KE5 WYWCSDQVIVQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVP : ::.::::::: :..:::.: :.: .: ::::. :::..:::::::: :.::::.:: : CCDS30 WCWCTDQVIVQRSLSAKSLSHAKGGSVLGGYLKILPMFFIVMPGMISRALFPDEVGCVDP 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE5 EVCRRVCGTEVGCSNIAYPRLVVKLMPNGRLLGTHRGPADGPGTPDSRVLLRLGQLCAAL .::.:.::..:::::::::.::. ::: : CCDS30 DVCQRICGARVGCSNIAYPKLVMALMPVGLRGLMIAVIMAALMSSLTSIFNSSSTLFTID 360 370 380 390 400 410 >>CCDS13903.1 SLC5A4 gene_id:6527|Hs108|chr22 (659 aa) initn: 1587 init1: 952 opt: 1581 Z-score: 1571.9 bits: 300.6 E(32554): 3.1e-81 Smith-Waterman score: 1581; 58.3% identity (86.1% similar) in 367 aa overlap (11-377:14-377) 10 20 30 40 50 pF1KE5 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFL :: . : : ::: ::. :::.:..::::.: .:::::.::.:: CCDS13 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFFL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE5 AGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVY :::.:.:::.:::::::::::.:.:::::::::::.:.. :::.. ..:.:::.:.:.: CCDS13 AGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPIY 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE5 LTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYAS . .::.:::.::.:::::.:...:::.::::. . ::.:.:.::.::. ::: ..: . CCDS13 IKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYLA 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE5 VIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAA .. ::..: .::.:::::...::::.::...: :. ::::.::.::::: .. .::..:. CCDS13 IFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNAT 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE5 TSLTVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVI :.. ... . ::. :: :: ::.:..: ::::.:::....:. :.. ::::..::: CCDS13 PSVVEGDNLT---ISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVI 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 VQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGT ::::: ::...:.::.::.:.:::: :::::::::::::::: : :::::: : . ::. CCDS13 VQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGV 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 EVGCSNIAYPRLVVKLMPNGRLLGTHRGPADGPGTPDSRVLLRLGQLCAALGVPSFPLRR .:::.: ::: .:..:::.: CCDS13 DVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQA 360 370 380 390 400 410 >>CCDS10625.1 SLC5A11 gene_id:115584|Hs108|chr16 (675 aa) initn: 1494 init1: 921 opt: 1490 Z-score: 1481.4 bits: 283.9 E(32554): 3.4e-76 Smith-Waterman score: 1490; 55.5% identity (82.6% similar) in 380 aa overlap (1-377:1-372) 10 20 30 40 50 pF1KE5 MEEHTEAGSAPEMGAQKALIDN---PADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFL :: : . . :.. :. .. :.:: :.. :::.:..::::: .:.: :: :::: CCDS10 MESGTSSPQPPQLDPLDAFPQKGLEPGDIAVLVLYFLFVLAVGLWSTVKTKRDTVKGYFL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE5 AGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVY :: .::::::::::::::.:::::.::::.:::.:..:...: :.:: ::.:.:.: :.: CCDS10 AGGDMVWWPVGASLFASNVGSGHFIGLAGSGAATGISVSAYELNGLFSVLMLAWIFLPIY 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE5 LTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYAS ... : :::.:::::::: :: . :.:: ::.::::::::::..::.::::.: ..: . CCDS10 IAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYIFTKISVDMYAGAIFIQQSLHLDLYLA 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE5 VIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAA ...::.:: .:::.:::::..:::..::...: :: ::::.: :::. :: .::. : CCDS10 IVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIGALTLMGYSFAAVGGMEGLKEKYFLAL 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE5 TSLTVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVI .: . ::. : : :: :..:..: :.:.:::::..:.:..: : ::::.:::: CCDS10 AS-NRSEN-------SSCGLPREDAFHIFRDPLTSDLPWPGVLFGMSIPSLWYWCTDQVI 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 VQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGT ::: ::.:.:.: :.: .. .:::. :.:.::.:::.::::.::.:::. ::.:...:.. CCDS10 VQRTLAAKNLSHAKGGALMAAYLKVLPLFIMVFPGMVSRILFPDQVACADPEICQKICSN 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 EVGCSNIAYPRLVVKLMPNGRLLGTHRGPADGPGTPDSRVLLRLGQLCAALGVPSFPLRR :::.::::.::..:.:.: CCDS10 PSGCSDIAYPKLVLELLPTGLRGLMMAVMVAALMSSLTSIFNSASTIFTMDLWNHLRPRA 360 370 380 390 400 410 >>CCDS42275.1 SLC5A10 gene_id:125206|Hs108|chr17 (596 aa) initn: 1520 init1: 921 opt: 1489 Z-score: 1481.2 bits: 283.7 E(32554): 3.5e-76 Smith-Waterman score: 1489; 57.9% identity (83.9% similar) in 354 aa overlap (24-377:19-364) 10 20 30 40 50 60 pF1KE5 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFLAGR :::.::..:: : ..::.:: ::..:.::.::::::: CCDS42 MAANSTSDLHTPGTQLSVADIIVITVYFALNVAVGIWSSCRASRNTVNGYFLAGR 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 SMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVYLTA .:.:::.:::::::. ::: :.::::.:::.::::::::::: .:.: :.:.:.:.:... CCDS42 DMTWWPIGASLFASSEGSGLFIGLAGSGAAGGLAVAGFEWNATYVLLALAWVFVPIYISS 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE5 GVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVIA ..:.:.:..::.::.:::.:::::::.: .:::::.:...::.:.. ::::.: :.: CCDS42 EIVTLPEYIQKRYGGQRIRMYLSVLSLLLSVFTKISLDLYAGALFVHICLGWNFYLSTIL 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE5 LLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATSL :::: .::..:::::..:::..::.... :: :: :: ..:::. : : : : CCDS42 TLGITALYTIAGGLAAVIYTDALQTLIMVVGAVILTIKAFDQIGGYGQLEAAYAQAIPSR 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE5 TVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQR :.. .. :. :: :..:..: : :::::: .. .::::.. ::::.::::::: CCDS42 TIA--------NTTCHLPRTDAMHMFRDPHTGDLPWTGMTFGLTIMATWYWCTDQVIVQR 240 250 260 270 280 310 320 330 340 350 360 pF1KE5 CLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGTEVG :....:.: ::: :: .:::. :: :..::::::: :.::.:.:::: : :.::.::: CCDS42 SLSARDLNHAKAGSILASYLKMLPMGLIIMPGMISRALFPDDVGCVVPSECLRACGAEVG 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE5 CSNIAYPRLVVKLMPNGRLLGTHRGPADGPGTPDSRVLLRLGQLCAALGVPSFPLRRALP :::::::.::..::: : CCDS42 CSNIAYPKLVMELMPIGLRGLMIAVMLAALMSSLTSIFNSSSTLFTMDIWRRLRPRSGER 350 360 370 380 390 400 >>CCDS11201.2 SLC5A10 gene_id:125206|Hs108|chr17 (612 aa) initn: 1564 init1: 908 opt: 1447 Z-score: 1439.3 bits: 276.0 E(32554): 7.5e-74 Smith-Waterman score: 1447; 55.4% identity (80.3% similar) in 370 aa overlap (24-377:19-380) 10 20 30 40 50 60 pF1KE5 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFLAGR :::.::..:: : ..::.:: ::..:.::.::::::: CCDS11 MAANSTSDLHTPGTQLSVADIIVITVYFALNVAVGIWSSCRASRNTVNGYFLAGR 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 SMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVYLTA .:.:::.:::::::. ::: :.::::.:::.::::::::::: .:.: :.:.:.:.:... CCDS11 DMTWWPIGASLFASSEGSGLFIGLAGSGAAGGLAVAGFEWNATYVLLALAWVFVPIYISS 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE5 GVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVIA ..:.:.:..::.::.:::.:::::::.: .:::::.:...::.:.. ::::.: :.: CCDS11 EIVTLPEYIQKRYGGQRIRMYLSVLSLLLSVFTKISLDLYAGALFVHICLGWNFYLSTIL 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE5 LLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATSL :::: .::..:::::..:::..::.... :: :: :: ..:::. : : : : CCDS11 TLGITALYTIAGGLAAVIYTDALQTLIMVVGAVILTIKAFDQIGGYGQLEAAYAQAIPSR 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE5 TVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQR :.. .. :. :: :..:..: : :::::: .. .::::.. ::::.::::::: CCDS11 TIA--------NTTCHLPRTDAMHMFRDPHTGDLPWTGMTFGLTIMATWYWCTDQVIVQR 240 250 260 270 280 310 320 330 340 pF1KE5 CLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYP----------------DEVA :....:.: ::: :: .:::. :: :..::::::: :.: :.:. CCDS11 SLSARDLNHAKAGSILASYLKMLPMGLIIMPGMISRALFPGAHVYEERHQVSVSRTDDVG 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE5 CVVPEVCRRVCGTEVGCSNIAYPRLVVKLMPNGRLLGTHRGPADGPGTPDSRVLLRLGQL :::: : :.::.::::::::::.::..::: : CCDS11 CVVPSECLRACGAEVGCSNIAYPKLVMELMPIGLRGLMIAVMLAALMSSLTSIFNSSSTL 350 360 370 380 390 400 410 420 430 440 450 pF1KE5 CAALGVPSFPLRRALPLLRHCAVLLLWPPHPHGLPVHRAHPQKAPPPPGLQSPA CCDS11 FTMDIWRRLRPRSGERELLLVGRLVIVALIGVSVAWIPVLQDSNSGQLFIYMQSVTSSLA 410 420 430 440 450 460 >>CCDS33549.1 SLC5A3 gene_id:6526|Hs108|chr21 (718 aa) initn: 1410 init1: 854 opt: 1394 Z-score: 1385.7 bits: 266.3 E(32554): 7.3e-71 Smith-Waterman score: 1394; 54.1% identity (84.3% similar) in 362 aa overlap (17-377:2-362) 10 20 30 40 50 60 pF1KE5 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFLAGR .:..:. ::: ..: ::.::. .:...: ..::.::.::::::: CCDS33 MRAVLDT-ADIAIVALYFILVMCIGFFAMWKSNRSTVSGYFLAGR 10 20 30 40 70 80 90 100 110 120 pF1KE5 SMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVYLTA ::.: .:::::.::::: ::.::::.:::::.::...:.:::... ::::.: :.:. . CCDS33 SMTWVAIGASLFVSNIGSEHFIGLAGSGAASGFAVGAWEFNALLLLQLLGWVFIPIYIRS 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE5 GVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVIA :: :::.:: :::::.::..:...:::.::::::.:::..:::.:::..::::.:.::: CCDS33 GVYTMPEYLSKRFGGHRIQVYFAALSLILYIFTKLSVDLYSGALFIQESLGWNLYVSVIL 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE5 LLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATSL :.:.: . ::::::.:..::::.:..... :: :: .. :.::. . .:. :. .. CCDS33 LIGMTALLTVTGGLVAVIYTDTLQALLMIIGALTLMIISIMEIGGFEEVKRRYMLASPDV 170 180 190 200 210 220 250 260 270 280 290 pF1KE5 T-VSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQ : . ..: .: :. .. ..::.:. :.:::...:: : .: ::::.:::::: CCDS33 TSILLTYNLSNTNSCNVSPKKEALKMLRNPTDEDVPWPGFILGQTPASVWYWCADQVIVQ 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE5 RCLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGTEV : ::.:...: :.. .. :.::: :::..:.::::::::. :..::. :: : :::... CCDS33 RVLAAKNIAHAKGSTLMAGFLKLLPMFIIVVPGMISRILFTDDIACINPEHCMLVCGSRA 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE5 GCSNIAYPRLVVKLMPNGRLLGTHRGPADGPGTPDSRVLLRLGQLCAALGVPSFPLRRAL :::::::::::.::.: : CCDS33 GCSNIAYPRLVMKLVPVGLRGLMMAVMIAALMSDLDSIFNSASTIFTLDVYKLIRKSASS 350 360 370 380 390 400 >>CCDS58439.1 SLC5A11 gene_id:115584|Hs108|chr16 (611 aa) initn: 1342 init1: 769 opt: 1329 Z-score: 1322.2 bits: 254.3 E(32554): 2.5e-67 Smith-Waterman score: 1329; 57.9% identity (85.4% similar) in 316 aa overlap (62-377:1-308) 40 50 60 70 80 90 pF1KE5 YFLLVIGVGLWSMCRTNRGTVGGYFLAGRSMVWWPVGASLFASNIGSGHFVGLAGTGAAS ::::::::::::::.:::::.::::.:::. CCDS58 MVWWPVGASLFASNVGSGHFIGLAGSGAAT 10 20 30 100 110 120 130 140 150 pF1KE5 GLAVAGFEWNALFVVLLLGWLFAPVYLTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYI :..:...: :.:: ::.:.:.: :.:... : :::.:::::::: :: . :.:: ::.:: CCDS58 GISVSAYELNGLFSVLMLAWIFLPIYIAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYI 40 50 60 70 80 90 160 170 180 190 200 210 pF1KE5 FTKISVDMFSGAVFIQQALGWNIYASVIALLGITMIYTVTGGLAALMYTDTVQTFVILGG ::::::::..::.::::.: ..: ....::.:: .:::.:::::..:::..::...: : CCDS58 FTKISVDMYAGAIFIQQSLHLDLYLAIVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIG 100 110 120 130 140 150 220 230 240 250 260 270 pF1KE5 ACILMGYAFHEVGGYSGLFDKYLGAATSLTVSEDPAVGNISSFCYRPRPDSYHLLRHPVT : ::::.: :::. :: .::. : .: . ::. : : :: :..:..: :.: CCDS58 ALTLMGYSFAAVGGMEGLKEKYFLALAS-NRSEN-------SSCGLPREDAFHIFRDPLT 160 170 180 190 200 280 290 300 310 320 330 pF1KE5 GDLPWPALLLGLTIVSGWYWCSDQVIVQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMP .:::::..:.:..: : ::::.::::::: ::.:.:.: :.: .. .:::. :.:.::.: CCDS58 SDLPWPGVLFGMSIPSLWYWCTDQVIVQRTLAAKNLSHAKGGALMAAYLKVLPLFIMVFP 210 220 230 240 250 260 340 350 360 370 380 390 pF1KE5 GMISRILYPDEVACVVPEVCRRVCGTEVGCSNIAYPRLVVKLMPNGRLLGTHRGPADGPG ::.::::.::.:::. ::.:...:.. :::.::::.::..:.:.: CCDS58 GMVSRILFPDQVACADPEICQKICSNPSGCSDIAYPKLVLELLPTGLRGLMMAVMVAALM 270 280 290 300 310 320 400 410 420 430 440 450 pF1KE5 TPDSRVLLRLGQLCAALGVPSFPLRRALPLLRHCAVLLLWPPHPHGLPVHRAHPQKAPPP CCDS58 SSLTSIFNSASTIFTMDLWNHLRPRASEKELMIVGRVFVLLLVLVSILWIPVVQASQGGQ 330 340 350 360 370 380 >>CCDS59277.1 SLC5A10 gene_id:125206|Hs108|chr17 (560 aa) initn: 1324 init1: 921 opt: 1293 Z-score: 1287.0 bits: 247.7 E(32554): 2.3e-65 Smith-Waterman score: 1293; 56.5% identity (83.3% similar) in 317 aa overlap (24-340:19-327) 10 20 30 40 50 60 pF1KE5 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFLAGR :::.::..:: : ..::.:: ::..:.::.::::::: CCDS59 MAANSTSDLHTPGTQLSVADIIVITVYFALNVAVGIWSSCRASRNTVNGYFLAGR 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 SMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVYLTA .:.:::.:::::::. ::: :.::::.:::.::::::::::: .:.: :.:.:.:.:... CCDS59 DMTWWPIGASLFASSEGSGLFIGLAGSGAAGGLAVAGFEWNATYVLLALAWVFVPIYISS 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE5 GVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVIA ..:.:.:..::.::.:::.:::::::.: .:::::.:...::.:.. ::::.: :.: CCDS59 EIVTLPEYIQKRYGGQRIRMYLSVLSLLLSVFTKISLDLYAGALFVHICLGWNFYLSTIL 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE5 LLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATSL :::: .::..:::::..:::..::.... :: :: :: ..:::. : : : : CCDS59 TLGITALYTIAGGLAAVIYTDALQTLIMVVGAVILTIKAFDQIGGYGQLEAAYAQAIPSR 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE5 TVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQR :.. .. :. :: :..:..: : :::::: .. .::::.. ::::.::::::: CCDS59 TIA--------NTTCHLPRTDAMHMFRDPHTGDLPWTGMTFGLTIMATWYWCTDQVIVQR 240 250 260 270 280 310 320 330 340 350 360 pF1KE5 CLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGTEVG :....:.: ::: :: .:::. :: :..::::::: :.: CCDS59 SLSARDLNHAKAGSILASYLKMLPMGLIIMPGMISRALFPGLRGLMIAVMLAALMSSLTS 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE5 CSNIAYPRLVVKLMPNGRLLGTHRGPADGPGTPDSRVLLRLGQLCAALGVPSFPLRRALP CCDS59 IFNSSSTLFTMDIWRRLRPRSGERELLLVGRLVIVALIGVSVAWIPVLQDSNSGQLFIYM 350 360 370 380 390 400 458 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 02:01:27 2016 done: Tue Nov 8 02:01:28 2016 Total Scan time: 2.720 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]