FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2739, 672 aa
1>>>pF1KE2739 672 - 672 aa - 672 aa
Library: human.CCDS.faa
18921897 residues in 33420 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.2548+/-0.000847; mu= 20.5562+/- 0.051
mean_var=78.7477+/-15.999, 0's: 0 Z-trim(107.5): 32 B-trim: 0 in 0/52
Lambda= 0.144529
statistics sampled from 9748 (9771) to 9748 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.65), E-opt: 0.2 (0.292), width: 16
Scan time: 1.710
The best scores are: opt bits E(33420)
CCDS10714.1 SLC5A2 gene_id:6524|Hs109|chr16 ( 672) 4529 954.3 0
CCDS13902.1 SLC5A1 gene_id:6523|Hs109|chr22 ( 664) 2809 595.7 7.2e-170
CCDS30709.2 SLC5A9 gene_id:200010|Hs109|chr1 ( 681) 2532 537.9 1.8e-152
CCDS13903.1 SLC5A4 gene_id:6527|Hs109|chr22 ( 659) 2483 527.7 2.1e-149
CCDS58805.1 SLC5A1 gene_id:6523|Hs109|chr22 ( 537) 2236 476.1 5.7e-134
CCDS10625.1 SLC5A11 gene_id:115584|Hs109|chr16 ( 675) 2230 475.0 1.6e-133
CCDS42275.1 SLC5A10 gene_id:125206|Hs109|chr17 ( 596) 2185 465.5 9.7e-131
CCDS11201.2 SLC5A10 gene_id:125206|Hs109|chr17 ( 612) 2143 456.8 4.3e-128
CCDS44136.1 SLC5A9 gene_id:200010|Hs109|chr1 ( 706) 2136 455.4 1.3e-127
CCDS58439.1 SLC5A11 gene_id:115584|Hs109|chr16 ( 611) 2069 441.3 1.9e-123
CCDS33549.1 SLC5A3 gene_id:6526|Hs109|chr21 ( 718) 2048 437.0 4.5e-122
CCDS58438.1 SLC5A11 gene_id:115584|Hs109|chr16 ( 605) 1625 348.8 1.4e-95
CCDS58437.1 SLC5A11 gene_id:115584|Hs109|chr16 ( 640) 1617 347.1 4.6e-95
CCDS59278.1 SLC5A10 gene_id:125206|Hs109|chr17 ( 569) 1343 289.9 6.7e-78
CCDS59277.1 SLC5A10 gene_id:125206|Hs109|chr17 ( 560) 1299 280.8 3.8e-75
CCDS58440.1 SLC5A11 gene_id:115584|Hs109|chr16 ( 519) 714 158.8 1.9e-38
CCDS74008.1 SLC5A10 gene_id:125206|Hs109|chr17 ( 566) 615 138.1 3.3e-32
CCDS12368.1 SLC5A5 gene_id:6528|Hs109|chr19 ( 643) 297 71.9 3.3e-12
CCDS7860.2 SLC5A12 gene_id:159963|Hs109|chr11 ( 618) 288 70.0 1.2e-11
>>CCDS10714.1 SLC5A2 gene_id:6524|Hs109|chr16 (672 aa)
initn: 4529 init1: 4529 opt: 4529 Z-score: 5101.6 bits: 954.3 E(33420): 0
Smith-Waterman score: 4529; 100.0% identity (100.0% similar) in 672 aa overlap (1-672:1-672)
10 20 30 40 50 60
pF1KE2 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFLAGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFLAGR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 SMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVYLTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVYLTA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 GVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVIA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 LLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATSL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 TVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 TVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 CLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGTEVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 CLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGTEVG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 CSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMDIYTRLRPRAGDR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 CSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMDIYTRLRPRAGDR
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 ELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAVFVLALFVPRV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAVFVLALFVPRV
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 NEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFAIVLFFCSGLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 NEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFAIVLFFCSGLL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 TLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLPVQNGCPESAMEMNEPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 TLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLPVQNGCPESAMEMNEPQ
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE2 APAPSLFRQCLLWFCGMSRGGVGSPPPLTQEEAAAAARRLEDISEDPSWARVVNLNALLM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 APAPSLFRQCLLWFCGMSRGGVGSPPPLTQEEAAAAARRLEDISEDPSWARVVNLNALLM
610 620 630 640 650 660
670
pF1KE2 MAVAVFLWGFYA
::::::::::::
CCDS10 MAVAVFLWGFYA
670
>>CCDS13902.1 SLC5A1 gene_id:6523|Hs109|chr22 (664 aa)
initn: 2712 init1: 1600 opt: 2809 Z-score: 3163.4 bits: 595.7 E(33420): 7.2e-170
Smith-Waterman score: 2809; 60.4% identity (85.6% similar) in 659 aa overlap (19-672:22-664)
10 20 30 40 50
pF1KE2 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFL
:: : ::: .:. ::..:..::::.: ::::::::.::
CCDS13 MDSSTWSPKTTAVTRPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFFL
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 AGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVY
:::::::::.:::::::::::::::::::::::::.:..::::::: .:..:::::.:.:
CCDS13 AGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPIY
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 LTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYAS
. :::.:::.::::::::.::..:::.:::.::::::::.:.::::.::. ::: :.: .
CCDS13 IKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYLA
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE2 VIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAA
.. ::.:: .::.::::::..::::.:: ..: :. :: :.::::::::.....::. :
CCDS13 IFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKAI
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE2 TSLTVSEDPAVGNISSF---CYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSD
.. ::. :: ..: :: :: ::.:..: :.:::::::....:..:.. ::::.:
CCDS13 PTI-VSD----GN-TTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTD
250 260 270 280 290
300 310 320 330 340 350
pF1KE2 QVIVQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRV
::::::::..:...:.:.:::::::::: :::.:::::::::::: ...::::: :..
CCDS13 QVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKY
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 CGTEVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMDIYTRLR
:::.:::.::::: :::.:::::::::::.::::.:::::.:::::.:::::::::...:
CCDS13 CGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVR
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE2 PRAGDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAVFVLA
::...::...:::... .. .:.::.:.::.::.::::::::...:::.::..:::.::
CCDS13 KRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLA
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE2 LFVPRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFAIVLF
.: :::: ::::::: :::.:..:.: ::..:.:::..:: ::...::::::::::.::
CCDS13 IFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILF
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE2 FCSGLLTLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLPVQNGCPESAM
: . ...:: : ::: ::.:: .:::.::::: ::::.:.. .:.: :. ..
CCDS13 AISFITIVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEEEN-----IQEG-PKETI
540 550 560 570 580
600 610 620 630 640 650
pF1KE2 EMNEPQAPAPS--LFRQCLLWFCGMSRGGVGSPPPLTQEEAAAAARRLEDISEDPSWARV
:. : :.: . .::. :::. . :. : .:.:: : .. : :: : : :
CCDS13 EI-ETQVPEKKKGIFRRAYDLFCGLEQHGA---PKMTEEEEKAMKMKMTDTSEKPLWRTV
590 600 610 620 630 640
660 670
pF1KE2 VNLNALLMMAVAVFLWGFYA
.:.:......:::: ...:
CCDS13 LNVNGIILVTVAVFCHAYFA
650 660
>>CCDS30709.2 SLC5A9 gene_id:200010|Hs109|chr1 (681 aa)
initn: 2489 init1: 1363 opt: 2532 Z-score: 2851.1 bits: 537.9 E(33420): 1.8e-152
Smith-Waterman score: 2532; 54.2% identity (81.4% similar) in 673 aa overlap (9-672:21-681)
10 20 30 40
pF1KE2 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTN
.::... .. . . :: :.. ::..::.::.:: :..
CCDS30 MSKELAAMGPGASGDGVRTETAPHIALDSRVGLHAYDISVVVIYFVFVIAVGIWSSIRAS
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE2 RGTVGGYFLAGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLL
:::.:::::::::: :::.::::..::.::: :.::::::::.::::.:::::: ...:
CCDS30 RGTIGGYFLAGRSMSWWPIGASLMSSNVGSGLFIGLAGTGAAGGLAVGGFEWNATWLLLA
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE2 LGWLFAPVYLTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQ
:::.:.:::..:::.::::::.:::::.::..:.:::::.::::::::.:.::::.:::.
CCDS30 LGWVFVPVYIAAGVVTMPQYLKKRFGGQRIQVYMSVLSLILYIFTKISTDIFSGALFIQM
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE2 ALGWNIYASVIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSG
:::::.: :. :: .: .::..::: :..:::..:: ...::: .:: .:..:: : :
CCDS30 ALGWNLYLSTGILLVVTAVYTIAGGLMAVIYTDALQTVIMVGGALVLMFLGFQDVGWYPG
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE2 LFDKYLGAATSLTVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSG
: ..: : ..:: : .. :. ::::..:.:: ::.::.:::.:..:::...
CCDS30 LEQRYRQAIPNVTV---P-----NTTCHLPRPDAFHILRDPVSGDIPWPGLIFGLTVLAT
250 260 270 280 290
290 300 310 320 330 340
pF1KE2 WYWCSDQVIVQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVP
: ::.::::::: :..:::.: :.: .: ::::. :::..:::::::: :.::::.:: :
CCDS30 WCWCTDQVIVQRSLSAKSLSHAKGGSVLGGYLKILPMFFIVMPGMISRALFPDEVGCVDP
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE2 EVCRRVCGTEVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMD
.::.:.::..:::::::::.::. ::: ::::::.::..:::::::.:::::::::::.:
CCDS30 DVCQRICGARVGCSNIAYPKLVMALMPVGLRGLMIAVIMAALMSSLTSIFNSSSTLFTID
360 370 380 390 400 410
410 420 430 440 450 460
pF1KE2 IYTRLRPRAGDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVS
.. :.: .. ..::..:::..:::.::.:. :.:..:....::::::::::.::::::..
CCDS30 VWQRFRRKSTEQELMVVGRVFVVFLVVISILWIPIIQSSNSGQLFDYIQAVTSYLAPPIT
420 430 440 450 460 470
470 480 490 500 510 520
pF1KE2 AVFVLALFVPRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLY
:.:.::.: ::.: ::::::. :: .:: :.: :::. . .: . . :: : ::::
CCDS30 ALFLLAIFCKRVTEPGAFWGLVFGLGVGLLRMILEFSYPAPACGEVDRRPAVLKDFHYLY
480 490 500 510 520 530
530 540 550 560 570 580
pF1KE2 FAIVLFFCSGLLTLTVSLCTAPIPRKHLHRLVFSLRH---SKEEREDLDA----DEQQGS
:::.: .... . :::::.:::...: ::.. :. :. :.: .. .:. ..
CCDS30 FAILLCGLTAIVIVIVSLCTTPIPEEQLTRLTWWTRNCPLSELEKEAHESTPEISERPAG
540 550 560 570 580 590
590 600 610 620 630
pF1KE2 SLPVQNGCPE-SAMEMNEPQAPAPSLFRQCLLWFCGMSRGGVGSPPP-LTQEEAAAAARR
:. .: : :.. ...:.::. : . ::::.: :.: :. : :: ..
CCDS30 ECPAGGGAAENSSLGQEQPEAPSRSWGKLLWSWFCGLS----GTPEQALSPAEKAALEQK
600 610 620 630 640
640 650 660 670
pF1KE2 LEDISEDPSWARVVNLNALLMMAVAVFLWGFYA
: .: :.: : .: :.::.:..:. .::::..:
CCDS30 LTSIEEEPLWRHVCNINAVLLLAINIFLWGYFA
650 660 670 680
>>CCDS13903.1 SLC5A4 gene_id:6527|Hs109|chr22 (659 aa)
initn: 2666 init1: 1531 opt: 2483 Z-score: 2796.1 bits: 527.7 E(33420): 2.1e-149
Smith-Waterman score: 2641; 56.5% identity (83.4% similar) in 662 aa overlap (11-672:14-659)
10 20 30 40 50
pF1KE2 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFL
:: . : : ::: ::. :::.:..::::.: .:::::.::.::
CCDS13 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFFL
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 AGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVY
:::.:.:::.:::::::::::.:.:::::::::::.:.. :::.. ..:.:::.:.:.:
CCDS13 AGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPIY
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 LTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYAS
. .::.:::.::.:::::.:...:::.::::. . ::.:.:.::.::. ::: ..: .
CCDS13 IKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYLA
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE2 VIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAA
.. ::..: .::.:::::...::::.::...: :. ::::.::.::::: .. .::..:.
CCDS13 IFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNAT
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE2 TSLTVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVI
:.. ... . ::. :: :: ::.:..: ::::.:::....:. :.. ::::..:::
CCDS13 PSVVEGDNLT---ISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVI
250 260 270 280 290
300 310 320 330 340 350
pF1KE2 VQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGT
::::: ::...:.::.::.:.:::: :::::::::::::::: : :::::: : . ::.
CCDS13 VQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGV
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 EVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMDIYTRLRPRA
.:::.: ::: .:..:::.:::::::.::::.:::::.:::::.:::::.:.::..: .:
CCDS13 DVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQA
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE2 GDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAVFVLALFV
...:::..::..:....:::..:.:.::..:.:::. : ...::::.::..::::::.:
CCDS13 SEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFC
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE2 PRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFAIVLFFCS
:::::::::::. :: ::: :.: ::..:.:::. :: :: ..::::::::.::::: :
CCDS13 KRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGS
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE2 GLLTLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLPVQNGCPESAMEMN
:.:: .:: : ::: ::.:: . ::.: ::: :.::.:. :. ...: .: .
CCDS13 MLVTLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEK--SQEETDDG-----VEED
540 550 560 570 580 590
600 610 620 630 640 650
pF1KE2 EPQAPAPSLFRQCLLWFCGMSRGGVGSPPPLTQEEAAAAARRLEDISEDPSWARVVNLNA
:. : .. :::...: : ::.:: : ...: : :: ::: .::.::
CCDS13 YPEKSRGCL-KKAYDLFCGLQKG-----PKLTKEEEEALSKKLTDTSERPSWRTIVNINA
600 610 620 630 640
660 670
pF1KE2 LLMMAVAVFLWGFYA
.:..::.::. :.::
CCDS13 ILLLAVVVFIHGYYA
650
>>CCDS58805.1 SLC5A1 gene_id:6523|Hs109|chr22 (537 aa)
initn: 2248 init1: 1600 opt: 2236 Z-score: 2518.9 bits: 476.1 E(33420): 5.7e-134
Smith-Waterman score: 2236; 57.7% identity (84.3% similar) in 553 aa overlap (125-672:1-537)
100 110 120 130 140 150
pF1KE2 VAGFEWNALFVVLLLGWLFAPVYLTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTK
::.::::::::.::..:::.:::.::::::
CCDS58 MPEYLRKRFGGQRIQVYLSLLSLLLYIFTK
10 20 30
160 170 180 190 200 210
pF1KE2 ISVDMFSGAVFIQQALGWNIYASVIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACI
::.:.::::.::. ::: :.: ... ::.:: .::.::::::..::::.:: ..: :. :
CCDS58 ISADIFSGAIFINLALGLNLYLAIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLI
40 50 60 70 80 90
220 230 240 250 260 270
pF1KE2 LMGYAFHEVGGYSGLFDKYLGAATSLTVSEDPAVGNISSF---CYRPRPDSYHLLRHPVT
: :.::::::::.....::. : .. ::. :: ..: :: :: ::.:..: :.:
CCDS58 LTGFAFHEVGGYDAFMEKYMKAIPTI-VSD----GN-TTFQEKCYTPRADSFHIFRDPLT
100 110 120 130 140
280 290 300 310 320 330
pF1KE2 GDLPWPALLLGLTIVSGWYWCSDQVIVQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMP
::::::....:..:.. ::::.:::::::::..:...:.:.:::::::::: :::.::::
CCDS58 GDLPWPGFIFGMSILTLWYWCTDQVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMP
150 160 170 180 190 200
340 350 360 370 380 390
pF1KE2 GMISRILYPDEVACVVPEVCRRVCGTEVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALM
:::::::: ...::::: :.. :::.:::.::::: :::.:::::::::::.::::.::
CCDS58 GMISRILYTEKIACVVPSECEKYCGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLM
210 220 230 240 250 260
400 410 420 430 440 450
pF1KE2 SSLASIFNSSSTLFTMDIYTRLRPRAGDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQ
:::.:::::.:::::::::...: ::...::...:::... .. .:.::.:.::.::.::
CCDS58 SSLTSIFNSASTLFTMDIYAKVRKRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQ
270 280 290 300 310 320
460 470 480 490 500 510
pF1KE2 LFDYIQAVSSYLAPPVSAVFVLALFVPRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSC
::::::...:::.::..:::.::.: :::: ::::::: :::.:..:.: ::..:.:::
CCDS58 LFDYIQSITSYLGPPIAAVFLLAIFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSC
330 340 350 360 370 380
520 530 540 550 560 570
pF1KE2 VQPSACPAFLCGVHYLYFAIVLFFCSGLLTLTVSLCTAPIPRKHLHRLVFSLRHSKEERE
..:: ::...::::::::::.:: : . ...:: : ::: ::.:: .:::.:::::
CCDS58 MEPSNCPTIICGVHYLYFAIILFAISFITIVVISLLTKPIPDVHLYRLCWSLRNSKEERI
390 400 410 420 430 440
580 590 600 610 620
pF1KE2 DLDADEQQGSSLPVQNGCPESAMEMNEPQAPAPS--LFRQCLLWFCGMSRGGVGSPPPLT
::::.:.. .:.: :. ..:. : :.: . .::. :::. . :. : .:
CCDS58 DLDAEEEN-----IQEG-PKETIEI-ETQVPEKKKGIFRRAYDLFCGLEQHGA---PKMT
450 460 470 480 490
630 640 650 660 670
pF1KE2 QEEAAAAARRLEDISEDPSWARVVNLNALLMMAVAVFLWGFYA
.:: : .. : :: : : :.:.:......:::: ...:
CCDS58 EEEEKAMKMKMTDTSEKPLWRTVLNVNGIILVTVAVFCHAYFA
500 510 520 530
>>CCDS10625.1 SLC5A11 gene_id:115584|Hs109|chr16 (675 aa)
initn: 2244 init1: 1301 opt: 2230 Z-score: 2510.8 bits: 475.0 E(33420): 1.6e-133
Smith-Waterman score: 2281; 49.2% identity (77.4% similar) in 691 aa overlap (1-672:1-675)
10 20 30 40 50
pF1KE2 MEEHTEAGSAPEMGAQKALIDN---PADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFL
:: : . . :.. :. .. :.:: :.. :::.:..::::: .:.: :: ::::
CCDS10 MESGTSSPQPPQLDPLDAFPQKGLEPGDIAVLVLYFLFVLAVGLWSTVKTKRDTVKGYFL
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 AGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVY
:: .::::::::::::::.:::::.::::.:::.:..:...: :.:: ::.:.:.: :.:
CCDS10 AGGDMVWWPVGASLFASNVGSGHFIGLAGSGAATGISVSAYELNGLFSVLMLAWIFLPIY
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 LTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYAS
... : :::.:::::::: :: . :.:: ::.::::::::::..::.::::.: ..: .
CCDS10 IAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYIFTKISVDMYAGAIFIQQSLHLDLYLA
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE2 VIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAA
...::.:: .:::.:::::..:::..::...: :: ::::.: :::. :: .::. :
CCDS10 IVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIGALTLMGYSFAAVGGMEGLKEKYFLAL
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE2 TSLTVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVI
.: . ::. : : :: :..:..: :.:.:::::..:.:..: : ::::.::::
CCDS10 AS-NRSEN-------SSCGLPREDAFHIFRDPLTSDLPWPGVLFGMSIPSLWYWCTDQVI
250 260 270 280 290
300 310 320 330 340 350
pF1KE2 VQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGT
::: ::.:.:.: :.: .. .:::. :.:.::.:::.::::.::.:::. ::.:...:..
CCDS10 VQRTLAAKNLSHAKGGALMAAYLKVLPLFIMVFPGMVSRILFPDQVACADPEICQKICSN
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 EVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMDIYTRLRPRA
:::.::::.::..:.:.::::::.:::.:::::::.:::::.::.::::....:::::
CCDS10 PSGCSDIAYPKLVLELLPTGLRGLMMAVMVAALMSSLTSIFNSASTIFTMDLWNHLRPRA
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE2 GDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAVFVLALFV
...::..:::..:...:.::. :.:::::.:::::: :::..:::: :::..::... :
CCDS10 SEKELMIVGRVFVLLLVLVSILWIPVVQASQGGQLFIYIQSISSYLQPPVAVVFIMGCFW
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE2 PRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFAIVLFFCS
:.::.:::::::.:::.::.::. .: . . : ::. :... ..:::::...: .
CCDS10 KRTNEKGAFWGLISGLLLGLVRLVLDFIYVQPRCDQPDERPVLVKSIHYLYFSMILSTVT
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE2 GLLTLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLPV-QNGCPESA---
. . ::: : : .. . .:.. ::. ... .: :: . ::: ::..
CCDS10 LITVSTVSWFTEPPSKEMVSHLTWFTRHDPVVQKE-QAPPAAPLSLTLSQNGMPEASSSS
540 550 560 570 580 590
600 610 620 630 640
pF1KE2 ---MEMNEPQA---------PAPSLFRQCLLWFCGMSRGGVGSPPPLTQEEAAAAARRLE
.:: . .. : : . .::.::... : .: : : .
CCDS10 SVQFEMVQENTSKTHSCDMTPKQSKVVKAILWLCGIQEKG-------KEELPARAEAIIV
600 610 620 630 640
650 660 670
pF1KE2 DISEDPSWARVVNLNALLMMAVAVFLWGFYA
.. :.: ....: .. .. :.:.::..:
CCDS10 SLEENPLVKTLLDVNLIFCVSCAIFIWGYFA
650 660 670
>>CCDS42275.1 SLC5A10 gene_id:125206|Hs109|chr17 (596 aa)
initn: 2290 init1: 1277 opt: 2185 Z-score: 2460.8 bits: 465.5 E(33420): 9.7e-131
Smith-Waterman score: 2185; 59.6% identity (84.3% similar) in 527 aa overlap (24-550:19-537)
10 20 30 40 50 60
pF1KE2 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFLAGR
:::.::..:: : ..::.:: ::..:.::.:::::::
CCDS42 MAANSTSDLHTPGTQLSVADIIVITVYFALNVAVGIWSSCRASRNTVNGYFLAGR
10 20 30 40 50
70 80 90 100 110 120
pF1KE2 SMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVYLTA
.:.:::.:::::::. ::: :.::::.:::.::::::::::: .:.: :.:.:.:.:...
CCDS42 DMTWWPIGASLFASSEGSGLFIGLAGSGAAGGLAVAGFEWNATYVLLALAWVFVPIYISS
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE2 GVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVIA
..:.:.:..::.::.:::.:::::::.: .:::::.:...::.:.. ::::.: :.:
CCDS42 EIVTLPEYIQKRYGGQRIRMYLSVLSLLLSVFTKISLDLYAGALFVHICLGWNFYLSTIL
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE2 LLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATSL
:::: .::..:::::..:::..::.... :: :: :: ..:::. : : : :
CCDS42 TLGITALYTIAGGLAAVIYTDALQTLIMVVGAVILTIKAFDQIGGYGQLEAAYAQAIPSR
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE2 TVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQR
:.. .. :. :: :..:..: : :::::: .. .::::.. ::::.:::::::
CCDS42 TIA--------NTTCHLPRTDAMHMFRDPHTGDLPWTGMTFGLTIMATWYWCTDQVIVQR
240 250 260 270 280
310 320 330 340 350 360
pF1KE2 CLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGTEVG
:....:.: ::: :: .:::. :: :..::::::: :.::.:.:::: : :.::.:::
CCDS42 SLSARDLNHAKAGSILASYLKMLPMGLIIMPGMISRALFPDDVGCVVPSECLRACGAEVG
290 300 310 320 330 340
370 380 390 400 410 420
pF1KE2 CSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMDIYTRLRPRAGDR
:::::::.::..::: ::::::.:::::::::::.::::::::::::::. :::::.:.:
CCDS42 CSNIAYPKLVMELMPIGLRGLMIAVMLAALMSSLTSIFNSSSTLFTMDIWRRLRPRSGER
350 360 370 380 390 400
430 440 450 460 470 480
pF1KE2 ELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAVFVLALFVPRV
:::::::: .: .. :::::.::.: ...:::: :.:.:.: :::::.:::::..: :.
CCDS42 ELLLVGRLVIVALIGVSVAWIPVLQDSNSGQLFIYMQSVTSSLAPPVTAVFVLGVFWRRA
410 420 430 440 450 460
490 500 510 520 530 540
pF1KE2 NEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFAIVLFFCSGLL
::::::::::.::..: .::. :: . : .:.. :: : ..:::.::..:: :: .
CCDS42 NEQGAFWGLIAGLVVGATRLVLEFLNPAPPCGEPDTRPAVLGSIHYLHFAVALFALSGAV
470 480 490 500 510 520
550 560 570 580 590 600
pF1KE2 TLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLPVQNGCPESAMEMNEPQ
... :: : :
CCDS42 VVAGSLLTPPPQSVQIENLTWWTLAQDVPLGTKAGDGQTPQKHAFWARVCGFNAILLMCV
530 540 550 560 570 580
>>CCDS11201.2 SLC5A10 gene_id:125206|Hs109|chr17 (612 aa)
initn: 2246 init1: 921 opt: 2143 Z-score: 2413.3 bits: 456.8 E(33420): 4.3e-128
Smith-Waterman score: 2143; 57.8% identity (81.8% similar) in 543 aa overlap (24-550:19-553)
10 20 30 40 50 60
pF1KE2 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFLAGR
:::.::..:: : ..::.:: ::..:.::.:::::::
CCDS11 MAANSTSDLHTPGTQLSVADIIVITVYFALNVAVGIWSSCRASRNTVNGYFLAGR
10 20 30 40 50
70 80 90 100 110 120
pF1KE2 SMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVYLTA
.:.:::.:::::::. ::: :.::::.:::.::::::::::: .:.: :.:.:.:.:...
CCDS11 DMTWWPIGASLFASSEGSGLFIGLAGSGAAGGLAVAGFEWNATYVLLALAWVFVPIYISS
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE2 GVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVIA
..:.:.:..::.::.:::.:::::::.: .:::::.:...::.:.. ::::.: :.:
CCDS11 EIVTLPEYIQKRYGGQRIRMYLSVLSLLLSVFTKISLDLYAGALFVHICLGWNFYLSTIL
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE2 LLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATSL
:::: .::..:::::..:::..::.... :: :: :: ..:::. : : : :
CCDS11 TLGITALYTIAGGLAAVIYTDALQTLIMVVGAVILTIKAFDQIGGYGQLEAAYAQAIPSR
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE2 TVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQR
:.. .. :. :: :..:..: : :::::: .. .::::.. ::::.:::::::
CCDS11 TIA--------NTTCHLPRTDAMHMFRDPHTGDLPWTGMTFGLTIMATWYWCTDQVIVQR
240 250 260 270 280
310 320 330 340
pF1KE2 CLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYP----------------DEVA
:....:.: ::: :: .:::. :: :..::::::: :.: :.:.
CCDS11 SLSARDLNHAKAGSILASYLKMLPMGLIIMPGMISRALFPGAHVYEERHQVSVSRTDDVG
290 300 310 320 330 340
350 360 370 380 390 400
pF1KE2 CVVPEVCRRVCGTEVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTL
:::: : :.::.::::::::::.::..::: ::::::.:::::::::::.:::::::::
CCDS11 CVVPSECLRACGAEVGCSNIAYPKLVMELMPIGLRGLMIAVMLAALMSSLTSIFNSSSTL
350 360 370 380 390 400
410 420 430 440 450 460
pF1KE2 FTMDIYTRLRPRAGDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLA
:::::. :::::.:.::::::::: .: .. :::::.::.: ...:::: :.:.:.: ::
CCDS11 FTMDIWRRLRPRSGERELLLVGRLVIVALIGVSVAWIPVLQDSNSGQLFIYMQSVTSSLA
410 420 430 440 450 460
470 480 490 500 510 520
pF1KE2 PPVSAVFVLALFVPRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGV
:::.:::::..: :.::::::::::.::..: .::. :: . : .:.. :: : ..
CCDS11 PPVTAVFVLGVFWRRANEQGAFWGLIAGLVVGATRLVLEFLNPAPPCGEPDTRPAVLGSI
470 480 490 500 510 520
530 540 550 560 570 580
pF1KE2 HYLYFAIVLFFCSGLLTLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLP
:::.::..:: :: .... :: : :
CCDS11 HYLHFAVALFALSGAVVVAGSLLTPPPQSVQIENLTWWTLAQDVPLGTKAGDGQTPQKHA
530 540 550 560 570 580
>>CCDS44136.1 SLC5A9 gene_id:200010|Hs109|chr1 (706 aa)
initn: 2475 init1: 1363 opt: 2136 Z-score: 2404.6 bits: 455.4 E(33420): 1.3e-127
Smith-Waterman score: 2472; 52.3% identity (78.5% similar) in 698 aa overlap (9-672:21-706)
10 20 30 40
pF1KE2 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTN
.::... .. . . :: :.. ::..::.::.:: :..
CCDS44 MSKELAAMGPGASGDGVRTETAPHIALDSRVGLHAYDISVVVIYFVFVIAVGIWSSIRAS
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE2 RGTVGGYFLAGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWN-------
:::.:::::::::: :::.::::..::.::: :.::::::::.::::.:::::
CCDS44 RGTIGGYFLAGRSMSWWPIGASLMSSNVGSGLFIGLAGTGAAGGLAVGGFEWNMRKSRSG
70 80 90 100 110 120
110 120 130 140
pF1KE2 ------------------ALFVVLLLGWLFAPVYLTAGVITMPQYLRKRFGGRRIRLYLS
: ...: :::.:.:::..:::.::::::.:::::.::..:.:
CCDS44 GDRGIHPRSHGRTGVRSQATWLLLALGWVFVPVYIAAGVVTMPQYLKKRFGGQRIQVYMS
130 140 150 160 170 180
150 160 170 180 190 200
pF1KE2 VLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVIALLGITMIYTVTGGLAALMYTDTV
::::.::::::::.:.::::.:::.:::::.: :. :: .: .::..::: :..:::..
CCDS44 VLSLILYIFTKISTDIFSGALFIQMALGWNLYLSTGILLVVTAVYTIAGGLMAVIYTDAL
190 200 210 220 230 240
210 220 230 240 250 260
pF1KE2 QTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATSLTVSEDPAVGNISSFCYRPRPDSY
:: ...::: .:: .:..:: : :: ..: : ..:: : .. :. ::::..
CCDS44 QTVIMVGGALVLMFLGFQDVGWYPGLEQRYRQAIPNVTV---P-----NTTCHLPRPDAF
250 260 270 280 290
270 280 290 300 310 320
pF1KE2 HLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQRCLAGKSLTHIKAGCILCGYLKLT
:.:: ::.::.:::.:..:::... : ::.::::::: :..:::.: :.: .: ::::.
CCDS44 HILRDPVSGDIPWPGLIFGLTVLATWCWCTDQVIVQRSLSAKSLSHAKGGSVLGGYLKIL
300 310 320 330 340 350
330 340 350 360 370 380
pF1KE2 PMFLMVMPGMISRILYPDEVACVVPEVCRRVCGTEVGCSNIAYPRLVVKLMPNGLRGLML
:::..:::::::: :.::::.:: :.::.:.::..:::::::::.::. ::: ::::::.
CCDS44 PMFFIVMPGMISRALFPDEVGCVDPDVCQRICGARVGCSNIAYPKLVMALMPVGLRGLMI
360 370 380 390 400 410
390 400 410 420 430 440
pF1KE2 AVMLAALMSSLASIFNSSSTLFTMDIYTRLRPRAGDRELLLVGRLWVVFIVVVSVAWLPV
::..:::::::.:::::::::::.:.. :.: .. ..::..:::..:::.::.:. :.:.
CCDS44 AVIMAALMSSLTSIFNSSSTLFTIDVWQRFRRKSTEQELMVVGRVFVVFLVVISILWIPI
420 430 440 450 460 470
450 460 470 480 490 500
pF1KE2 VQAAQGGQLFDYIQAVSSYLAPPVSAVFVLALFVPRVNEQGAFWGLIGGLLMGLARLIPE
.:....::::::::::.::::::..:.:.::.: ::.: ::::::. :: .:: :.: :
CCDS44 IQSSNSGQLFDYIQAVTSYLAPPITALFLLAIFCKRVTEPGAFWGLVFGLGVGLLRMILE
480 490 500 510 520 530
510 520 530 540 550 560
pF1KE2 FSFGSGSCVQPSACPAFLCGVHYLYFAIVLFFCSGLLTLTVSLCTAPIPRKHLHRLVFSL
::. . .: . . :: : :::::::.: .... . :::::.:::...: ::..
CCDS44 FSYPAPACGEVDRRPAVLKDFHYLYFAILLCGLTAIVIVIVSLCTTPIPEEQLTRLTWWT
540 550 560 570 580 590
570 580 590 600 610
pF1KE2 RH---SKEEREDLDA----DEQQGSSLPVQNGCPE-SAMEMNEPQAPAPSLFRQCLLWFC
:. :. :.: .. .:. .. :. .: : :.. ...:.::. : . :::
CCDS44 RNCPLSELEKEAHESTPEISERPAGECPAGGGAAENSSLGQEQPEAPSRSWGKLLWSWFC
600 610 620 630 640 650
620 630 640 650 660 670
pF1KE2 GMSRGGVGSPPP-LTQEEAAAAARRLEDISEDPSWARVVNLNALLMMAVAVFLWGFYA
:.: :.: :. : :: ..: .: :.: : .: :.::.:..:. .::::..:
CCDS44 GLS----GTPEQALSPAEKAALEQKLTSIEEEPLWRHVCNINAVLLLAINIFLWGYFA
660 670 680 690 700
>>CCDS58439.1 SLC5A11 gene_id:115584|Hs109|chr16 (611 aa)
initn: 2092 init1: 1301 opt: 2069 Z-score: 2330.0 bits: 441.3 E(33420): 1.9e-123
Smith-Waterman score: 2120; 49.8% identity (78.3% similar) in 627 aa overlap (62-672:1-611)
40 50 60 70 80 90
pF1KE2 YFLLVIGVGLWSMCRTNRGTVGGYFLAGRSMVWWPVGASLFASNIGSGHFVGLAGTGAAS
::::::::::::::.:::::.::::.:::.
CCDS58 MVWWPVGASLFASNVGSGHFIGLAGSGAAT
10 20 30
100 110 120 130 140 150
pF1KE2 GLAVAGFEWNALFVVLLLGWLFAPVYLTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYI
:..:...: :.:: ::.:.:.: :.:... : :::.:::::::: :: . :.:: ::.::
CCDS58 GISVSAYELNGLFSVLMLAWIFLPIYIAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYI
40 50 60 70 80 90
160 170 180 190 200 210
pF1KE2 FTKISVDMFSGAVFIQQALGWNIYASVIALLGITMIYTVTGGLAALMYTDTVQTFVILGG
::::::::..::.::::.: ..: ....::.:: .:::.:::::..:::..::...: :
CCDS58 FTKISVDMYAGAIFIQQSLHLDLYLAIVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIG
100 110 120 130 140 150
220 230 240 250 260 270
pF1KE2 ACILMGYAFHEVGGYSGLFDKYLGAATSLTVSEDPAVGNISSFCYRPRPDSYHLLRHPVT
: ::::.: :::. :: .::. : .: . ::. : : :: :..:..: :.:
CCDS58 ALTLMGYSFAAVGGMEGLKEKYFLALAS-NRSEN-------SSCGLPREDAFHIFRDPLT
160 170 180 190 200
280 290 300 310 320 330
pF1KE2 GDLPWPALLLGLTIVSGWYWCSDQVIVQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMP
.:::::..:.:..: : ::::.::::::: ::.:.:.: :.: .. .:::. :.:.::.:
CCDS58 SDLPWPGVLFGMSIPSLWYWCTDQVIVQRTLAAKNLSHAKGGALMAAYLKVLPLFIMVFP
210 220 230 240 250 260
340 350 360 370 380 390
pF1KE2 GMISRILYPDEVACVVPEVCRRVCGTEVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALM
::.::::.::.:::. ::.:...:.. :::.::::.::..:.:.::::::.:::.::::
CCDS58 GMVSRILFPDQVACADPEICQKICSNPSGCSDIAYPKLVLELLPTGLRGLMMAVMVAALM
270 280 290 300 310 320
400 410 420 430 440 450
pF1KE2 SSLASIFNSSSTLFTMDIYTRLRPRAGDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQ
:::.:::::.::.::::....:::::...::..:::..:...:.::. :.:::::.::::
CCDS58 SSLTSIFNSASTIFTMDLWNHLRPRASEKELMIVGRVFVLLLVLVSILWIPVVQASQGGQ
330 340 350 360 370 380
460 470 480 490 500 510
pF1KE2 LFDYIQAVSSYLAPPVSAVFVLALFVPRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSC
:: :::..:::: :::..::... : :.::.:::::::.:::.::.::. .: . . :
CCDS58 LFIYIQSISSYLQPPVAVVFIMGCFWKRTNEKGAFWGLISGLLLGLVRLVLDFIYVQPRC
390 400 410 420 430 440
520 530 540 550 560 570
pF1KE2 VQPSACPAFLCGVHYLYFAIVLFFCSGLLTLTVSLCTAPIPRKHLHRLVFSLRHSKEERE
::. :... ..:::::...: . . . ::: : : .. . .:.. ::. ..
CCDS58 DQPDERPVLVKSIHYLYFSMILSTVTLITVSTVSWFTEPPSKEMVSHLTWFTRHDPVVQK
450 460 470 480 490 500
580 590 600 610
pF1KE2 DLDADEQQGSSLPV-QNGCPESA------MEMNEPQA---------PAPSLFRQCLLWFC
. .: :: . ::: ::.. .:: . .. : : . .::.:
CCDS58 E-QAPPAAPLSLTLSQNGMPEASSSSSVQFEMVQENTSKTHSCDMTPKQSKVVKAILWLC
510 520 530 540 550 560
620 630 640 650 660 670
pF1KE2 GMSRGGVGSPPPLTQEEAAAAARRLEDISEDPSWARVVNLNALLMMAVAVFLWGFYA
:... : .: : : . .. :.: ....: .. .. :.:.::..:
CCDS58 GIQEKG-------KEELPARAEAIIVSLEENPLVKTLLDVNLIFCVSCAIFIWGYFA
570 580 590 600 610
672 residues in 1 query sequences
18921897 residues in 33420 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Dec 9 23:15:36 2018 done: Sun Dec 9 23:15:36 2018
Total Scan time: 1.710 Total Display time: 0.160
Function used was FASTA [36.3.4 Apr, 2011]