FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0360, 659 aa
1>>>pF1KE0360 659 - 659 aa - 659 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 4.9732+/-0.0009; mu= 21.0885+/- 0.055
mean_var=65.5911+/-13.410, 0's: 0 Z-trim(105.3): 30 B-trim: 453 in 1/50
Lambda= 0.158362
statistics sampled from 8311 (8336) to 8311 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.614), E-opt: 0.2 (0.256), width: 16
Scan time: 2.830
The best scores are: opt bits E(32554)
CCDS13903.1 SLC5A4 gene_id:6527|Hs108|chr22 ( 659) 4343 1001.6 0
CCDS13902.1 SLC5A1 gene_id:6523|Hs108|chr22 ( 664) 3222 745.5 5.6e-215
CCDS58805.1 SLC5A1 gene_id:6523|Hs108|chr22 ( 537) 2617 607.2 1.9e-173
CCDS10714.1 SLC5A2 gene_id:6524|Hs108|chr16 ( 672) 2483 576.6 3.8e-164
CCDS30709.2 SLC5A9 gene_id:200010|Hs108|chr1 ( 681) 2183 508.1 1.6e-143
CCDS10625.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 675) 2131 496.2 6.1e-140
CCDS42275.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 596) 2019 470.6 2.8e-132
CCDS58439.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 611) 1957 456.4 5.3e-128
CCDS33549.1 SLC5A3 gene_id:6526|Hs108|chr21 ( 718) 1933 451.0 2.7e-126
CCDS44136.1 SLC5A9 gene_id:200010|Hs108|chr1 ( 706) 1826 426.5 6e-119
CCDS58438.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 605) 1596 373.9 3.5e-103
CCDS58437.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 640) 1576 369.4 8.7e-102
CCDS59278.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 569) 1276 300.8 3.4e-81
CCDS59277.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 560) 1208 285.3 1.6e-76
CCDS11201.2 SLC5A10 gene_id:125206|Hs108|chr17 ( 612) 1207 285.1 2e-76
CCDS58440.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 519) 656 159.1 1.4e-38
CCDS74008.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 566) 511 126.0 1.4e-28
CCDS7860.2 SLC5A12 gene_id:159963|Hs108|chr11 ( 618) 307 79.5 1.6e-14
CCDS12368.1 SLC5A5 gene_id:6528|Hs108|chr19 ( 643) 300 77.9 5e-14
CCDS1740.1 SLC5A6 gene_id:8884|Hs108|chr2 ( 635) 277 72.6 1.9e-12
CCDS2074.1 SLC5A7 gene_id:60482|Hs108|chr2 ( 580) 258 68.2 3.6e-11
>>CCDS13903.1 SLC5A4 gene_id:6527|Hs108|chr22 (659 aa)
initn: 4343 init1: 4343 opt: 4343 Z-score: 5357.2 bits: 1001.6 E(32554): 0
Smith-Waterman score: 4343; 100.0% identity (100.0% similar) in 659 aa overlap (1-659:1-659)
10 20 30 40 50 60
pF1KE0 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFFL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 AGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPIY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 AGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPIY
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 IKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 IKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYLA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 IFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 IFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNAT
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 PSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVIVQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 PSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVIVQR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 CLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGVDVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 CLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGVDVG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 CTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQASEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 CTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQASEK
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE0 ELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFCKRV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 ELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFCKRV
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE0 NEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGSMLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 NEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGSMLV
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE0 TLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEKSQEETDDGVEEDYPEKSRGCLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 TLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEKSQEETDDGVEEDYPEKSRGCLK
550 560 570 580 590 600
610 620 630 640 650
pF1KE0 KAYDLFCGLQKGPKLTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVVFIHGYYA
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 KAYDLFCGLQKGPKLTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVVFIHGYYA
610 620 630 640 650
>>CCDS13902.1 SLC5A1 gene_id:6523|Hs108|chr22 (664 aa)
initn: 3266 init1: 2919 opt: 3222 Z-score: 3973.0 bits: 745.5 E(32554): 5.6e-215
Smith-Waterman score: 3222; 70.4% identity (89.9% similar) in 663 aa overlap (2-659:3-664)
10 20 30 40 50
pF1KE0 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFF
.:: ::.: : : .: . ::::::::.:::::.::::::::::..:::::.::::
CCDS13 MDSSTWSPKTTAVT-RPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFF
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 LAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPI
::::.:.:::.:::::::::::.:.:::::::::::.: :::.. :....:::.::::
CCDS13 LAGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPI
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE0 YIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYL
:::.::.::::::.:::::.:.:::::.:::.. . ::::::.:::::.:::::.:::
CCDS13 YIKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYL
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE0 AIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNA
:::.:::.::.:: :::::.:::::::::.:::.::.:: ::::.:::::..: :::..:
CCDS13 AIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKA
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE0 TPSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVIVQ
:..: : :.. .:::::::::::::: .:::.::::.:::: : .::::::.:::::
CCDS13 IPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTDQVIVQ
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE0 RCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGVDV
::: .:.:::::..::.:.::::.:::.:::::::::::::. .:::::::: :.::. :
CCDS13 RCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKYCGTKV
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE0 GCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQASE
:::: ::::.:.::::.::::::::::::::::::::::::::::::.:.:.:.::.:::
CCDS13 GCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVRKRASE
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE0 KELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFCKR
:::.::::.:.:.: .::.:::.:: .:.:::. : .::.:::::::::::.:::: ::
CCDS13 KELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLAIFWKR
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE0 VNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGSML
::: ::::::..:: .:. :::::::::::::. ::::: ::::::::::.:.:: :..
CCDS13 VNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILFAISFI
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE0 VTLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEKSQEETDDG---VEEDYPEKSR
. . :::::::::::::::::: :::: :::::.::::.. .: .: . :::..
CCDS13 TIVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEEENIQEGPKETIEIETQVPEKKK
540 550 560 570 580 590
600 610 620 630 640 650
pF1KE0 GCLKKAYDLFCGL-QKG-PKLTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVVFI
: ...:::::::: :.: ::.:.:::.:.. :.:::::.: :::..:.:.:.:..:.::
CCDS13 GIFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSEKPLWRTVLNVNGIILVTVAVFC
600 610 620 630 640 650
pF1KE0 HGYYA
:.:.:
CCDS13 HAYFA
660
>>CCDS58805.1 SLC5A1 gene_id:6523|Hs108|chr22 (537 aa)
initn: 2686 init1: 2339 opt: 2617 Z-score: 3227.3 bits: 607.2 E(32554): 1.9e-173
Smith-Waterman score: 2617; 70.4% identity (89.9% similar) in 537 aa overlap (128-659:1-537)
100 110 120 130 140 150
pF1KE0 TVTFEWTSSVMLLILGWIFVPIYIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLL
:::::.:::::.:.:::::.:::.. .
CCDS58 MPEYLRKRFGGQRIQVYLSLLSLLLYIFTK
10 20 30
160 170 180 190 200 210
pF1KE0 ISADIFAGAIFIKLALGLDLYLAIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFI
::::::.:::::.:::::.::::::.:::.::.:: :::::.:::::::::.:::.::.:
CCDS58 ISADIFSGAIFINLALGLNLYLAIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLI
40 50 60 70 80 90
220 230 240 250 260 270
pF1KE0 LMGFAFNEVGGYESFTEKYVNATPSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWP
: ::::.:::::..: :::..: :..: : :.. .:::::::::::::: .:::.:::
CCDS58 LTGFAFHEVGGYDAFMEKYMKAIPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWP
100 110 120 130 140 150
280 290 300 310 320 330
pF1KE0 GIIFGMPITALWYWCTNQVIVQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRI
:.:::: : .::::::.:::::::: .:.:::::..::.:.::::.:::.::::::::::
CCDS58 GFIFGMSILTLWYWCTDQVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRI
160 170 180 190 200 210
340 350 360 370 380 390
pF1KE0 LYTDMVACVVPSECVKHCGVDVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSI
:::. .:::::::: :.::. ::::: ::::.:.::::.:::::::::::::::::::::
CCDS58 LYTEKIACVVPSECEKYCGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSI
220 230 240 250 260 270
400 410 420 430 440 450
pF1KE0 FNSASTLFTIDLYTKMRKQASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTE
:::::::::.:.:.:.::.::::::.::::.:.:.: .::.:::.:: .:.:::. : .
CCDS58 FNSASTLFTMDIYAKVRKRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQ
280 290 300 310 320 330
460 470 480 490 500 510
pF1KE0 SISSYLGPPIAAVFVLAIFCKRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNC
::.:::::::::::.:::: ::::: ::::::..:: .:. :::::::::::::. ::::
CCDS58 SITSYLGPPIAAVFLLAIFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNC
340 350 360 370 380 390
520 530 540 550 560 570
pF1KE0 PKIICGVHYLYFSIVLFFGSMLVTLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEE
: ::::::::::.:.:: :... . :::::::::::::::::: :::: :::::.::::
CCDS58 PTIICGVHYLYFAIILFAISFITIVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEE
400 410 420 430 440 450
580 590 600 610 620 630
pF1KE0 KSQEETDDG---VEEDYPEKSRGCLKKAYDLFCGL-QKG-PKLTKEEEEALSKKLTDTSE
.. .: .: . :::..: ...:::::::: :.: ::.:.:::.:.. :.:::::
CCDS58 ENIQEGPKETIEIETQVPEKKKGIFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSE
460 470 480 490 500 510
640 650
pF1KE0 RPSWRTIVNINAILLLAVVVFIHGYYA
.: :::..:.:.:.:..:.:: :.:.:
CCDS58 KPLWRTVLNVNGIILVTVAVFCHAYFA
520 530
>>CCDS10714.1 SLC5A2 gene_id:6524|Hs108|chr16 (672 aa)
initn: 2666 init1: 1531 opt: 2483 Z-score: 3060.5 bits: 576.6 E(32554): 3.8e-164
Smith-Waterman score: 2641; 56.5% identity (83.4% similar) in 662 aa overlap (14-659:11-672)
10 20 30 40 50 60
pF1KE0 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFFL
:: . : : ::: ::. :::.:..::::.: .:::::.::.::
CCDS10 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFL
10 20 30 40 50
70 80 90 100 110 120
pF1KE0 AGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPIY
:::.:.:::.:::::::::::.:.:::::::::::.:.. :::.. ..:.:::.:.:.:
CCDS10 AGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVY
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE0 IKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYLA
. .::.:::.::.:::::.:...:::.::::. . ::.:.:.::.::. ::: ..: .
CCDS10 LTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYAS
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE0 IFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNAT
.. ::..: .::.:::::...::::.::...: :. ::::.::.::::: .. .::..:.
CCDS10 VIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAA
180 190 200 210 220 230
250 260 270 280 290
pF1KE0 PSVVEGDNLT---ISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVI
:.. ... . ::. :: :: ::.:..: ::::.:::....:. :.. ::::..:::
CCDS10 TSLTVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVI
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE0 VQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGV
::::: ::...:.::.::.:.:::: :::::::::::::::: : :::::: : . ::.
CCDS10 VQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGT
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE0 DVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQA
.:::.: ::: .:..:::.:::::::.::::.:::::.:::::.:::::.:.::..: .:
CCDS10 EVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMDIYTRLRPRA
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE0 SEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFC
...:::..::..:....:::..:.:.::..:.:::. : ...::::.::..::::::.:
CCDS10 GDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAVFVLALFV
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE0 KRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGS
:::::::::::. :: ::: :.: ::..:.:::. :: :: ..::::::::.::::: :
CCDS10 PRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFAIVLFFCS
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE0 MLVTLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEK--SQEETDDG-----VEED
:.:: .:: : ::: ::.:: . ::.: ::: :.::.:. :. ...: .: .
CCDS10 GLLTLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLPVQNGCPESAMEMN
540 550 560 570 580 590
600 610 620 630 640
pF1KE0 YPEKSRGCL-KKAYDLFCGLQKG-----PKLTKEEEEALSKKLTDTSERPSWRTIVNINA
:. : .. :::...: : ::.:: : ...: : :: ::: .::.::
CCDS10 EPQAPAPSLFRQCLLWFCGMSRGGVGSPPPLTQEEAAAAARRLEDISEDPSWARVVNLNA
600 610 620 630 640 650
650
pF1KE0 ILLLAVVVFIHGYYA
.:..::.::. :.::
CCDS10 LLMMAVAVFLWGFYA
660 670
>>CCDS30709.2 SLC5A9 gene_id:200010|Hs108|chr1 (681 aa)
initn: 2336 init1: 1279 opt: 2183 Z-score: 2690.0 bits: 508.1 E(32554): 1.6e-143
Smith-Waterman score: 2337; 51.8% identity (79.7% similar) in 654 aa overlap (25-659:34-681)
10 20 30 40 50
pF1KE0 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGT
.: ::::.::::. :.:::.:. ....:::
CCDS30 ELAAMGPGASGDGVRTETAPHIALDSRVGLHAYDISVVVIYFVFVIAVGIWSSIRASRGT
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE0 IGGFFLAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGW
:::.:::::.:.:::.::::..::.::. ..::::::::.:.:. :::... .:: :::
CCDS30 IGGYFLAGRSMSWWPIGASLMSSNVGSGLFIGLAGTGAAGGLAVGGFEWNATWLLLALGW
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE0 IFVPIYIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALG
.:::.:: .::.:::.::::::::.:.:::.:.:::.. . ::.:::.::.::..:::
CCDS30 VFVPVYIAAGVVTMPQYLKKRFGGQRIQVYMSVLSLILYIFTKISTDIFSGALFIQMALG
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE0 LDLYLAIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTE
.:::. :::..::::: .::: .:::::.:::.::. :...:: ..:..:: : .. .
CCDS30 WNLYLSTGILLVVTAVYTIAGGLMAVIYTDALQTVIMVGGALVLMFLGFQDVGWYPGLEQ
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE0 KYVNATPSVVEGDNLTI-SASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCT
.: .: : :.:. ...:. :: :.:::.:: :.:::::::.:::. . : : :::
CCDS30 RYRQAIP------NVTVPNTTCHLPRPDAFHILRDPVSGDIPWPGLIFGLTVLATWCWCT
250 260 270 280 290
300 310 320 330 340 350
pF1KE0 NQVIVQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVK
.:::::: : .:..::.:.. .. .:::.::::..:::::::: :. : :.:: :. : .
CCDS30 DQVIVQRSLSAKSLSHAKGGSVLGGYLKILPMFFIVMPGMISRALFPDEVGCVDPDVCQR
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE0 HCGVDVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKM
::. :::.: ::: .:. ::: ::::::..:..:.:::::::::::.:::::::.. ..
CCDS30 ICGARVGCSNIAYPKLVMALMPVGLRGLMIAVIMAALMSSLTSIFNSSSTLFTIDVWQRF
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE0 RKQASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVL
:....:.::...::.::..:.:.::.:.:..: :..:::. : ....:::.:::.:.:.:
CCDS30 RRKSTEQELMVVGRVFVVFLVVISILWIPIIQSSNSGQLFDYIQAVTSYLAPPITALFLL
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE0 AIFCKRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVL
:::::::.: ::::::. ::..::.::: ::.: . .: . : .. :::::.:.:
CCDS30 AIFCKRVTEPGAFWGLVFGLGVGLLRMILEFSYPAPACGEVDRRPAVLKDFHYLYFAILL
480 490 500 510 520 530
540 550 560 570 580
pF1KE0 FFGSMLVTLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEKSQEETD---------
. .: . .:: : :::. .: :: : :: ... .:.:.. : ..
CCDS30 CGLTAIVIVIVSLCTTPIPEEQLTRLTWWTRNCPLSELEKEAHESTPEISERPAGECPAG
540 550 560 570 580 590
590 600 610 620 630
pF1KE0 DGVEED------YPEK-SRGCLKKAYDLFCGLQKGPK--LTKEEEEALSKKLTDTSERPS
:. :. :: ::. : .. ::::. :. :. :. :: .:::. :.:
CCDS30 GGAAENSSLGQEQPEAPSRSWGKLLWSWFCGLSGTPEQALSPAEKAALEQKLTSIEEEPL
600 610 620 630 640 650
640 650
pF1KE0 WRTIVNINAILLLAVVVFIHGYYA
:: . ::::.::::. .:. ::.:
CCDS30 WRHVCNINAVLLLAINIFLWGYFA
660 670 680
>>CCDS10625.1 SLC5A11 gene_id:115584|Hs108|chr16 (675 aa)
initn: 2089 init1: 1229 opt: 2131 Z-score: 2625.8 bits: 496.2 E(32554): 6.1e-140
Smith-Waterman score: 2185; 49.2% identity (75.6% similar) in 677 aa overlap (13-659:7-675)
10 20 30 40 50
pF1KE0 MASTVSPSTIAETPEPP---PLSDHIRNA---ADISVIVIYFLVVMAVGLWAMLKTNRGT
.:.:: ::. ... .::.:.:.::: :.:::::. .::.: :
CCDS10 MESGTSSPQPPQLDPLDAFPQKGLEPGDIAVLVLYFLFVLAVGLWSTVKTKRDT
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 IGGFFLAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGW
. :.:::: ::.:::.::::::::.::.:..::::.:::.:... ..: .. .:.:.:
CCDS10 VKGYFLAGGDMVWWPVGASLFASNVGSGHFIGLAGSGAATGISVSAYELNGLFSVLMLAW
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE0 IFVPIYIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALG
::.:::: . : ::::::.::::: :. . :..: ::: . ::.:..::::::. .:
CCDS10 IFLPIYIAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYIFTKISVDMYAGAIFIQQSLH
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE0 LDLYLAIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTE
::::::: :::.:::::..::::.:::::.:::.:::::.. :::..: :::.:.. :
CCDS10 LDLYLAIVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIGALTLMGYSFAAVGGMEGLKE
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE0 KYVNATPSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTN
:: : : : . ..:: :: :.:::::: .:.:.::::..::: : .::::::.
CCDS10 KYFLALAS-----NRSENSSCGLPREDAFHIFRDPLTSDLPWPGVLFGMSIPSLWYWCTD
240 250 260 270 280
300 310 320 330 340 350
pF1KE0 QVIVQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKH
:::::: : .:..::.:.. .: ::::.::.:.::.:::.::::. :.:::. : : :
CCDS10 QVIVQRTLAAKNLSHAKGGALMAAYLKVLPLFIMVFPGMVSRILFPDQVACADPEICQKI
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE0 CGVDVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMR
:. ::.. ::: .::::.: ::::::..::.:.::::::::::::::.::.::....:
CCDS10 CSNPSGCSDIAYPKLVLELLPTGLRGLMMAVMVAALMSSLTSIFNSASTIFTMDLWNHLR
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE0 KQASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLA
.::::::.:.::.:::::..:::.:.:.::.::.:::. : .:::::: ::.:.::...
CCDS10 PRASEKELMIVGRVFVLLLVLVSILWIPVVQASQGGQLFIYIQSISSYLQPPVAVVFIMG
410 420 430 440 450 460
480 490 500 510 520 530
pF1KE0 IFCKRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLF
: ::.::.::::::. :: .::.:.. .: : : :.. : .. ..::::::..:
CCDS10 CFWKRTNEKGAFWGLISGLLLGLVRLVLDFIYVQPRCDQPDERPVLVKSIHYLYFSMILS
470 480 490 500 510 520
540 550 560 570 580
pF1KE0 FGSMLVTLGISLLTKPIPDVHLYRLCWVLRNS--TEERIDIDAEEKSQEETDDGVEE---
..... .: .:.: . .: : :.. .... : : ...:. :
CCDS10 TVTLITVSTVSWFTEPPSKEMVSHLTWFTRHDPVVQKEQAPPAAPLSLTLSQNGMPEASS
530 540 550 560 570 580
590 600 610 620 630
pF1KE0 ----------DYPEKSRGC--------LKKAYDLFCGLQ-KGPKLTKEEEEALSKKLTDT
. :...: . :: .::.: :: . . ::. ...
CCDS10 SSSVQFEMVQENTSKTHSCDMTPKQSKVVKAILWLCGIQEKGKEELPARAEAI---IVSL
590 600 610 620 630 640
640 650
pF1KE0 SERPSWRTIVNINAILLLAVVVFIHGYYA
: : .:....: :. .. ..:: ::.:
CCDS10 EENPLVKTLLDVNLIFCVSCAIFIWGYFA
650 660 670
>>CCDS42275.1 SLC5A10 gene_id:125206|Hs108|chr17 (596 aa)
initn: 2012 init1: 1198 opt: 2019 Z-score: 2488.3 bits: 470.6 E(32554): 2.8e-132
Smith-Waterman score: 2019; 51.8% identity (82.5% similar) in 537 aa overlap (25-561:17-548)
10 20 30 40 50 60
pF1KE0 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFFL
..::: ::..:: . .:::.:. ...:.:..:.::
CCDS42 MAANSTSDLHTPGTQLSVADIIVITVYFALNVAVGIWSSCRASRNTVNGYFL
10 20 30 40 50
70 80 90 100 110 120
pF1KE0 AGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPIY
:::::.:::.:::::::. ::. ..::::.:::.:.:.. :::... .:: :.:.:::::
CCDS42 AGRDMTWWPIGASLFASSEGSGLFIGLAGSGAAGGLAVAGFEWNATYVLLALAWVFVPIY
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE0 IKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYLA
:.: ..:.:::..::.::.:...:::.:::.. : :: :..:::.:... :: ..::.
CCDS42 ISSEIVTLPEYIQKRYGGQRIRMYLSVLSLLLSVFTKISLDLYAGALFVHICLGWNFYLS
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE0 IFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNAT
.. :..::.:: .::::.:::::.:::.::..:. :: ::...::: .. :..:
CCDS42 TILTLGITALYTIAGGLAAVIYTDALQTLIMVVGAVILTIKAFDQIGGYGQLEAAYAQAI
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE0 PSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVIVQR
:: ...:. ::.:..:.::: :::.:: :. ::. : : :::::.::::::
CCDS42 PS-----RTIANTTCHLPRTDAMHMFRDPHTGDLPWTGMTFGLTIMATWYWCTDQVIVQR
240 250 260 270 280
310 320 330 340 350 360
pF1KE0 CLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGVDVG
: ..:..:.::. :. .:::.::: :..::::::: :. : :.:::::::.. ::..::
CCDS42 SLSARDLNHAKAGSILASYLKMLPMGLIIMPGMISRALFPDDVGCVVPSECLRACGAEVG
290 300 310 320 330 340
370 380 390 400 410 420
pF1KE0 CTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQASEK
:.: ::: .:.:::: ::::::..::::.:::::::::::.:::::.:.. ..: ...:.
CCDS42 CSNIAYPKLVMELMPIGLRGLMIAVMLAALMSSLTSIFNSSSTLFTMDIWRRLRPRSGER
350 360 370 380 390 400
430 440 450 460 470 480
pF1KE0 ELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFCKRV
:::..::. .. : ::..:.:..: :..:::. : .:..: :.::..:::::..: .:.
CCDS42 ELLLVGRLVIVALIGVSVAWIPVLQDSNSGQLFIYMQSVTSSLAPPVTAVFVLGVFWRRA
410 420 430 440 450 460
490 500 510 520 530 540
pF1KE0 NEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGSMLV
:::::::::..::..: :.. :: . : :.. : .. ..:::.:...:: : :
CCDS42 NEQGAFWGLIAGLVVGATRLVLEFLNPAPPCGEPDTRPAVLGSIHYLHFAVALFALSGAV
470 480 490 500 510 520
550 560 570 580 590 600
pF1KE0 TLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEKSQEETDDGVEEDYPEKSRGCLK
... :::: : .:.. : :
CCDS42 VVAGSLLTPPPQSVQIENLTWWTLAQDVPLGTKAGDGQTPQKHAFWARVCGFNAILLMCV
530 540 550 560 570 580
>>CCDS58439.1 SLC5A11 gene_id:115584|Hs108|chr16 (611 aa)
initn: 1927 init1: 1229 opt: 1957 Z-score: 2411.6 bits: 456.4 E(32554): 5.3e-128
Smith-Waterman score: 2011; 49.3% identity (75.6% similar) in 619 aa overlap (65-659:1-611)
40 50 60 70 80 90
pF1KE0 YFLVVMAVGLWAMLKTNRGTIGGFFLAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAAS
:.:::.::::::::.::.:..::::.:::.
CCDS58 MVWWPVGASLFASNVGSGHFIGLAGSGAAT
10 20 30
100 110 120 130 140 150
pF1KE0 GVATVTFEWTSSVMLLILGWIFVPIYIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICV
:... ..: .. .:.:.:::.:::: . : ::::::.::::: :. . :..: ::: .
CCDS58 GISVSAYELNGLFSVLMLAWIFLPIYIAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYI
40 50 60 70 80 90
160 170 180 190 200 210
pF1KE0 VLLISADIFAGAIFIKLALGLDLYLAIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIG
::.:..::::::. .: ::::::: :::.:::::..::::.:::::.:::.:::::
CCDS58 FTKISVDMYAGAIFIQQSLHLDLYLAIVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIG
100 110 120 130 140 150
220 230 240 250 260 270
pF1KE0 SFILMGFAFNEVGGYESFTEKYVNATPSVVEGDNLTISASCYTPRADSFHIFRDAVTGDI
.. :::..: :::.:.. ::: : : : . ..:: :: :.:::::: .:.:.
CCDS58 ALTLMGYSFAAVGGMEGLKEKYFLALAS-----NRSENSSCGLPREDAFHIFRDPLTSDL
160 170 180 190 200
280 290 300 310 320 330
pF1KE0 PWPGIIFGMPITALWYWCTNQVIVQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMI
::::..::: : .::::::.:::::: : .:..::.:.. .: ::::.::.:.::.:::.
CCDS58 PWPGVLFGMSIPSLWYWCTDQVIVQRTLAAKNLSHAKGGALMAAYLKVLPLFIMVFPGMV
210 220 230 240 250 260
340 350 360 370 380 390
pF1KE0 SRILYTDMVACVVPSECVKHCGVDVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSL
::::. :.:::. : : : :. ::.. ::: .::::.: ::::::..::.:.:::::
CCDS58 SRILFPDQVACADPEICQKICSNPSGCSDIAYPKLVLELLPTGLRGLMMAVMVAALMSSL
270 280 290 300 310 320
400 410 420 430 440 450
pF1KE0 TSIFNSASTLFTIDLYTKMRKQASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIH
:::::::::.::.::....: .::::::.:.::.:::::..:::.:.:.::.::.:::.
CCDS58 TSIFNSASTIFTMDLWNHLRPRASEKELMIVGRVFVLLLVLVSILWIPVVQASQGGQLFI
330 340 350 360 370 380
460 470 480 490 500 510
pF1KE0 YTESISSYLGPPIAAVFVLAIFCKRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAP
: .:::::: ::.:.::... : ::.::.::::::. :: .::.:.. .: : : :
CCDS58 YIQSISSYLQPPVAVVFIMGCFWKRTNEKGAFWGLISGLLLGLVRLVLDFIYVQPRCDQP
390 400 410 420 430 440
520 530 540 550 560 570
pF1KE0 SNCPKIICGVHYLYFSIVLFFGSMLVTLGISLLTKPIPDVHLYRLCWVLRNS--TEERID
.. : .. ..::::::..: ..... .: .:.: . .: : :.. ....
CCDS58 DERPVLVKSIHYLYFSMILSTVTLITVSTVSWFTEPPSKEMVSHLTWFTRHDPVVQKEQA
450 460 470 480 490 500
580 590 600 610
pF1KE0 IDAEEKSQEETDDGVEE-------------DYPEKSRGC--------LKKAYDLFCGLQ-
: : ...:. : . :...: . :: .::.:
CCDS58 PPAAPLSLTLSQNGMPEASSSSSVQFEMVQENTSKTHSCDMTPKQSKVVKAILWLCGIQE
510 520 530 540 550 560
620 630 640 650
pF1KE0 KGPKLTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVVFIHGYYA
:: . . ::. ... : : .:....: :. .. ..:: ::.:
CCDS58 KGKEELPARAEAI---IVSLEENPLVKTLLDVNLIFCVSCAIFIWGYFA
570 580 590 600 610
>>CCDS33549.1 SLC5A3 gene_id:6526|Hs108|chr21 (718 aa)
initn: 1924 init1: 1073 opt: 1933 Z-score: 2381.0 bits: 451.0 E(32554): 2.7e-126
Smith-Waterman score: 1933; 48.5% identity (80.7% similar) in 569 aa overlap (23-583:4-571)
10 20 30 40 50 60
pF1KE0 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFFL
. ..:::.....::..:: .:..:: :.::.:..:.::
CCDS33 MRAVLDTADIAIVALYFILVMCIGFFAMWKSNRSTVSGYFL
10 20 30 40
70 80 90 100 110 120
pF1KE0 AGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPIY
:::.:.: .:::::.:::::.:..::::.::::: :. ..:... ..: .:::.:.:::
CCDS33 AGRSMTWVAIGASLFVSNIGSEHFIGLAGSGAASGFAVGAWEFNALLLLQLLGWVFIPIY
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE0 IKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYLA
:.:::.::::::.:::::.:.:::.. :::.. . .:.:...::.::. .:: .::..
CCDS33 IRSGVYTMPEYLSKRFGGHRIQVYFAALSLILYIFTKLSVDLYSGALFIQESLGWNLYVS
110 120 130 140 150 160
190 200 210 220 230 240
pF1KE0 IFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNAT
...:..:::. :.::::..::::::::...:.::.. :: ... :.::.: ..:. :.
CCDS33 VILLIGMTALLTVTGGLVAVIYTDTLQALLMIIGALTLMIISIMEIGGFEEVKRRYMLAS
170 180 190 200 210 220
250 260 270 280 290
pF1KE0 P---SVVEGDNLTISASC-YTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQV
: :.. ::. . :: .:. ......:. . :.::::.:.:. ...::::..::
CCDS33 PDVTSILLTYNLSNTNSCNVSPKKEALKMLRNPTDEDVPWPGFILGQTPASVWYWCADQV
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE0 IVQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCG
:::: : .:...:.:.. .: ..:::::::..:.::::::::.:: .::. : .:. ::
CCDS33 IVQRVLAAKNIAHAKGSTLMAGFLKLLPMFIIVVPGMISRILFTDDIACINPEHCMLVCG
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE0 VDVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQ
.::.: ::: .:..:.: ::::::..::.:.:::.: ::::::::.::.:.: .::.
CCDS33 SRAGCSNIAYPRLVMKLVPVGLRGLMMAVMIAALMSDLDSIFNSASTIFTLDVYKLIRKS
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE0 ASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIF
:: .::.:.::::: ...:.::.:::.. :.::. : . ...:: ::.::.:.::::
CCDS33 ASSRELMIVGRIFVAFMVVISIAWVPIIVEMQGGQMYLYIQEVADYLTPPVAALFLLAIF
410 420 430 440 450 460
480 490 500 510 520 530
pF1KE0 CKRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFG
:: ::::::.: :.:...: .:.: ::: . : :.: : .: .::.: . ::.
CCDS33 WKRCNEQGAFYGGMAGFVLGAVRLILAFAYRAPECDQPDNRPGFIKDIHYMYVATGLFWV
470 480 490 500 510 520
540 550 560 570 580 590
pF1KE0 SMLVTLGISLLTKPIPDVHLYRLC--WVLRNSTEERIDIDAEE--KSQEETDDGVEEDYP
. :.:. .:::: : : . : : .: . .. :: : ::..
CCDS33 TGLITVIVSLLTPP-PTKEQIRTTTFWSKKNLVVKENCSPKEEPYKMQEKSILRCSENNE
530 540 550 560 570 580
600 610 620 630 640 650
pF1KE0 EKSRGCLKKAYDLFCGLQKGPKLTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVV
CCDS33 TINHIIPNGKSEDSIKGLQPEDVNLLVTCREEGNPVASLGHSEAETPVDAYSNGQAALMG
590 600 610 620 630 640
>>CCDS44136.1 SLC5A9 gene_id:200010|Hs108|chr1 (706 aa)
initn: 2323 init1: 1279 opt: 1826 Z-score: 2248.9 bits: 426.5 E(32554): 6e-119
Smith-Waterman score: 2277; 49.9% identity (76.7% similar) in 679 aa overlap (25-659:34-706)
10 20 30 40 50
pF1KE0 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGT
.: ::::.::::. :.:::.:. ....:::
CCDS44 ELAAMGPGASGDGVRTETAPHIALDSRVGLHAYDISVVVIYFVFVIAVGIWSSIRASRGT
10 20 30 40 50 60
60 70 80 90 100
pF1KE0 IGGFFLAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWT----------
:::.:::::.:.:::.::::..::.::. ..::::::::.:.:. :::.
CCDS44 IGGYFLAGRSMSWWPIGASLMSSNVGSGLFIGLAGTGAAGGLAVGGFEWNMRKSRSGGDR
70 80 90 100 110 120
110 120 130 140
pF1KE0 ---------------SSVMLLILGWIFVPIYIKSGVMTMPEYLKKRFGGERLQVYLSILS
.. .:: :::.:::.:: .::.:::.::::::::.:.:::.:.::
CCDS44 GIHPRSHGRTGVRSQATWLLLALGWVFVPVYIAAGVVTMPQYLKKRFGGQRIQVYMSVLS
130 140 150 160 170 180
150 160 170 180 190 200
pF1KE0 LFICVVLLISADIFAGAIFIKLALGLDLYLAIFILLAMTAVYTTTGGLASVIYTDTLQTI
:.. . ::.:::.::.::..::: .:::. :::..::::: .::: .:::::.:::.
CCDS44 LILYIFTKISTDIFSGALFIQMALGWNLYLSTGILLVVTAVYTIAGGLMAVIYTDALQTV
190 200 210 220 230 240
210 220 230 240 250 260
pF1KE0 IMLIGSFILMGFAFNEVGGYESFTEKYVNATPSVVEGDNLTI-SASCYTPRADSFHIFRD
::. :...:: ..:..:: : .. ..: .: : :.:. ...:. :: :.:::.::
CCDS44 IMVGGALVLMFLGFQDVGWYPGLEQRYRQAIP------NVTVPNTTCHLPRPDAFHILRD
250 260 270 280 290
270 280 290 300 310 320
pF1KE0 AVTGDIPWPGIIFGMPITALWYWCTNQVIVQRCLCGKDMSHVKAACIMCAYLKLLPMFLM
:.:::::::.:::. . : : :::.:::::: : .:..::.:.. .. .:::.::::..
CCDS44 PVSGDIPWPGLIFGLTVLATWCWCTDQVIVQRSLSAKSLSHAKGGSVLGGYLKILPMFFI
300 310 320 330 340 350
330 340 350 360 370 380
pF1KE0 VMPGMISRILYTDMVACVVPSECVKHCGVDVGCTNYAYPTMVLELMPQGLRGLMLSVMLA
:::::::: :. : :.:: :. : . ::. :::.: ::: .:. ::: ::::::..:..:
CCDS44 VMPGMISRALFPDEVGCVDPDVCQRICGARVGCSNIAYPKLVMALMPVGLRGLMIAVIMA
360 370 380 390 400 410
390 400 410 420 430 440
pF1KE0 SLMSSLTSIFNSASTLFTIDLYTKMRKQASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQ
.:::::::::::.:::::::.. ..:....:.::...::.::..:.:.::.:.:..: :.
CCDS44 ALMSSLTSIFNSSSTLFTIDVWQRFRRKSTEQELMVVGRVFVVFLVVISILWIPIIQSSN
420 430 440 450 460 470
450 460 470 480 490 500
pF1KE0 NGQLIHYTESISSYLGPPIAAVFVLAIFCKRVNEQGAFWGLMVGLAMGLIRMITEFAYGT
.:::. : ....:::.:::.:.:.::::::::.: ::::::. ::..::.::: ::.: .
CCDS44 SGQLFDYIQAVTSYLAPPITALFLLAIFCKRVTEPGAFWGLVFGLGVGLLRMILEFSYPA
480 490 500 510 520 530
510 520 530 540 550 560
pF1KE0 GSCLAPSNCPKIICGVHYLYFSIVLFFGSMLVTLGISLLTKPIPDVHLYRLCWVLRNSTE
.: . : .. :::::.:.: . .: . .:: : :::. .: :: : ::
CCDS44 PACGEVDRRPAVLKDFHYLYFAILLCGLTAIVIVIVSLCTTPIPEEQLTRLTWWTRNCPL
540 550 560 570 580 590
570 580 590 600 610
pF1KE0 ERIDIDAEEKSQEETD---------DGVEED------YPEK-SRGCLKKAYDLFCGLQKG
... .:.:.. : .. :. :. :: ::. : .. ::::.
CCDS44 SELEKEAHESTPEISERPAGECPAGGGAAENSSLGQEQPEAPSRSWGKLLWSWFCGLSGT
600 610 620 630 640 650
620 630 640 650
pF1KE0 PK--LTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVVFIHGYYA
:. :. :. :: .:::. :.: :: . ::::.::::. .:. ::.:
CCDS44 PEQALSPAEKAALEQKLTSIEEEPLWRHVCNINAVLLLAINIFLWGYFA
660 670 680 690 700
659 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 14:13:19 2016 done: Thu Nov 3 14:13:20 2016
Total Scan time: 2.830 Total Display time: 0.160
Function used was FASTA [36.3.4 Apr, 2011]