FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB8725, 664 aa
1>>>pF1KB8725 664 - 664 aa - 664 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.3977+/-0.00116; mu= 19.3503+/- 0.069
mean_var=77.4402+/-16.254, 0's: 0 Z-trim(102.8): 34 B-trim: 0 in 0/48
Lambda= 0.145744
statistics sampled from 7086 (7109) to 7086 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.558), E-opt: 0.2 (0.218), width: 16
Scan time: 3.450
The best scores are: opt bits E(32554)
CCDS13902.1 SLC5A1 gene_id:6523|Hs108|chr22 ( 664) 4379 931.1 0
CCDS58805.1 SLC5A1 gene_id:6523|Hs108|chr22 ( 537) 3541 754.8 7e-218
CCDS13903.1 SLC5A4 gene_id:6527|Hs108|chr22 ( 659) 3222 687.8 1.3e-197
CCDS10714.1 SLC5A2 gene_id:6524|Hs108|chr16 ( 672) 2809 601.0 1.8e-171
CCDS30709.2 SLC5A9 gene_id:200010|Hs108|chr1 ( 681) 2416 518.3 1.4e-146
CCDS10625.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 675) 2260 485.5 1e-136
CCDS42275.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 596) 2235 480.2 3.5e-135
CCDS58439.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 611) 2110 454.0 2.9e-127
CCDS33549.1 SLC5A3 gene_id:6526|Hs108|chr21 ( 718) 2109 453.8 3.8e-127
CCDS44136.1 SLC5A9 gene_id:200010|Hs108|chr1 ( 706) 2006 432.1 1.2e-120
CCDS58438.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 605) 1679 363.3 5.5e-100
CCDS58437.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 640) 1663 360.0 5.9e-99
CCDS59278.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 569) 1418 308.4 1.7e-83
CCDS59277.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 560) 1317 287.2 4.2e-77
CCDS11201.2 SLC5A10 gene_id:125206|Hs108|chr17 ( 612) 924 204.6 3.4e-52
CCDS58440.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 519) 714 160.4 5.9e-39
CCDS74008.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 566) 589 134.1 5.1e-31
CCDS12368.1 SLC5A5 gene_id:6528|Hs108|chr19 ( 643) 286 70.5 8.6e-12
CCDS7860.2 SLC5A12 gene_id:159963|Hs108|chr11 ( 618) 281 69.4 1.7e-11
>>CCDS13902.1 SLC5A1 gene_id:6523|Hs108|chr22 (664 aa)
initn: 4379 init1: 4379 opt: 4379 Z-score: 4976.1 bits: 931.1 E(32554): 0
Smith-Waterman score: 4379; 100.0% identity (100.0% similar) in 664 aa overlap (1-664:1-664)
10 20 30 40 50 60
pF1KB8 MDSSTWSPKTTAVTRPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MDSSTWSPKTTAVTRPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFFL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 AGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPIY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 AGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPIY
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 IKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 IKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYLA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB8 IFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKAI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 IFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKAI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB8 PTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTDQVIVQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 PTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTDQVIVQR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB8 CLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKYCGTKVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 CLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKYCGTKVG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB8 CTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVRKRASEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 CTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVRKRASEK
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB8 ELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLAIFWKRV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 ELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLAIFWKRV
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB8 NEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILFAISFIT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 NEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILFAISFIT
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB8 IVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEEENIQEGPKETIEIETQVPEKKKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 IVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEEENIQEGPKETIEIETQVPEKKKG
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB8 IFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSEKPLWRTVLNVNGIILVTVAVFCH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 IFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSEKPLWRTVLNVNGIILVTVAVFCH
610 620 630 640 650 660
pF1KB8 AYFA
::::
CCDS13 AYFA
>>CCDS58805.1 SLC5A1 gene_id:6523|Hs108|chr22 (537 aa)
initn: 3541 init1: 3541 opt: 3541 Z-score: 4025.2 bits: 754.8 E(32554): 7e-218
Smith-Waterman score: 3541; 100.0% identity (100.0% similar) in 537 aa overlap (128-664:1-537)
100 110 120 130 140 150
pF1KB8 IGGFEWNALVLVVVLGWLFVPIYIKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTK
::::::::::::::::::::::::::::::
CCDS58 MPEYLRKRFGGQRIQVYLSLLSLLLYIFTK
10 20 30
160 170 180 190 200 210
pF1KB8 ISADIFSGAIFINLALGLNLYLAIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 ISADIFSGAIFINLALGLNLYLAIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLI
40 50 60 70 80 90
220 230 240 250 260 270
pF1KB8 LTGFAFHEVGGYDAFMEKYMKAIPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 LTGFAFHEVGGYDAFMEKYMKAIPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWP
100 110 120 130 140 150
280 290 300 310 320 330
pF1KB8 GFIFGMSILTLWYWCTDQVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 GFIFGMSILTLWYWCTDQVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRI
160 170 180 190 200 210
340 350 360 370 380 390
pF1KB8 LYTEKIACVVPSECEKYCGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 LYTEKIACVVPSECEKYCGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSI
220 230 240 250 260 270
400 410 420 430 440 450
pF1KB8 FNSASTLFTMDIYAKVRKRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 FNSASTLFTMDIYAKVRKRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQ
280 290 300 310 320 330
460 470 480 490 500 510
pF1KB8 SITSYLGPPIAAVFLLAIFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 SITSYLGPPIAAVFLLAIFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNC
340 350 360 370 380 390
520 530 540 550 560 570
pF1KB8 PTIICGVHYLYFAIILFAISFITIVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 PTIICGVHYLYFAIILFAISFITIVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEE
400 410 420 430 440 450
580 590 600 610 620 630
pF1KB8 ENIQEGPKETIEIETQVPEKKKGIFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 ENIQEGPKETIEIETQVPEKKKGIFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSE
460 470 480 490 500 510
640 650 660
pF1KB8 KPLWRTVLNVNGIILVTVAVFCHAYFA
:::::::::::::::::::::::::::
CCDS58 KPLWRTVLNVNGIILVTVAVFCHAYFA
520 530
>>CCDS13903.1 SLC5A4 gene_id:6527|Hs108|chr22 (659 aa)
initn: 3266 init1: 2919 opt: 3222 Z-score: 3661.4 bits: 687.8 E(32554): 1.3e-197
Smith-Waterman score: 3222; 70.8% identity (90.2% similar) in 664 aa overlap (3-664:2-659)
10 20 30 40 50
pF1KB8 MDSSTWSPKTTAVT-RPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFF
.:: ::.: : : .: . ::::::::.:::::.::::::::::..:::::.::::
CCDS13 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFF
10 20 30 40 50
60 70 80 90 100 110
pF1KB8 LAGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPI
::::.:.:::.:::::::::::.:.:::::::::::.: :::.. :....:::.::::
CCDS13 LAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPI
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB8 YIKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYL
:::.::.::::::.:::::.:.:::::.:::.. . ::::::.:::::.:::::.:::
CCDS13 YIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYL
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB8 AIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKA
:::.:::.::.:: :::::.:::::::::.:::.::.:: ::::.:::::..: :::..:
CCDS13 AIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNA
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB8 IPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTDQVIVQ
:..: : :.. .:::::::::::::: .:::.::::.:::: : .::::::.:::::
CCDS13 TPSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVIVQ
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB8 RCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKYCGTKV
::: .:.:::::..::.:.::::.:::.:::::::::::::. .:::::::: :.::. :
CCDS13 RCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGVDV
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB8 GCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVRKRASE
:::: ::::.:.::::.::::::::::::::::::::::::::::::.:.:.:.::.:::
CCDS13 GCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQASE
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB8 KELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLAIFWKR
:::.::::.:.:.: .::.:::.:: .:.:::. : .::.:::::::::::.:::: ::
CCDS13 KELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFCKR
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB8 VNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILFAISFI
::: ::::::..:: .:. :::::::::::::. ::::: ::::::::::.:.:: :..
CCDS13 VNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGSML
480 490 500 510 520 530
540 550 560 570 580 590
pF1KB8 TIVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEEENIQEGPKETIE-IETQVPEKK
. . :::::::::::::::::: :::: :::::.::::.. :: :: . .: . :::.
CCDS13 VTLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEKS-QE---ETDDGVEEDYPEKS
540 550 560 570 580 590
600 610 620 630 640 650
pF1KB8 KGIFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSEKPLWRTVLNVNGIILVTVAVF
.: ...:::::::: :.: ::.:.:::.:.. :.:::::.: :::..:.:.:.:..:.::
CCDS13 RGCLKKAYDLFCGL-QKG-PKLTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVVF
600 610 620 630 640 650
660
pF1KB8 CHAYFA
:.:.:
CCDS13 IHGYYA
>>CCDS10714.1 SLC5A2 gene_id:6524|Hs108|chr16 (672 aa)
initn: 2712 init1: 1600 opt: 2809 Z-score: 3192.0 bits: 601.0 E(32554): 1.8e-171
Smith-Waterman score: 2809; 60.4% identity (85.6% similar) in 659 aa overlap (22-664:19-672)
10 20 30 40 50 60
pF1KB8 MDSSTWSPKTTAVTRPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFFL
:: : ::: .:. ::..:..::::.: ::::::::.::
CCDS10 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFL
10 20 30 40 50
70 80 90 100 110 120
pF1KB8 AGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPIY
:::::::::.:::::::::::::::::::::::::.:..::::::: .:..:::::.:.:
CCDS10 AGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVY
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB8 IKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYLA
. :::.:::.::::::::.::..:::.:::.::::::::.:.::::.::. ::: :.: .
CCDS10 LTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYAS
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB8 IFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKAI
.. ::.:: .::.::::::..::::.:: ..: :. :: :.::::::::.....::. :
CCDS10 VIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAA
180 190 200 210 220 230
250 260 270 280 290
pF1KB8 PTI-VSD----GN-TTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTD
.. ::. :: ..: :: :: ::.:..: :.:::::::....:..:.. ::::.:
CCDS10 TSLTVSEDPAVGNISSF---CYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSD
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB8 QVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKY
::::::::..:...:.:.:::::::::: :::.:::::::::::: ...::::: :..
CCDS10 QVIVQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRV
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB8 CGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVR
:::.:::.::::: :::.:::::::::::.::::.:::::.:::::.:::::::::...:
CCDS10 CGTEVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMDIYTRLR
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB8 KRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLA
::...::...:::... .. .:.::.:.::.::.::::::::...:::.::..:::.::
CCDS10 PRAGDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAVFVLA
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB8 IFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILF
.: :::: ::::::: :::.:..:.: ::..:.:::..:: ::...::::::::::.::
CCDS10 LFVPRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFAIVLF
480 490 500 510 520 530
540 550 560 570 580
pF1KB8 AISFITIVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEEEN-----IQEG-PKETI
: . ...:: : ::: ::.:: .:::.::::: ::::.:.. .:.: :. ..
CCDS10 FCSGLLTLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLPVQNGCPESAM
540 550 560 570 580 590
590 600 610 620 630 640
pF1KB8 EI-ETQVPEKKKGIFRRAYDLFCGLEQHGA---PKMTEEEEKAMKMKMTDTSEKPLWRTV
:. : :.: . .::. :::. . :. : .:.:: : .. : :: : : :
CCDS10 EMNEPQAPAPS--LFRQCLLWFCGMSRGGVGSPPPLTQEEAAAAARRLEDISEDPSWARV
600 610 620 630 640 650
650 660
pF1KB8 LNVNGIILVTVAVFCHAYFA
.:.:......:::: ...:
CCDS10 VNLNALLMMAVAVFLWGFYA
660 670
>>CCDS30709.2 SLC5A9 gene_id:200010|Hs108|chr1 (681 aa)
initn: 2563 init1: 1409 opt: 2416 Z-score: 2745.3 bits: 518.3 E(32554): 1.4e-146
Smith-Waterman score: 2541; 56.2% identity (82.3% similar) in 655 aa overlap (25-664:34-681)
10 20 30 40 50
pF1KB8 MDSSTWSPKTTAVTRPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGT
.: :::..::::: :.:::.:. . ..:::
CCDS30 ELAAMGPGASGDGVRTETAPHIALDSRVGLHAYDISVVVIYFVFVIAVGIWSSIRASRGT
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB8 VGGFFLAGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGW
.::.::::::: ::::::::..::.::: :.::::::::.:.:.::::::: :...:::
CCDS30 IGGYFLAGRSMSWWPIGASLMSSNVGSGLFIGLAGTGAAGGLAVGGFEWNATWLLLALGW
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB8 LFVPIYIKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALG
.:::.:: :::::::.::.:::::::::::.:.:::.::::::::.::::::.::..:::
CCDS30 VFVPVYIAAGVVTMPQYLKKRFGGQRIQVYMSVLSLILYIFTKISTDIFSGALFIQMALG
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB8 LNLYLAIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFME
::::. .::..::.:::.::: ::::::.::::::. :.:.: ..:..:: : .. .
CCDS30 WNLYLSTGILLVVTAVYTIAGGLMAVIYTDALQTVIMVGGALVLMFLGFQDVGWYPGLEQ
190 200 210 220 230 240
240 250 260 270 280 290
pF1KB8 KYMKAIPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTD
.: .:::. :. ::: :. :: :.:::.:::..::.::::.:::...:. : ::::
CCDS30 RYRQAIPN-VTVPNTT----CHLPRPDAFHILRDPVSGDIPWPGLIFGLTVLATWCWCTD
250 260 270 280 290
300 310 320 330 340 350
pF1KB8 QVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKY
:::::: ::::..::.::: .: ::::..:::..:::::::: :. ....:: :. :..
CCDS30 QVIVQRSLSAKSLSHAKGGSVLGGYLKILPMFFIVMPGMISRALFPDEVGCVDPDVCQRI
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB8 CGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVR
::..:::.::::: ::. ::: ::::::..:..:.:::::::::::.:::::.:.. . :
CCDS30 CGARVGCSNIAYPKLVMALMPVGLRGLMIAVIMAALMSSLTSIFNSSSTLFTIDVWQRFR
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB8 KRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLA
....:.:::..::.:.. :. ::: :.::.::..:::::::::..::::.:::.:.::::
CCDS30 RKSTEQELMVVGRVFVVFLVVISILWIPIIQSSNSGQLFDYIQAVTSYLAPPITALFLLA
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB8 IFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILF
:: :::.::::::::..:: .:. ::: ::.: . .: : . :... :::::::.:
CCDS30 IFCKRVTEPGAFWGLVFGLGVGLLRMILEFSYPAPACGEVDRRPAVLKDFHYLYFAILLC
480 490 500 510 520 530
540 550 560 570 580
pF1KB8 AISFITIVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEEEN--IQEGPK-------
... :.::..:: : :::. .: :: : :: ... .:.: . :.: :
CCDS30 GLTAIVIVIVSLCTTPIPEEQLTRLTWWTRNCPLSELEKEAHESTPEISERPAGECPAGG
540 550 560 570 580 590
590 600 610 620 630
pF1KB8 ---ETIEIETQVPEK-KKGIFRRAYDLFCGLEQHGAPK--MTEEEEKAMKMKMTDTSEKP
:. . . :: ... . .. :::: :.:. .. :. :...:.:. :.:
CCDS30 GAAENSSLGQEQPEAPSRSWGKLLWSWFCGL--SGTPEQALSPAEKAALEQKLTSIEEEP
600 610 620 630 640 650
640 650 660
pF1KB8 LWRTVLNVNGIILVTVAVFCHAYFA
::: : :.:...:... .: .:::
CCDS30 LWRHVCNINAVLLLAINIFLWGYFA
660 670 680
>>CCDS10625.1 SLC5A11 gene_id:115584|Hs108|chr16 (675 aa)
initn: 2309 init1: 1338 opt: 2260 Z-score: 2568.1 bits: 485.5 E(32554): 1e-136
Smith-Waterman score: 2322; 50.5% identity (78.6% similar) in 687 aa overlap (1-664:1-675)
10 20 30 40 50
pF1KB8 MDSSTWSPKTTAVTRPVETH-ELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFF
:.:.: ::. . :... . . .::...:.::. :.:::::. .:.: :: :.:
CCDS10 MESGTSSPQPPQLD-PLDAFPQKGLEPGDIAVLVLYFLFVLAVGLWSTVKTKRDTVKGYF
10 20 30 40 50
60 70 80 90 100 110
pF1KB8 LAGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPI
::: .:::::.::::::::.:::::.::::.:::.::.....: :.: :..:.:.:.::
CCDS10 LAGGDMVWWPVGASLFASNVGSGHFIGLAGSGAATGISVSAYELNGLFSVLMLAWIFLPI
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB8 YIKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYL
:: . :.:::::::::::: :: . :..: :..:::::::.:...:::::. .: :.:::
CCDS10 YIAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYIFTKISVDMYAGAIFIQQSLHLDLYL
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB8 AIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKA
:: ::::::.::..::::::::::.:::.:::.:.: : :..: :::.... :::. :
CCDS10 AIVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIGALTLMGYSFAAVGGMEGLKEKYFLA
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB8 IPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTDQVIVQ
. . :.... : :: :.:::::::::.:::::: .::::: .::::::::::::
CCDS10 LASNRSENSS-----CGLPREDAFHIFRDPLTSDLPWPGVLFGMSIPSLWYWCTDQVIVQ
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB8 RCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKYCGTKV
: :.:::.::.::: .. .:::..:.::::.:::.::::. ...::. : :.: :..
CCDS10 RTLAAKNLSHAKGGALMAAYLKVLPLFIMVFPGMVSRILFPDQVACADPEICQKICSNPS
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB8 GCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVRKRASE
::..:::: ::.::.:.::::::..::.:.::::::::::::::.::::.. ..: ::::
CCDS10 GCSDIAYPKLVLELLPTGLRGLMMAVMVAALMSSLTSIFNSASTIFTMDLWNHLRPRASE
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB8 KELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLAIFWKR
:::::.::.:.:.:. .:: :.:.::..:.:::: :::::.::: ::.:.::... ::::
CCDS10 KELMIVGRVFVLLLVLVSILWIPVVQASQGGQLFIYIQSISSYLQPPVAVVFIMGCFWKR
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB8 VNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILFAISFI
.:: ::::::: :::.:. :.. .: : : .:.. :... ..:::::..:: ....:
CCDS10 TNEKGAFWGLISGLLLGLVRLVLDFIYVQPRCDQPDERPVLVKSIHYLYFSMILSTVTLI
480 490 500 510 520 530
540 550 560 570 580
pF1KB8 TIVVISLLTKPIPDVHLYRLCWSLRNS----KEER-----IDLDAEEENIQEGPKET-IE
:. ..: .:.: . .: : :.. ::. ..: .... :. . . ..
CCDS10 TVSTVSWFTEPPSKEMVSHLTWFTRHDPVVQKEQAPPAAPLSLTLSQNGMPEASSSSSVQ
540 550 560 570 580 590
590 600 610 620 630
pF1KB8 IET------------QVPEKKKGIFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSE
.: ..:...: . .: .::....: .. . : . .. :
CCDS10 FEMVQENTSKTHSCDMTPKQSKVV--KAILWLCGIQEKGKEELPARAEAII----VSLEE
600 610 620 630 640
640 650 660
pF1KB8 KPLWRTVLNVNGIILVTVAVFCHAYFA
.:: .:.:.:: :. :. :.: .:::
CCDS10 NPLVKTLLDVNLIFCVSCAIFIWGYFA
650 660 670
>>CCDS42275.1 SLC5A10 gene_id:125206|Hs108|chr17 (596 aa)
initn: 2225 init1: 1329 opt: 2235 Z-score: 2540.4 bits: 480.2 E(32554): 3.5e-135
Smith-Waterman score: 2235; 57.9% identity (86.0% similar) in 537 aa overlap (25-561:17-548)
10 20 30 40 50 60
pF1KB8 MDSSTWSPKTTAVTRPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFFL
..::: .:..::.. .:::.:. ..:.::.:.::
CCDS42 MAANSTSDLHTPGTQLSVADIIVITVYFALNVAVGIWSSCRASRNTVNGYFL
10 20 30 40 50
70 80 90 100 110 120
pF1KB8 AGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPIY
:::.:.:::::::::::. ::: :.::::.:::.:.:..:::::: ....:.:.:::::
CCDS42 AGRDMTWWPIGASLFASSEGSGLFIGLAGSGAAGGLAVAGFEWNATYVLLALAWVFVPIY
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB8 IKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYLA
:.. .::.:::..::.:::::..:::.::::: .::::: :...::.:... :: :.::.
CCDS42 ISSEIVTLPEYIQKRYGGQRIRMYLSVLSLLLSVFTKISLDLYAGALFVHICLGWNFYLS
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB8 IFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKAI
.: :.:::::::.::::::::::.:::.::.::..::: :: ..::: . : .::
CCDS42 TILTLGITALYTIAGGLAAVIYTDALQTLIMVVGAVILTIKAFDQIGGYGQLEAAYAQAI
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB8 PTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTDQVIVQR
:. . .::: :. ::.:..:.:::: :::::: :. ::..:.. ::::::::::::
CCDS42 PS-RTIANTT----CHLPRTDAMHMFRDPHTGDLPWTGMTFGLTIMATWYWCTDQVIVQR
240 250 260 270 280
310 320 330 340 350 360
pF1KB8 CLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKYCGTKVG
:::....:.:.: :: .:::..:: ...::::::: :. . ..::::::: . ::..::
CCDS42 SLSARDLNHAKAGSILASYLKMLPMGLIIMPGMISRALFPDDVGCVVPSECLRACGAEVG
290 300 310 320 330 340
370 380 390 400 410 420
pF1KB8 CTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVRKRASEK
:.::::: ::.:::: ::::::..::::.:::::::::::.::::::::. ..: :..:.
CCDS42 CSNIAYPKLVMELMPIGLRGLMIAVMLAALMSSLTSIFNSSSTLFTMDIWRRLRPRSGER
350 360 370 380 390 400
430 440 450 460 470 480
pF1KB8 ELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLAIFWKRV
::...::: :..:::.:.::.:..:...::::: :.::.:: :.::..:::.:..::.:.
CCDS42 ELLLVGRLVIVALIGVSVAWIPVLQDSNSGQLFIYMQSVTSSLAPPVTAVFVLGVFWRRA
410 420 430 440 450 460
490 500 510 520 530 540
pF1KB8 NEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILFAISFIT
:: ::::::: ::..: .:.. :: . : ::.. :... ..:::.::. :::.: .
CCDS42 NEQGAFWGLIAGLVVGATRLVLEFLNPAPPCGEPDTRPAVLGSIHYLHFAVALFALSGAV
470 480 490 500 510 520
550 560 570 580 590 600
pF1KB8 IVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEEENIQEGPKETIEIETQVPEKKKG
.:. :::: : .:.. : :
CCDS42 VVAGSLLTPPPQSVQIENLTWWTLAQDVPLGTKAGDGQTPQKHAFWARVCGFNAILLMCV
530 540 550 560 570 580
>>CCDS58439.1 SLC5A11 gene_id:115584|Hs108|chr16 (611 aa)
initn: 2167 init1: 1338 opt: 2110 Z-score: 2398.2 bits: 454.0 E(32554): 2.9e-127
Smith-Waterman score: 2172; 51.6% identity (79.1% similar) in 622 aa overlap (65-664:1-611)
40 50 60 70 80 90
pF1KB8 YFVVVMAVGLWAMFSTNRGTVGGFFLAGRSMVWWPIGASLFASNIGSGHFVGLAGTGAAS
:::::.::::::::.:::::.::::.:::.
CCDS58 MVWWPVGASLFASNVGSGHFIGLAGSGAAT
10 20 30
100 110 120 130 140 150
pF1KB8 GIAIGGFEWNALVLVVVLGWLFVPIYIKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYI
::.....: :.: :..:.:.:.:::: . :.:::::::::::: :: . :..: :..::
CCDS58 GISVSAYELNGLFSVLMLAWIFLPIYIAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYI
40 50 60 70 80 90
160 170 180 190 200 210
pF1KB8 FTKISADIFSGAIFINLALGLNLYLAIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVG
:::::.:...:::::. .: :.::::: ::::::.::..::::::::::.:::.:::.:
CCDS58 FTKISVDMYAGAIFIQQSLHLDLYLAIVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIG
100 110 120 130 140 150
220 230 240 250 260 270
pF1KB8 SLILTGFAFHEVGGYDAFMEKYMKAIPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDL
.: : :..: :::.... :::. :. . : . . .: :: :.:::::::::.::
CCDS58 ALTLMGYSFAAVGGMEGLKEKYFLALAS-----NRSENSSCGLPREDAFHIFRDPLTSDL
160 170 180 190 200
280 290 300 310 320 330
pF1KB8 PWPGFIFGMSILTLWYWCTDQVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMI
:::: .::::: .::::::::::::: :.:::.::.::: .. .:::..:.::::.:::.
CCDS58 PWPGVLFGMSIPSLWYWCTDQVIVQRTLAAKNLSHAKGGALMAAYLKVLPLFIMVFPGMV
210 220 230 240 250 260
340 350 360 370 380 390
pF1KB8 SRILYTEKIACVVPSECEKYCGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSL
::::. ...::. : :.: :.. ::..:::: ::.::.:.::::::..::.:.:::::
CCDS58 SRILFPDQVACADPEICQKICSNPSGCSDIAYPKLVLELLPTGLRGLMMAVMVAALMSSL
270 280 290 300 310 320
400 410 420 430 440 450
pF1KB8 TSIFNSASTLFTMDIYAKVRKRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFD
:::::::::.::::.. ..: :::::::::.::.:.:.:. .:: :.:.::..:.::::
CCDS58 TSIFNSASTIFTMDLWNHLRPRASEKELMIVGRVFVLLLVLVSILWIPVVQASQGGQLFI
330 340 350 360 370 380
460 470 480 490 500 510
pF1KB8 YIQSITSYLGPPIAAVFLLAIFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEP
:::::.::: ::.:.::... ::::.:: ::::::: :::.:. :.. .: : : .:
CCDS58 YIQSISSYLQPPVAVVFIMGCFWKRTNEKGAFWGLISGLLLGLVRLVLDFIYVQPRCDQP
390 400 410 420 430 440
520 530 540 550 560 570
pF1KB8 SNCPTIICGVHYLYFAIILFAISFITIVVISLLTKPIPDVHLYRLCWSLRNS----KEER
.. :... ..:::::..:: ....::. ..: .:.: . .: : :.. ::.
CCDS58 DERPVLVKSIHYLYFSMILSTVTLITVSTVSWFTEPPSKEMVSHLTWFTRHDPVVQKEQA
450 460 470 480 490 500
580 590 600 610
pF1KB8 -----IDLDAEEENIQEGPKET-IEIET------------QVPEKKKGIFRRAYDLFCGL
..: .... :. . . ...: ..:...: . .: .::.
CCDS58 PPAAPLSLTLSQNGMPEASSSSSVQFEMVQENTSKTHSCDMTPKQSKVV--KAILWLCGI
510 520 530 540 550 560
620 630 640 650 660
pF1KB8 EQHGAPKMTEEEEKAMKMKMTDTSEKPLWRTVLNVNGIILVTVAVFCHAYFA
...: .. . : . .. :.:: .:.:.:: :. :. :.: .:::
CCDS58 QEKGKEELPARAEAII----VSLEENPLVKTLLDVNLIFCVSCAIFIWGYFA
570 580 590 600 610
>>CCDS33549.1 SLC5A3 gene_id:6526|Hs108|chr21 (718 aa)
initn: 2065 init1: 1159 opt: 2109 Z-score: 2396.1 bits: 453.8 E(32554): 3.8e-127
Smith-Waterman score: 2115; 50.6% identity (78.5% similar) in 615 aa overlap (23-618:4-615)
10 20 30 40 50 60
pF1KB8 MDSSTWSPKTTAVTRPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFFL
. ..:::.:...::..:: .:..::...::.::.:.::
CCDS33 MRAVLDTADIAIVALYFILVMCIGFFAMWKSNRSTVSGYFL
10 20 30 40
70 80 90 100 110 120
pF1KB8 AGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPIY
:::::.: ::::::.::::: ::.::::.:::::.:.:..:.:::.:. .:::.:.:::
CCDS33 AGRSMTWVAIGASLFVSNIGSEHFIGLAGSGAASGFAVGAWEFNALLLLQLLGWVFIPIY
50 60 70 80 90 100
130 140 150 160 170 180
pF1KB8 IKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYLA
:..:: :::::: :::::.:::::.. :::.::::::.:.:..:::.::. .:: :::..
CCDS33 IRSGVYTMPEYLSKRFGGHRIQVYFAALSLILYIFTKLSVDLYSGALFIQESLGWNLYVS
110 120 130 140 150 160
190 200 210 220 230 240
pF1KB8 IFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKAI
..::...::: :.::::.:::::::::...:..:.: : ... :.::.. ..:: :
CCDS33 VILLIGMTALLTVTGGLVAVIYTDTLQALLMIIGALTLMIISIMEIGGFEEVKRRYMLAS
170 180 190 200 210 220
250 260 270 280 290
pF1KB8 PTIVS---DGNTTFQEKC-YTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTDQV
: ..: : . ..: .:. ......:.: :.::::::.:.. ..::::.:::
CCDS33 PDVTSILLTYNLSNTNSCNVSPKKEALKMLRNPTDEDVPWPGFILGQTPASVWYWCADQV
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB8 IVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKYCG
:::: :.:::..:.::. .. :.:::.::::.:.::::::::.:. :::. : .: ::
CCDS33 IVQRVLAAKNIAHAKGSTLMAGFLKLLPMFIIVVPGMISRILFTDDIACINPEHCMLVCG
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB8 TKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVRKR
...::.::::: ::..:.: ::::::..::.:.:::.: ::::::::.::.:.: .::
CCDS33 SRAGCSNIAYPRLVMKLVPVGLRGLMMAVMIAALMSDLDSIFNSASTIFTLDVYKLIRKS
350 360 370 380 390 400
420 430 440 450 460 470
pF1KB8 ASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLAIF
:: .::::.::.:. .. ::::::::. :.::.. ::: ...:: ::.::.::::::
CCDS33 ASSRELMIVGRIFVAFMVVISIAWVPIIVEMQGGQMYLYIQEVADYLTPPVAALFLLAIF
410 420 430 440 450 460
480 490 500 510 520 530
pF1KB8 WKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILFAI
::: :: :::.: . :...: :.: ::: . : .:.: : .: .::.: : :: .
CCDS33 WKRCNEQGAFYGGMAGFVLGAVRLILAFAYRAPECDQPDNRPGFIKDIHYMYVATGLFWV
470 480 490 500 510 520
540 550 560 570 580
pF1KB8 SFITIVVISLLTKPIPDVHLYRLC--WSLRN--------SKEERIDLDAEEENIQEGPKE
. . :..:::: : : . : :: .: ::: . .:..: . ..
CCDS33 TGLITVIVSLLTPP-PTKEQIRTTTFWSKKNLVVKENCSPKEEPYKM--QEKSILRCSEN
530 540 550 560 570
590 600 610 620 630 640
pF1KB8 TIEIETQVPEKK-----KGIFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSEKPLW
. :. .:. : ::. . .:. ...: :
CCDS33 NETINHIIPNGKSEDSIKGLQPEDVNLLVTCREEGNPVASLGHSEAETPVDAYSNGQAAL
580 590 600 610 620 630
650 660
pF1KB8 RTVLNVNGIILVTVAVFCHAYFA
CCDS33 MGEKERKKETDDGGRYWKFIDWFCGFKSKSLSKRSLRDLMEEEAVCLQMLEETRQVKVIL
640 650 660 670 680 690
>>CCDS44136.1 SLC5A9 gene_id:200010|Hs108|chr1 (706 aa)
initn: 2549 init1: 1409 opt: 2006 Z-score: 2279.2 bits: 432.1 E(32554): 1.2e-120
Smith-Waterman score: 2481; 54.1% identity (79.3% similar) in 680 aa overlap (25-664:34-706)
10 20 30 40 50
pF1KB8 MDSSTWSPKTTAVTRPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGT
.: :::..::::: :.:::.:. . ..:::
CCDS44 ELAAMGPGASGDGVRTETAPHIALDSRVGLHAYDISVVVIYFVFVIAVGIWSSIRASRGT
10 20 30 40 50 60
60 70 80 90 100
pF1KB8 VGGFFLAGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWN----------
.::.::::::: ::::::::..::.::: :.::::::::.:.:.::::::
CCDS44 IGGYFLAGRSMSWWPIGASLMSSNVGSGLFIGLAGTGAAGGLAVGGFEWNMRKSRSGGDR
70 80 90 100 110 120
110 120 130 140
pF1KB8 ---------------ALVLVVVLGWLFVPIYIKAGVVTMPEYLRKRFGGQRIQVYLSLLS
: :...:::.:::.:: :::::::.::.:::::::::::.:.::
CCDS44 GIHPRSHGRTGVRSQATWLLLALGWVFVPVYIAAGVVTMPQYLKKRFGGQRIQVYMSVLS
130 140 150 160 170 180
150 160 170 180 190 200
pF1KB8 LLLYIFTKISADIFSGAIFINLALGLNLYLAIFLLLAITALYTITGGLAAVIYTDTLQTV
:.::::::::.::::::.::..::: ::::. .::..::.:::.::: ::::::.::::
CCDS44 LILYIFTKISTDIFSGALFIQMALGWNLYLSTGILLVVTAVYTIAGGLMAVIYTDALQTV
190 200 210 220 230 240
210 220 230 240 250 260
pF1KB8 IMLVGSLILTGFAFHEVGGYDAFMEKYMKAIPTIVSDGNTTFQEKCYTPRADSFHIFRDP
::. :.:.: ..:..:: : .. ..: .:::. :. ::: :. :: :.:::.:::
CCDS44 IMVGGALVLMFLGFQDVGWYPGLEQRYRQAIPN-VTVPNTT----CHLPRPDAFHILRDP
250 260 270 280 290
270 280 290 300 310 320
pF1KB8 LTGDLPWPGFIFGMSILTLWYWCTDQVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMV
..::.::::.:::...:. : :::::::::: ::::..::.::: .: ::::..:::..:
CCDS44 VSGDIPWPGLIFGLTVLATWCWCTDQVIVQRSLSAKSLSHAKGGSVLGGYLKILPMFFIV
300 310 320 330 340 350
330 340 350 360 370 380
pF1KB8 MPGMISRILYTEKIACVVPSECEKYCGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLAS
::::::: :. ....:: :. :.. ::..:::.::::: ::. ::: ::::::..:..:.
CCDS44 MPGMISRALFPDEVGCVDPDVCQRICGARVGCSNIAYPKLVMALMPVGLRGLMIAVIMAA
360 370 380 390 400 410
390 400 410 420 430 440
pF1KB8 LMSSLTSIFNSASTLFTMDIYAKVRKRASEKELMIAGRLFILVLIGISIAWVPIVQSAQS
:::::::::::.:::::.:.. . :....:.:::..::.:.. :. ::: :.::.::..:
CCDS44 LMSSLTSIFNSSSTLFTIDVWQRFRRKSTEQELMVVGRVFVVFLVVISILWIPIIQSSNS
420 430 440 450 460 470
450 460 470 480 490 500
pF1KB8 GQLFDYIQSITSYLGPPIAAVFLLAIFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTG
::::::::..::::.:::.:.:::::: :::.::::::::..:: .:. ::: ::.: .
CCDS44 GQLFDYIQAVTSYLAPPITALFLLAIFCKRVTEPGAFWGLVFGLGVGLLRMILEFSYPAP
480 490 500 510 520 530
510 520 530 540 550 560
pF1KB8 SCMEPSNCPTIICGVHYLYFAIILFAISFITIVVISLLTKPIPDVHLYRLCWSLRNSKEE
.: : . :... :::::::.: ... :.::..:: : :::. .: :: : ::
CCDS44 ACGEVDRRPAVLKDFHYLYFAILLCGLTAIVIVIVSLCTTPIPEEQLTRLTWWTRNCPLS
540 550 560 570 580 590
570 580 590 600 610
pF1KB8 RIDLDAEEEN--IQEGPK----------ETIEIETQVPEK-KKGIFRRAYDLFCGLEQHG
... .:.: . :.: : :. . . :: ... . .. :::: :
CCDS44 ELEKEAHESTPEISERPAGECPAGGGAAENSSLGQEQPEAPSRSWGKLLWSWFCGL--SG
600 610 620 630 640 650
620 630 640 650 660
pF1KB8 APK--MTEEEEKAMKMKMTDTSEKPLWRTVLNVNGIILVTVAVFCHAYFA
.:. .. :. :...:.:. :.:::: : :.:...:... .: .:::
CCDS44 TPEQALSPAEKAALEQKLTSIEEEPLWRHVCNINAVLLLAINIFLWGYFA
660 670 680 690 700
664 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 14:57:51 2016 done: Fri Nov 4 14:57:52 2016
Total Scan time: 3.450 Total Display time: 0.190
Function used was FASTA [36.3.4 Apr, 2011]