FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0214, 461 aa
1>>>pF1KE0214 461 - 461 aa - 461 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.3381+/-0.00118; mu= 17.6022+/- 0.069
mean_var=68.8745+/-14.642, 0's: 0 Z-trim(100.9): 42 B-trim: 435 in 1/48
Lambda= 0.154541
statistics sampled from 6303 (6316) to 6303 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.524), E-opt: 0.2 (0.194), width: 16
Scan time: 2.990
The best scores are: opt bits E(32554)
CCDS9332.1 SLC46A3 gene_id:283537|Hs108|chr13 ( 461) 3027 684.6 5.8e-197
CCDS45021.1 SLC46A3 gene_id:283537|Hs108|chr13 ( 463) 3027 684.6 5.9e-197
CCDS74020.1 SLC46A1 gene_id:113235|Hs108|chr17 ( 459) 665 157.9 2e-38
CCDS74019.1 SLC46A1 gene_id:113235|Hs108|chr17 ( 431) 455 111.1 2.3e-24
CCDS6786.1 SLC46A2 gene_id:57864|Hs108|chr9 ( 475) 399 98.6 1.4e-20
>>CCDS9332.1 SLC46A3 gene_id:283537|Hs108|chr13 (461 aa)
initn: 3027 init1: 3027 opt: 3027 Z-score: 3649.5 bits: 684.6 E(32554): 5.8e-197
Smith-Waterman score: 3027; 100.0% identity (100.0% similar) in 461 aa overlap (1-461:1-461)
10 20 30 40 50 60
pF1KE0 MKILFVEPAIFLSAFAMTLTGPLTTQYVYRRIWEETGNYTFSSDSNISECEKNKSSPIFA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS93 MKILFVEPAIFLSAFAMTLTGPLTTQYVYRRIWEETGNYTFSSDSNISECEKNKSSPIFA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 FQEEVQKKVSRFNLQMDISGLIPGLVSTFILLSISDHYGRKFPMILSSVGALATSVWLCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS93 FQEEVQKKVSRFNLQMDISGLIPGLVSTFILLSISDHYGRKFPMILSSVGALATSVWLCL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 LCYFAFPFQLLIASTFIGAFCGNYTTFWGACFAYIVDQCKEHKQKTIRIAIIDFLLGLVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS93 LCYFAFPFQLLIASTFIGAFCGNYTTFWGACFAYIVDQCKEHKQKTIRIAIIDFLLGLVT
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 GLTGLSSGYFIRELGFEWSFLIIAVSLAVNLIYILFFLGDPVKECSSQNVTMSCSEGFKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS93 GLTGLSSGYFIRELGFEWSFLIIAVSLAVNLIYILFFLGDPVKECSSQNVTMSCSEGFKN
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 LFYRTYMLFKNASGKRRFLLCLLLFTVITYFFVVIGIAPIFILYELDSPLCWNEVFIGYG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS93 LFYRTYMLFKNASGKRRFLLCLLLFTVITYFFVVIGIAPIFILYELDSPLCWNEVFIGYG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 SALGSASFLTSFLGIWLFSYCMEDIHMAFIGIFTTMTGMAMTAFASTTLMMFLARVPFLF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS93 SALGSASFLTSFLGIWLFSYCMEDIHMAFIGIFTTMTGMAMTAFASTTLMMFLARVPFLF
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 TIVPFSVLRSMLSKVVRSTEQGTLFACIAFLETLGGVTAVSTFNGIYSATVAWYPGFTFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS93 TIVPFSVLRSMLSKVVRSTEQGTLFACIAFLETLGGVTAVSTFNGIYSATVAWYPGFTFL
370 380 390 400 410 420
430 440 450 460
pF1KE0 LSAGLLLLPAISLCVVKCTSWNEGSYELLIQEESSEDASDR
:::::::::::::::::::::::::::::::::::::::::
CCDS93 LSAGLLLLPAISLCVVKCTSWNEGSYELLIQEESSEDASDR
430 440 450 460
>>CCDS45021.1 SLC46A3 gene_id:283537|Hs108|chr13 (463 aa)
initn: 3027 init1: 3027 opt: 3027 Z-score: 3649.5 bits: 684.6 E(32554): 5.9e-197
Smith-Waterman score: 3027; 100.0% identity (100.0% similar) in 461 aa overlap (1-461:1-461)
10 20 30 40 50 60
pF1KE0 MKILFVEPAIFLSAFAMTLTGPLTTQYVYRRIWEETGNYTFSSDSNISECEKNKSSPIFA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 MKILFVEPAIFLSAFAMTLTGPLTTQYVYRRIWEETGNYTFSSDSNISECEKNKSSPIFA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 FQEEVQKKVSRFNLQMDISGLIPGLVSTFILLSISDHYGRKFPMILSSVGALATSVWLCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 FQEEVQKKVSRFNLQMDISGLIPGLVSTFILLSISDHYGRKFPMILSSVGALATSVWLCL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 LCYFAFPFQLLIASTFIGAFCGNYTTFWGACFAYIVDQCKEHKQKTIRIAIIDFLLGLVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 LCYFAFPFQLLIASTFIGAFCGNYTTFWGACFAYIVDQCKEHKQKTIRIAIIDFLLGLVT
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 GLTGLSSGYFIRELGFEWSFLIIAVSLAVNLIYILFFLGDPVKECSSQNVTMSCSEGFKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 GLTGLSSGYFIRELGFEWSFLIIAVSLAVNLIYILFFLGDPVKECSSQNVTMSCSEGFKN
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 LFYRTYMLFKNASGKRRFLLCLLLFTVITYFFVVIGIAPIFILYELDSPLCWNEVFIGYG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 LFYRTYMLFKNASGKRRFLLCLLLFTVITYFFVVIGIAPIFILYELDSPLCWNEVFIGYG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 SALGSASFLTSFLGIWLFSYCMEDIHMAFIGIFTTMTGMAMTAFASTTLMMFLARVPFLF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 SALGSASFLTSFLGIWLFSYCMEDIHMAFIGIFTTMTGMAMTAFASTTLMMFLARVPFLF
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 TIVPFSVLRSMLSKVVRSTEQGTLFACIAFLETLGGVTAVSTFNGIYSATVAWYPGFTFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 TIVPFSVLRSMLSKVVRSTEQGTLFACIAFLETLGGVTAVSTFNGIYSATVAWYPGFTFL
370 380 390 400 410 420
430 440 450 460
pF1KE0 LSAGLLLLPAISLCVVKCTSWNEGSYELLIQEESSEDASDR
:::::::::::::::::::::::::::::::::::::::::
CCDS45 LSAGLLLLPAISLCVVKCTSWNEGSYELLIQEESSEDASDRAC
430 440 450 460
>>CCDS74020.1 SLC46A1 gene_id:113235|Hs108|chr17 (459 aa)
initn: 661 init1: 434 opt: 665 Z-score: 803.4 bits: 157.9 E(32554): 2e-38
Smith-Waterman score: 768; 34.5% identity (66.2% similar) in 432 aa overlap (6-431:25-438)
10 20 30 40
pF1KE0 MKILFVEPAIFLSAFAMTLTGPLTTQYVYRRIWEETGNYTF
::: .::. ::..: :::::::...:. . : .
CCDS74 MEGSASPPEKPRARPAAAVLCRGPVEPLVFLANFALVLQGPLTTQYLWHRFSADLG---Y
10 20 30 40 50
50 60 70 80 90 100
pF1KE0 SSDSNISECEKNKSSPIFAFQEEVQKKVSRFNLQMDISGLIPGLVSTFILLSISDHYGRK
.. . . : . ...: ..::. .:...: :...:.. :: :. .: . :: ::.
CCDS74 NGTRQRGGCSNRSADPT---MQEVETLTSHWTLYMNVGGFLVGLFSSTLLGAWSDSVGRR
60 70 80 90 100 110
110 120 130 140 150
pF1KE0 FPMILSSVGALATSVWLCLLCYFAFPFQLLIASTFIG----AFCGNYTTFWGACFAYIVD
..:.:.: : . :. :. .:: .. .: :. :.. . .: :: ..:
CCDS74 PLLVLASLGLLLQA----LVSVFVVQLQLHVGYFVLGRILCALLGDFGGLLAASFASVAD
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE0 QCKEHKQKTIRIAIIDFLLGLVTGLTGLSSGYFIRELGFEWSF-LIIAVSLAVNLIYILF
. ...:.:.:... .:.. :..: .:...: :. : : .:. .:..: : :
CCDS74 -VSSSRSRTFRMALLEASIGVAGMLASLLGGHWLRAQGYANPFWLALALLIAMTL-YAAF
180 190 200 210 220
220 230 240 250 260 270
pF1KE0 FLGDPVKECSSQNV-TMSCSEGFKNLFYRTYMLFKNASGKRRFLLCLLLFTVITYFFVVI
.:. .:: .: . :. ... .:. . : :. : : .:.::: :
CCDS74 CFGETLKEPKSTRLFTFRHHRSIVQLYVAPA---PEKSRKHLALYSLAIFVVITVHF---
230 240 250 260 270 280
280 290 300 310 320 330
pF1KE0 GIAPIFILYELDSPLCWNEVFIGYGSALGSASFLTSFLGIWLFSYCMEDIHMAFIGIFTT
: :. ::::..::::. .:::::: .:::.:.. :..::. : .: ::. .
CCDS74 GAQDILTLYELSTPLCWDSKLIGYGSAAQHLPYLTSLLALKLLQYCLADAWVAEIGLAFN
290 300 310 320 330 340
340 350 360 370 380 390
pF1KE0 MTGMAMTAFASTTLMMFLARVPFLFTIVPFSVLRSMLSKVVRSTEQGTLFACIAFLETLG
. ::.. :::. : .:: . .....: :.:. :::.:: ::::.::. .: ...:.
CCDS74 ILGMVVFAFATITPLMFTGYGLLFLSLVITPVIRAKLSKLVRETEQGALFSAVACVNSLA
350 360 370 380 390 400
400 410 420 430 440 450
pF1KE0 GVTAVSTFNGIYSATVAWYPGFTFLLSAGLLLLPAISLCVVKCTSWNEGSYELLIQEESS
.:: . ::..: ::. .. :: :::.:::::.::.
CCDS74 MLTASGIFNSLYPATLNFMKGFPFLLGAGLLLIPAVLIGMLEKADPHLEFQQFPQSP
410 420 430 440 450
460
pF1KE0 EDASDR
>>CCDS74019.1 SLC46A1 gene_id:113235|Hs108|chr17 (431 aa)
initn: 602 init1: 240 opt: 455 Z-score: 550.8 bits: 111.1 E(32554): 2.3e-24
Smith-Waterman score: 650; 32.2% identity (62.0% similar) in 432 aa overlap (6-431:25-410)
10 20 30 40
pF1KE0 MKILFVEPAIFLSAFAMTLTGPLTTQYVYRRIWEETGNYTF
::: .::. ::..: :::::::...:. . : .
CCDS74 MEGSASPPEKPRARPAAAVLCRGPVEPLVFLANFALVLQGPLTTQYLWHRFSADLG---Y
10 20 30 40 50
50 60 70 80 90 100
pF1KE0 SSDSNISECEKNKSSPIFAFQEEVQKKVSRFNLQMDISGLIPGLVSTFILLSISDHYGRK
.. . . : . ...: ..::. .:...: :...:.. :: :. .: . :: ::.
CCDS74 NGTRQRGGCSNRSADPT---MQEVETLTSHWTLYMNVGGFLVGLFSSTLLGAWSDSVGRR
60 70 80 90 100 110
110 120 130 140 150
pF1KE0 FPMILSSVGALATSVWLCLLCYFAFPFQLLIASTFIG----AFCGNYTTFWGACFAYIVD
..:.:.: : . :. :. .:: .. .: :. :.. . .: :: ..:
CCDS74 PLLVLASLGLLLQA----LVSVFVVQLQLHVGYFVLGRILCALLGDFGGLLAASFASVAD
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE0 QCKEHKQKTIRIAIIDFLLGLVTGLTGLSSGYFIRELGFEWSF-LIIAVSLAVNLIYILF
. ...:.:.:... .:.. :..: .:...: :. : : .:. .:..: : :
CCDS74 -VSSSRSRTFRMALLEASIGVAGMLASLLGGHWLRAQGYANPFWLALALLIAMTL-YAAF
180 190 200 210 220
220 230 240 250 260 270
pF1KE0 FLGDPVKECSSQNV-TMSCSEGFKNLFYRTYMLFKNASGKRRFLLCLLLFTVITYFFVVI
.:. .:: .: . :. ... .:. . : :. : : .:.::: :
CCDS74 CFGETLKEPKSTRLFTFRHHRSIVQLYVAPA---PEKSRKHLALYSLAIFVVITVHF---
230 240 250 260 270 280
280 290 300 310 320 330
pF1KE0 GIAPIFILYELDSPLCWNEVFIGYGSALGSASFLTSFLGIWLFSYCMEDIHMAFIGIFTT
: :. ::::..::::. .:::::: .:::.:.. :..::. : .: ::. .
CCDS74 GAQDILTLYELSTPLCWDSKLIGYGSAAQHLPYLTSLLALKLLQYCLADAWVAEIGLAFN
290 300 310 320 330 340
340 350 360 370 380 390
pF1KE0 MTGMAMTAFASTTLMMFLARVPFLFTIVPFSVLRSMLSKVVRSTEQGTLFACIAFLETLG
. ::.. :::. : :..:: :.::. .: ...:.
CCDS74 ILGMVVFAFATIT--------PLMFT--------------------GALFSAVACVNSLA
350 360 370
400 410 420 430 440 450
pF1KE0 GVTAVSTFNGIYSATVAWYPGFTFLLSAGLLLLPAISLCVVKCTSWNEGSYELLIQEESS
.:: . ::..: ::. .. :: :::.:::::.::.
CCDS74 MLTASGIFNSLYPATLNFMKGFPFLLGAGLLLIPAVLIGMLEKADPHLEFQQFPQSP
380 390 400 410 420 430
460
pF1KE0 EDASDR
>>CCDS6786.1 SLC46A2 gene_id:57864|Hs108|chr9 (475 aa)
initn: 433 init1: 358 opt: 399 Z-score: 482.7 bits: 98.6 E(32554): 1.4e-20
Smith-Waterman score: 577; 30.3% identity (64.2% similar) in 402 aa overlap (56-436:61-459)
30 40 50 60 70 80
pF1KE0 QYVYRRIWEETGNYTFSSDSNISECEKNKSSPIFAFQEEVQKKVSRFNLQMD-ISGLIPG
:: :.... :. .: : . .. . :: :
CCDS67 VAASLYDAGLLLVVKASYGTGGSSNHSASPSPRGALEDQQQRAISNFYIIYNLVVGLSP-
40 50 60 70 80
90 100 110 120 130 140
pF1KE0 LVSTFILLSISDHYGRKFPMILSSVGALATSVWLCLLCYFAFPFQLLIASTFIGAFCGNY
:.:.. : .::.: ::. . .: .: : . . : : . .: ..: ... .... :..
CCDS67 LLSAYGLGWLSDRYHRKISICMSLLGFLLSRLGLLLKVLLDWPVEVLYGAAALNGLFGGF
90 100 110 120 130 140
150 160 170 180 190 200
pF1KE0 TTFWGACFAYIVDQCKEHKQKTIRIAIIDFLLGLVTGLTG-LSSGYFIREL-GFEWSFLI
..::.. .: .: . ...:. .::..:::. :. : ..::...... : . ::
CCDS67 SAFWSGVMALGSLGSSEGR-RSVRLILIDLMLGLA-GFCGSMASGHLFKQMAGHSGQGLI
150 160 170 180 190 200
210 220 230 240
pF1KE0 I---AVSLA-VNLIYILFFLGDPVKECS-SQNV----TMSCSEG-FKNL----FYRTYML
. .:: : :.: :. : : . . ::.. :.: . : ...: . . : .
CCDS67 LTACSVSCASFALLYSLLVLKVPESVAKPSQELPAVDTVSGTVGTYRTLDPDQLDQQYAV
210 220 230 240 250 260
250 260 270 280 290 300
pF1KE0 FKNAS-GK---RRFLLCLLLFTVITYFFVVIGIAPIFILYELDSPLCWNEVFIGYGSALG
. : :: .. . ::. .: : ..:.: . .. :. : :: ::.: .::: : :
CCDS67 GHPPSPGKAKPHKTTIALLFVGAIIYDLAVVGTVDVIPLFVLREPLGWNQVQVGYGMAAG
270 280 290 300 310 320
310 320 330 340 350 360
pF1KE0 SASFLTSFLGIWLFSYCMEDIHMAFIGIFTTMTGMAMTAFASTTLMMFLARVPFLFTIVP
. :.:::::. .:: :..: : .::. . .: . ::.. : :...::. .::...:
CCDS67 YTIFITSFLGVLVFSRCFRDTTMIMIGMVSFGSGALLLAFVKETYMFYIARAVMLFALIP
330 340 350 360 370 380
370 380 390 400 410 420
pF1KE0 FSVLRSMLSKVVRSTEQGTLFACIAFLETLGGVTAVSTFNGIYSATVAWYPGFTFLLSAG
...:: .::..... : .:. . . .: ::.. . .: ::. :. . : : ::.
CCDS67 VTTIRSAMSKLIKGSSYGKVFVILQLSLALTGVVTSTLYNKIYQLTMDMFVGSCFALSSF
390 400 410 420 430 440
430 440 450 460
pF1KE0 LLLLPAISLCVVKCTSWNEGSYELLIQEESSEDASDR
: .: : . .:
CCDS67 LSFLAIIPISIVAYKQVPLSPYGDIIEK
450 460 470
461 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 21:01:40 2016 done: Thu Nov 3 21:01:41 2016
Total Scan time: 2.990 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]