FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6396, 438 aa
1>>>pF1KE6396 438 - 438 aa - 438 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.3081+/-0.00109; mu= 17.4255+/- 0.065
mean_var=63.8084+/-13.123, 0's: 0 Z-trim(102.7): 36 B-trim: 857 in 2/50
Lambda= 0.160559
statistics sampled from 7055 (7068) to 7055 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.576), E-opt: 0.2 (0.217), width: 16
Scan time: 2.020
The best scores are: opt bits E(32554)
CCDS34915.1 SLC10A5 gene_id:347051|Hs108|chr8 ( 438) 2782 653.5 1.2e-187
CCDS14755.1 SLC10A3 gene_id:8273|Hs108|chrX ( 477) 983 236.8 3.6e-62
CCDS48195.1 SLC10A3 gene_id:8273|Hs108|chrX ( 448) 926 223.6 3.2e-58
CCDS9506.1 SLC10A2 gene_id:6555|Hs108|chr13 ( 348) 530 131.8 1.1e-30
CCDS3482.1 SLC10A4 gene_id:201780|Hs108|chr4 ( 437) 467 117.2 3.2e-26
CCDS3614.1 SLC10A6 gene_id:345274|Hs108|chr4 ( 377) 445 112.1 9.5e-25
CCDS9797.1 SLC10A1 gene_id:6554|Hs108|chr14 ( 349) 410 104.0 2.5e-22
>>CCDS34915.1 SLC10A5 gene_id:347051|Hs108|chr8 (438 aa)
initn: 2782 init1: 2782 opt: 2782 Z-score: 3482.4 bits: 653.5 E(32554): 1.2e-187
Smith-Waterman score: 2782; 100.0% identity (100.0% similar) in 438 aa overlap (1-438:1-438)
10 20 30 40 50 60
pF1KE6 MIRKLFIVLLLLLVTIEEARMSSLSFLNIEKTEILFFTKTEETILVSSSYENKRPNSSHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MIRKLFIVLLLLLVTIEEARMSSLSFLNIEKTEILFFTKTEETILVSSSYENKRPNSSHL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 FVKIEDPKILQMVNVAKKISSDATNFTINLVTDEEGETNVTIQLWDSEGRQERLIEEIKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 FVKIEDPKILQMVNVAKKISSDATNFTINLVTDEEGETNVTIQLWDSEGRQERLIEEIKN
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 VKVKVLKQKDSLLQAPMHIDRNILMLILPLILLNKCAFGCKIELQLFQTVWKRPLPVILG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 VKVKVLKQKDSLLQAPMHIDRNILMLILPLILLNKCAFGCKIELQLFQTVWKRPLPVILG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 AVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDFTLAILMTC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 AVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDFTLAILMTC
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE6 TSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIKHRIPEKAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 TSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIKHRIPEKAS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE6 FLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNLEVILLGLLVPALGLLFGYSFAKVCTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 FLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNLEVILLGLLVPALGLLFGYSFAKVCTL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE6 PLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGCEMLLIILVYKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGCEMLLIILVYKA
370 380 390 400 410 420
430
pF1KE6 KKRCIFFLQDKRKRNFLI
::::::::::::::::::
CCDS34 KKRCIFFLQDKRKRNFLI
430
>>CCDS14755.1 SLC10A3 gene_id:8273|Hs108|chrX (477 aa)
initn: 983 init1: 888 opt: 983 Z-score: 1229.7 bits: 236.8 E(32554): 3.6e-62
Smith-Waterman score: 983; 39.9% identity (72.1% similar) in 391 aa overlap (33-416:75-465)
10 20 30 40 50
pF1KE6 RKLFIVLLLLLVTIEEARMSSLSFLNIEKTEILFFTKTEETILVSSSYE---NKRPNSSH
:. : .: :..::.: :. .
CCDS14 TASTSLSTAGGHTVPPTGGRYLSIGDGSVMEFEFPEDSEGIIVISSQYPGQANRTAPGPM
50 60 70 80 90 100
60 70 80 90 100 110
pF1KE6 LFVKIEDPKILQMVNVAKKISSDATNFTINLVTDEEGETNVTIQLWDSEGRQERLIEEIK
: : : ..: . ::. . . .:.... . : . . ::: :.. :::: .
CCDS14 LRVTSLDTEVLTIKNVSAITWGGGGGFVVSIHSGLAGLAPLHIQLVDAHEAPPTLIEERR
110 120 130 140 150 160
120 130 140 150 160 170
pF1KE6 NVKVKVLKQKDS--LLQAPM-HIDRN-ILMLILPLILLNKCAFGCKIELQLFQTVWKRPL
. .:: .:. :.: . :...: ::.:.::::..:::.::::.::.... . . :
CCDS14 DFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQ
170 180 190 200 210 220
180 190 200 210 220 230
pF1KE6 PVILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDFTLA
:..:: . ::..::. .::.... ::.: :.:...::. :::::.:::.::: :: :::
CCDS14 PMLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLA
230 240 250 260 270 280
240 250 260 270 280 290
pF1KE6 ILMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIKHRI
: :: ::. : ..:..: ::::.:.. :.:.:.:::..::::: .:...:..:: ..
CCDS14 ISMTFLSTVAATGFLPLSSAIYSRLLSIHETLHVPISKILGTLLFIAIPIAVGVLIKSKL
290 300 310 320 330 340
300 310 320 330 340 350
pF1KE6 PEKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNLEVILLGLLVPALGLLFGYSFA
:. ...: ....:.::.:.. :..:.. .:. .: : ..:.:. :: .::: :: .:
CCDS14 PKFSQLLLQVVKPFSFVLLLGGLFLAYRMGVFILAGIRLPIVLVGITVPLVGLLVGYCLA
350 360 370 380 390 400
360 370 380 390 400 410
pF1KE6 KVCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGCEMLLII
::. .::.:: :. ::.::::..:::. . .:. :: ::: ::. . ::: ..
CCDS14 TCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSEMLALV
410 420 430 440 450 460
420 430
pF1KE6 LVYKAKKRCIFFLQDKRKRNFLI
.
CCDS14 IGHFIYSSLFPVP
470
>>CCDS48195.1 SLC10A3 gene_id:8273|Hs108|chrX (448 aa)
initn: 968 init1: 888 opt: 926 Z-score: 1158.8 bits: 223.6 E(32554): 3.2e-58
Smith-Waterman score: 926; 42.7% identity (76.1% similar) in 330 aa overlap (91-416:107-436)
70 80 90 100 110 120
pF1KE6 FVKIEDPKILQMVNVAKKISSDATNFTINLVTDEEGETNVTIQLWDSEGRQERLIEEIKN
::. . :. . .: :.. :::: ..
CCDS48 EFPEDSEGIIVISSQYPGQANRTAPGPMLRVTSLDTEVLTIKNLVDAHEAPPTLIEERRD
80 90 100 110 120 130
130 140 150 160 170
pF1KE6 VKVKVLKQKDS--LLQAPM-HIDRN-ILMLILPLILLNKCAFGCKIELQLFQTVWKRPLP
.:: .:. :.: . :...: ::.:.::::..:::.::::.::.... . . : :
CCDS48 FCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQP
140 150 160 170 180 190
180 190 200 210 220 230
pF1KE6 VILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDFTLAI
..:: . ::..::. .::.... ::.: :.:...::. :::::.:::.::: :: ::::
CCDS48 MLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLAI
200 210 220 230 240 250
240 250 260 270 280 290
pF1KE6 LMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIKHRIP
:: ::. : ..:..: ::::.:.. :.:.:.:::..::::: .:...:..:: ..:
CCDS48 SMTFLSTVAATGFLPLSSAIYSRLLSIHETLHVPISKILGTLLFIAIPIAVGVLIKSKLP
260 270 280 290 300 310
300 310 320 330 340 350
pF1KE6 EKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNLEVILLGLLVPALGLLFGYSFAK
. ...: ....:.::.:.. :..:.. .:. .: : ..:.:. :: .::: :: .:
CCDS48 KFSQLLLQVVKPFSFVLLLGGLFLAYRMGVFILAGIRLPIVLVGITVPLVGLLVGYCLAT
320 330 340 350 360 370
360 370 380 390 400 410
pF1KE6 VCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGCEMLLIIL
::. .::.:: :. ::.::::..:::. . .:. :: ::: ::. . ::: ...
CCDS48 CLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSEMLALVI
380 390 400 410 420 430
420 430
pF1KE6 VYKAKKRCIFFLQDKRKRNFLI
CCDS48 GHFIYSSLFPVP
440
>>CCDS9506.1 SLC10A2 gene_id:6555|Hs108|chr13 (348 aa)
initn: 456 init1: 368 opt: 530 Z-score: 664.7 bits: 131.8 E(32554): 1.1e-30
Smith-Waterman score: 530; 32.6% identity (63.2% similar) in 285 aa overlap (143-424:37-314)
120 130 140 150 160 170
pF1KE6 RLIEEIKNVKVKVLKQKDSLLQAPMHIDRNILMLILPLILLNKCAFGCKIELQLFQTVWK
.: ..: :.... .::..:.. : :
CCDS95 CVDNATVCSGASCVVPESNFNNILSVVLSTVLTILLALVMFS---MGCNVEIKKFLGHIK
10 20 30 40 50 60
180 190 200 210 220 230
pF1KE6 RPLPVILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDF
:: . .: . :: .::. ::.:: . :: :.. :::: .. ..: .:::.
CCDS95 RPWGICVGFLCQFGIMPLTGFILSVAFDILPLQAVVVLIIGCCPGGTASNILAYWVDGDM
70 80 90 100 110 120
240 250 260 270 280 290
pF1KE6 TLAILMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIK
:.. :: :::::: :::. ::... ::.. :: ..: ..:. ..::::::. ..
CCDS95 DLSVSMTTCSTLLALGMMPLCLLIYTKMWVDSGSIVIPYDNIGTSLVSLVVPVSIGMFVN
130 140 150 160 170 180
300 310 320 330 340
pF1KE6 HRIPEKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNL---EVILLGLLVPALGLL
:. :.:: .:: .. : . : : .:: .. .. . .. ..: . :. :
CCDS95 HKWPQKA----KIILKIGSIAGAILIVLIAVVGGILYQSAWIIAPKLWIIGTIFPVAGYS
190 200 210 220 230
350 360 370 380 390 400
pF1KE6 FGYSFAKVCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGC
.:. .:.. :: :.:::.:.:: :. : ...:::: . :.. . :. .. .
CCDS95 LGFLLARIAGLPWYRCRTVAFETGMQNTQLCSTIVQLSFTPEELNVVFTFPLIYSIFQLA
240 250 260 270 280 290
410 420 430
pF1KE6 EMLLIILVYKAKKRCIFFLQDKRKRNFLI
... : : :.:
CCDS95 FAAIFLGFYVAYKKCHGKNKAEIPESKENGTEPESSFYKANGGFQPDEK
300 310 320 330 340
>>CCDS3482.1 SLC10A4 gene_id:201780|Hs108|chr4 (437 aa)
initn: 389 init1: 283 opt: 467 Z-score: 584.3 bits: 117.2 E(32554): 3.2e-26
Smith-Waterman score: 467; 31.3% identity (64.9% similar) in 265 aa overlap (158-419:120-383)
130 140 150 160 170 180
pF1KE6 QKDSLLQAPMHIDRNILMLILPLILLNKCAFGCKIELQLFQTVWKRPLPVILGAVTQFFL
.:: .... : . .::. ..:.:. :: :
CCDS34 APHALPFWDTPLNHGLNVFVGAALCITMLGLGCTVDVNHFGAHVRRPVGALLAALCQFGL
90 100 110 120 130 140
190 200 210 220 230 240
pF1KE6 MPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDFTLAILMTCTSTLLAL
.:. .:::. : :. : .:.. ::::. . :..::.:::..:.:.:: .::::::
CCDS34 LPLLAFLLALAFKLDEVAAVAVLLCGCCPGGNLSNLMSLLVDGDMNLSIIMTISSTLLAL
150 160 170 180 190 200
250 260 270 280 290 300
pF1KE6 IMMPVNSYIYSRILGLSGTFHI-PVSKIVSTLLFILVPVSIGIVIKHRIPEKASFLERII
..::. .::: . .. :.. .. :: :.:...:. :... . :... ..
CCDS34 VLMPLCLWIYSWAWINTPIVQLLPLGTVTLTLCSTLIPIGLGVFIRYKYSRVADYIVKVS
210 220 230 240 250 260
310 320 330 340 350 360
pF1KE6 RPLSFILMFVGIYLTFTV-GLVFLKTDNLEVILLGLLVPALGLLFGYSFAKVCTLPLPVC
.. . : . .: :. : .: . : ......: : ::..: . :: : :
CCDS34 LWSLLVTLVVLFIMTGTMLGPELLASIPAAVYVIAIFMPLAGYASGYGLATLFHLP-PNC
270 280 290 300 310 320
370 380 390 400 410 420
pF1KE6 K-TVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGCEMLLIILVYKAKKRC
: :: .:.: : : :...:.:: . . . :. :. .. : ...:.::
CCDS34 KRTVCLETGSQNVQLCTAILKLAFPPQFIGSMYMFPLLYALFQSAEAGIFVLIYKMYGSE
330 340 350 360 370 380
430
pF1KE6 IFFLQDKRKRNFLI
CCDS34 MLHKRDPLDEDEDTDISYKKLKEEEMADTSYGTVKAENIIMMETAQTSL
390 400 410 420 430
>>CCDS3614.1 SLC10A6 gene_id:345274|Hs108|chr4 (377 aa)
initn: 371 init1: 334 opt: 445 Z-score: 557.8 bits: 112.1 E(32554): 9.5e-25
Smith-Waterman score: 445; 27.4% identity (63.7% similar) in 292 aa overlap (137-423:26-313)
110 120 130 140 150 160
pF1KE6 SEGRQERLIEEIKNVKVKVLKQKDSLLQAPMHIDRNILMLILPLILLNKCAF--GCKIEL
.: . .... .. .... : ::..:.
CCDS36 MRANCSSSSACPANSSEEELPVGLEVHGNLELVFTVVSTVMMGLLMFSLGCSVEI
10 20 30 40 50
170 180 190 200 210 220
pF1KE6 QLFQTVWKRPLPVILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLF
. . . .:: . .: . :: :::: ..::. .: .::..:.. :::: . .:
CCDS36 RKLWSHIRRPWGIAVGLLCQFGLMPFTAYLLAISFSLKPVQAIAVLIMGCCPGGTISNIF
60 70 80 90 100 110
230 240 250 260 270 280
pF1KE6 ALLLDGDFTLAILMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVP
.. .:::. :.: :: ::. :: :::. :.:. .:. .. :: ..: ::. . .:
CCDS36 TFWVDGDMDLSISMTTCSTVAALGMMPLCIYLYTWSWSLQQNLTIPYQNIGITLVCLTIP
120 130 140 150 160 170
290 300 310 320 330 340
pF1KE6 VSIGIVIKHRIPEKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTD-NLEVILL--GL
:..:. ...: :...... .: .. .:..: . ..:.:. : . : .. :: ..
CCDS36 VAFGVYVNYRWPKQSKIILKIGAVVGGVLLLV----VAVAGVVLAKGSWNSDITLLTISF
180 190 200 210 220 230
350 360 370 380 390 400
pF1KE6 LVPALGLLFGYSFAKVCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPF
. : .: . :. .: :.:...:.: : . ....:::: . :.
CCDS36 IFPLIGHVTGFLLALFTHQSWQRCRTISLETGAQNIQMCITMLQLSFTAEHLVQMLSFPL
240 250 260 270 280 290
410 420 430
pF1KE6 TVAMCSGCEMLLIILVYKAKKRCIFFLQDKRKRNFLI
. .. . . .::. .:.. ::
CCDS36 AYGLFQLIDGFLIVAAYQTYKRRLKNKHGKKNSGCTEVCHTRKSTSSRETNAFLEVNEEG
300 310 320 330 340 350
>>CCDS9797.1 SLC10A1 gene_id:6554|Hs108|chr14 (349 aa)
initn: 382 init1: 227 opt: 410 Z-score: 514.5 bits: 104.0 E(32554): 2.5e-22
Smith-Waterman score: 410; 29.2% identity (65.5% similar) in 284 aa overlap (143-418:30-304)
120 130 140 150 160 170
pF1KE6 RLIEEIKNVKVKVLKQKDSLLQAPMHIDRNILMLILPLILLNKCAFGCKIELQLFQT-VW
::...: .:.:. .:: .:.. ... .:
CCDS97 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLS---LGCTMEFSKIKAHLW
10 20 30 40 50
180 190 200 210 220 230
pF1KE6 KRPLPVILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTC-PGGGGGYLFALLLDG
: : . .. :.:. .::. .:.:... : . .:... ..: : :::. . .:.: . :
CCDS97 K-PKGLAIALVAQYGIMPLTAFVLGKVFRLKNIEALAI-LVCGCSPGGNLSNVFSLAMKG
60 70 80 90 100 110
240 250 260 270 280
pF1KE6 DFTLAILMTCTSTLLALIMMPVNSYIYSRILGLSGTFH--IPVSKIVSTLLFILVPVSIG
:..:.:.:: ::. :: :::. ::::: . .: .. .: . :: .:...:.: .::
CCDS97 DMNLSIVMTTCSTFCALGMMPLLLYIYSRGI-YDGDLKDKVPYKGIVISLVLVLIPCTIG
120 130 140 150 160 170
290 300 310 320 330 340
pF1KE6 IVIKHRIPEKASFLERIIRPLSFILMFVGIYLT----FTVGLVFLKTDNLEVILLGLLVP
::.: . :. ... .:. .:... .. .: ..:: .. . . .: . :.:
CCDS97 IVLKSKRPQ---YMRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLMP
180 190 200 210 220 230
350 360 370 380 390 400
pF1KE6 ALGLLFGYSFAKVCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVA
.:.:.:: .. . : .::..:.: : : ......:: . :.
CCDS97 FIGFLLGYVLSALFCLNGRCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLLYM
240 250 260 270 280 290
410 420 430
pF1KE6 MCSGCEMLLIILVYKAKKRCIFFLQDKRKRNFLI
. . : ::.: ..
CCDS97 IFQLGEGLLLIAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCTA
300 310 320 330 340
438 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 12:54:18 2016 done: Tue Nov 8 12:54:19 2016
Total Scan time: 2.020 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]