FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6369, 348 aa
1>>>pF1KE6369 348 - 348 aa - 348 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.2414+/-0.000946; mu= 16.5025+/- 0.056
mean_var=65.5100+/-13.733, 0's: 0 Z-trim(103.9): 22 B-trim: 0 in 0/49
Lambda= 0.158460
statistics sampled from 7616 (7628) to 7616 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.595), E-opt: 0.2 (0.234), width: 16
Scan time: 1.940
The best scores are: opt bits E(32554)
CCDS9506.1 SLC10A2 gene_id:6555|Hs108|chr13 ( 348) 2324 540.3 8.8e-154
CCDS3614.1 SLC10A6 gene_id:345274|Hs108|chr4 ( 377) 1115 263.9 1.5e-70
CCDS3482.1 SLC10A4 gene_id:201780|Hs108|chr4 ( 437) 740 178.3 1.1e-44
CCDS9797.1 SLC10A1 gene_id:6554|Hs108|chr14 ( 349) 709 171.1 1.2e-42
CCDS34915.1 SLC10A5 gene_id:347051|Hs108|chr8 ( 438) 530 130.2 3.1e-30
CCDS48195.1 SLC10A3 gene_id:8273|Hs108|chrX ( 448) 434 108.3 1.3e-23
CCDS14755.1 SLC10A3 gene_id:8273|Hs108|chrX ( 477) 434 108.3 1.3e-23
>>CCDS9506.1 SLC10A2 gene_id:6555|Hs108|chr13 (348 aa)
initn: 2324 init1: 2324 opt: 2324 Z-score: 2874.4 bits: 540.3 E(32554): 8.8e-154
Smith-Waterman score: 2324; 99.7% identity (100.0% similar) in 348 aa overlap (1-348:1-348)
10 20 30 40 50 60
pF1KE6 MNDPNSCVDNATVCSGASCVVPESNFNNILSVVLSTVLTILLALVMFSMGCNVEIKKFLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS95 MNDPNSCVDNATVCSGASCVVPESNFNNILSVVLSTVLTILLALVMFSMGCNVEIKKFLG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 HIKRPWGICVGFLCQFGIMPLTGFILSVAFDILPLQAVVVLIIGCCPGGTASNILAYWVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS95 HIKRPWGICVGFLCQFGIMPLTGFILSVAFDILPLQAVVVLIIGCCPGGTASNILAYWVD
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 GDMDLSVSMTTCSTLLALGMMPLCLLIYTKMWVDSGSIVIPYDNIGTSLVALVVPVSIGM
::::::::::::::::::::::::::::::::::::::::::::::::::.:::::::::
CCDS95 GDMDLSVSMTTCSTLLALGMMPLCLLIYTKMWVDSGSIVIPYDNIGTSLVSLVVPVSIGM
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 FVNHKWPQKAKIILKIGSIAGAILIVLIAVVGGILYQSAWIIAPKLWIIGTIFPVAGYSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS95 FVNHKWPQKAKIILKIGSIAGAILIVLIAVVGGILYQSAWIIAPKLWIIGTIFPVAGYSL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE6 GFLLARIAGLPWYRCRTVAFETGMQNTQLCSTIVQLSFTPEELNVVFTFPLIYSIFQLAF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS95 GFLLARIAGLPWYRCRTVAFETGMQNTQLCSTIVQLSFTPEELNVVFTFPLIYSIFQLAF
250 260 270 280 290 300
310 320 330 340
pF1KE6 AAIFLGFYVAYKKCHGKNKAEIPESKENGTEPESSFYKANGGFQPDEK
::::::::::::::::::::::::::::::::::::::::::::::::
CCDS95 AAIFLGFYVAYKKCHGKNKAEIPESKENGTEPESSFYKANGGFQPDEK
310 320 330 340
>>CCDS3614.1 SLC10A6 gene_id:345274|Hs108|chr4 (377 aa)
initn: 1198 init1: 1070 opt: 1115 Z-score: 1380.1 bits: 263.9 E(32554): 1.5e-70
Smith-Waterman score: 1118; 47.9% identity (81.0% similar) in 326 aa overlap (30-345:30-355)
10 20 30 40 50 60
pF1KE6 MNDPNSCVDNATVCSGASCVVPESNFNNILSVVLSTVLTILLALVMFSMGCNVEIKKFLG
: .:...: :....:.:::.::.:::.:. .
CCDS36 MRANCSSSSACPANSSEEELPVGLEVHGNLELVFTVVSTVMMGLLMFSLGCSVEIRKLWS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 HIKRPWGICVGFLCQFGIMPLTGFILSVAFDILPLQAVVVLIIGCCPGGTASNILAYWVD
::.::::: ::.:::::.::.:...:...:.. :.::..:::.::::::: :::...:::
CCDS36 HIRRPWGIAVGLLCQFGLMPFTAYLLAISFSLKPVQAIAVLIMGCCPGGTISNIFTFWVD
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 GDMDLSVSMTTCSTLLALGMMPLCLLIYTKMWVDSGSIVIPYDNIGTSLVALVVPVSIGM
::::::.:::::::. ::::::::. .:: : . ...:::.::: .:: :..::..:.
CCDS36 GDMDLSISMTTCSTVAALGMMPLCIYLYTWSWSLQQNLTIPYQNIGITLVCLTIPVAFGV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 FVNHKWPQKAKIILKIGSIAGAILIVLIAVVGGILYQSAWIIAPKLWIIGTIFPVAGYSL
.::..::...:::::::...:..:....::.: .: ...: : :. :::. :.
CCDS36 YVNYRWPKQSKIILKIGAVVGGVLLLVVAVAGVVLAKGSWNSDITLLTISFIFPLIGHVT
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE6 GFLLARIAGLPWYRCRTVAFETGMQNTQLCSTIVQLSFTPEELNVVFTFPLIYSIFQLAF
::::: .. : ::::...::: :: :.: :..::::: :.: ...::: :..:::
CCDS36 GFLLALFTHQSWQRCRTISLETGAQNIQMCITMLQLSFTAEHLVQMLSFPLAYGLFQLID
250 260 270 280 290 300
310 320 330 340
pF1KE6 AAIFLGFYVAYKK----CHGKNKA---EIPESKENGTEPESS-FYKAN--GGFQPDEK
. .... : .::. :::... :. ..... . :.. : ..: :.. :
CCDS36 GFLIVAAYQTYKRRLKNKHGKKNSGCTEVCHTRKSTSSRETNAFLEVNEEGAITPGPPGP
310 320 330 340 350 360
CCDS36 MDCHRALEPVGHITSCE
370
>>CCDS3482.1 SLC10A4 gene_id:201780|Hs108|chr4 (437 aa)
initn: 655 init1: 426 opt: 740 Z-score: 915.8 bits: 178.3 E(32554): 1.1e-44
Smith-Waterman score: 740; 38.4% identity (72.3% similar) in 292 aa overlap (23-311:98-385)
10 20 30 40 50
pF1KE6 MNDPNSCVDNATVCSGASCVVPESNFNNILSVVLSTVLTILLALVMFSMGCN
.. .:. :.: ....: : .:...::.
CCDS34 PTTSGLAGGAASHGPSPFPRPWAPHALPFWDTPLNHGLNVFVGAALCI----TMLGLGCT
70 80 90 100 110 120
60 70 80 90 100 110
pF1KE6 VEIKKFLGHIKRPWGICVGFLCQFGIMPLTGFILSVAFDILPLQAVVVLIIGCCPGGTAS
:....: .:..:: : .. :::::..:: .:.:..:: . . ::.::. ::::::. :
CCDS34 VDVNHFGAHVRRPVGALLAALCQFGLLPLLAFLLALAFKLDEVAAVAVLLCGCCPGGNLS
130 140 150 160 170 180
120 130 140 150 160 170
pF1KE6 NILAYWVDGDMDLSVSMTTCSTLLALGMMPLCLLIYTKMWVDSGSI-VIPYDNIGTSLVA
:... :::::.::. :: :::::: .::::: ::. :... . ..: .. .: .
CCDS34 NLMSLLVDGDMNLSIIMTISSTLLALVLMPLCLWIYSWAWINTPIVQLLPLGTVTLTLCS
190 200 210 220 230 240
180 190 200 210 220
pF1KE6 LVVPVSIGMFVNHKWPQKAKIILKIGSIAGAI-LIVLIAVVGGILYQSAWIIAPK-LWII
..:...:.:. .:. . : :.:.. . . :.::. ..: .: : ...:
CCDS34 TLIPIGLGVFIRYKYSRVADYIVKVSLWSLLVTLVVLFIMTGTMLGPELLASIPAAVYVI
250 260 270 280 290 300
230 240 250 260 270 280
pF1KE6 GTIFPVAGYSLGFLLARIAGLPWYRCRTVAFETGMQNTQLCSTIVQLSFTPEELNVVFTF
. ..:.:::. :. :: . :: ::: .::: ::.:::..:..:.: :. .. .. :
CCDS34 AIFMPLAGYASGYGLATLFHLPPNCKRTVCLETGSQNVQLCTAILKLAFPPQFIGSMYMF
310 320 330 340 350 360
290 300 310 320 330 340
pF1KE6 PLIYSIFQLAFAAIFLGFYVAYKKCHGKNKAEIPESKENGTEPESSFYKANGGFQPDEK
::.:..:: : :.::. .: :
CCDS34 PLLYALFQSAEAGIFVLIYKMYGSEMLHKRDPLDEDEDTDISYKKLKEEEMADTSYGTVK
370 380 390 400 410 420
>>CCDS9797.1 SLC10A1 gene_id:6554|Hs108|chr14 (349 aa)
initn: 691 init1: 401 opt: 709 Z-score: 879.0 bits: 171.1 E(32554): 1.2e-42
Smith-Waterman score: 709; 38.4% identity (73.4% similar) in 297 aa overlap (32-322:25-319)
10 20 30 40 50 60
pF1KE6 NDPNSCVDNATVCSGASCVVPESNFNNILSVVLSTVLTILLALVMFSMGCNVEIKKFLGH
..::..:...: ..:.:.::..:..:. .:
CCDS97 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLSLGCTMEFSKIKAH
10 20 30 40 50
70 80 90 100 110 120
pF1KE6 IKRPWGICVGFLCQFGIMPLTGFILSVAFDILPLQAVVVLIIGCCPGGTASNILAYWVDG
. .: :. .... :.::::::.:.:. .: . ..:...:. :: :::. ::... . :
CCDS97 LWKPKGLAIALVAQYGIMPLTAFVLGKVFRLKNIEALAILVCGCSPGGNLSNVFSLAMKG
60 70 80 90 100 110
130 140 150 160 170
pF1KE6 DMDLSVSMTTCSTLLALGMMPLCLLIYTKMWVDSGSIV--IPYDNIGTSLVALVVPVSIG
::.::. ::::::. ::::::: : ::.. : :.. .:: .: ::: ...: .::
CCDS97 DMNLSIVMTTCSTFCALGMMPLLLYIYSRGIYD-GDLKDKVPYKGIVISLVLVLIPCTIG
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE6 MFVNHKWPQKAKIILKIGSIAGAILIVLIAVVGGILYQSAWIIA--PKLWIIGTIFPVAG
. .. : :: . ..: : : . : ..:...: .. ..: : : ....: :
CCDS97 IVLKSKRPQYMRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLMPFIG
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE6 YSLGFLLARIAGLPWYRCR-TVAFETGMQNTQLCSTIVQLSFTPEELNVVFTFPLIYSIF
. ::..:. . : ::: ::..::: ::.::::::....: :: .. .: :::.: ::
CCDS97 FLLGYVLSALFCLNG-RCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLLYMIF
240 250 260 270 280 290
300 310 320 330 340
pF1KE6 QLAFAAIFLGFYVAYKKCHG-KNKAEIPESKENGTEPESSFYKANGGFQPDEK
::. . ...... :.: . :.:...
CCDS97 QLGEGLLLIAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCTA
300 310 320 330 340
>>CCDS34915.1 SLC10A5 gene_id:347051|Hs108|chr8 (438 aa)
initn: 456 init1: 368 opt: 530 Z-score: 656.4 bits: 130.2 E(32554): 3.1e-30
Smith-Waterman score: 530; 32.6% identity (63.2% similar) in 285 aa overlap (37-314:143-424)
10 20 30 40 50 60
pF1KE6 CVDNATVCSGASCVVPESNFNNILSVVLSTVLTILLALVMFS---MGCNVEIKKFLGHIK
.: ..: :.... .::..:.. : :
CCDS34 RLIEEIKNVKVKVLKQKDSLLQAPMHIDRNILMLILPLILLNKCAFGCKIELQLFQTVWK
120 130 140 150 160 170
70 80 90 100 110 120
pF1KE6 RPWGICVGFLCQFGIMPLTGFILSVAFDILPLQAVVVLIIGCCPGGTASNILAYWVDGDM
:: . .: . :: .::. ::.:: . :: :.. :::: .. ..: .:::.
CCDS34 RPLPVILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDF
180 190 200 210 220 230
130 140 150 160 170 180
pF1KE6 DLSVSMTTCSTLLALGMMPLCLLIYTKMWVDSGSIVIPYDNIGTSLVALVVPVSIGMFVN
:.. :: :::::: :::. ::... ::.. :: ..: ..:. ..::::::. ..
CCDS34 TLAILMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIK
240 250 260 270 280 290
190 200 210 220 230
pF1KE6 HKWPQKA----KIILKIGSIAGAILIVLIAVVGGILYQSAWIIAPKLWIIGTIFPVAGYS
:. :.:: .:: .. : . : : .:: .. .. . .. ..: . :. :
CCDS34 HRIPEKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNL---EVILLGLLVPALGLL
300 310 320 330 340
240 250 260 270 280 290
pF1KE6 LGFLLARIAGLPWYRCRTVAFETGMQNTQLCSTIVQLSFTPEELNVVFTFPLIYSIFQLA
.:. .:.. :: :.:::.:.:: :. : ...:::: . :.. . :. .. .
CCDS34 FGYSFAKVCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGC
350 360 370 380 390 400
300 310 320 330 340
pF1KE6 FAAIFLGFYVAYKKCHGKNKAEIPESKENGTEPESSFYKANGGFQPDEK
... : : :.:
CCDS34 EMLLIILVYKAKKRCIFFLQDKRKRNFLI
410 420 430
>>CCDS48195.1 SLC10A3 gene_id:8273|Hs108|chrX (448 aa)
initn: 336 init1: 225 opt: 434 Z-score: 537.6 bits: 108.3 E(32554): 1.3e-23
Smith-Waterman score: 434; 28.8% identity (64.1% similar) in 281 aa overlap (37-309:163-440)
10 20 30 40 50 60
pF1KE6 CVDNATVCSGASCVVPESNFNNILSVVLSTVLTILLALVMF---SMGCNVEIKKFLGHIK
.: .:: :.. :.::.::.. . : ..
CCDS48 ERRDFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQ
140 150 160 170 180 190
70 80 90 100 110 120
pF1KE6 RPWGICVGFLCQFGIMPLTGFILSVAFDILPLQAVVVLIIGCC-PGGTASNILAYWVDGD
: . .:.: :: .::: .:... .: .:: .. ::: : ::: .: ... . ::
CCDS48 SPQPMLLGLLGQFLVMPLYAFLMAKVF-MLPKALALGLIITCSSPGGGGSYLFSLLLGGD
200 210 220 230 240 250
130 140 150 160 170 180
pF1KE6 MDLSVSMTTCSTLLALGMMPLCLLIYTKMWVDSGSIVIPYDNIGTSLVALVVPVSIGMFV
. :..::: ::. : :..:: ::... .. .: ..: .:. ...:...:...
CCDS48 VTLAISMTFLSTVAATGFLPLSSAIYSRLLSIHETLHVPISKILGTLLFIAIPIAVGVLI
260 270 280 290 300 310
190 200 210 220 230
pF1KE6 NHKWPQKAKIILKIGSIAGAILIV---LIAVVGGILYQSAWIIAPKLWIIGTIFPVAGYS
. : :. ....:.. . . .:.. ..: :. . : : : . ..: :..:
CCDS48 KSKLPKFSQLLLQVVKPFSFVLLLGGLFLAYRMGV-FILAGIRLP-IVLVGITVPLVGLL
320 330 340 350 360
240 250 260 270 280 290
pF1KE6 LGFLLARIAGLPWYRCRTVAFETGMQNTQLCSTIVQLSFTPEELNVVFTFPLIYSIFQLA
.:. :: :: . :::..:.:.::. : ...:::. . . . :.: .. .
CCDS48 VGYCLATCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTS
370 380 390 400 410 420
300 310 320 330 340
pF1KE6 -FAAIFLGFYVAYKKCHGKNKAEIPESKENGTEPESSFYKANGGFQPDEK
. :. .: ..
CCDS48 EMLALVIGHFIYSSLFPVP
430 440
>>CCDS14755.1 SLC10A3 gene_id:8273|Hs108|chrX (477 aa)
initn: 290 init1: 225 opt: 434 Z-score: 537.2 bits: 108.3 E(32554): 1.3e-23
Smith-Waterman score: 434; 28.8% identity (64.1% similar) in 281 aa overlap (37-309:192-469)
10 20 30 40 50 60
pF1KE6 CVDNATVCSGASCVVPESNFNNILSVVLSTVLTILLALVMF---SMGCNVEIKKFLGHIK
.: .:: :.. :.::.::.. . : ..
CCDS14 ERRDFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQ
170 180 190 200 210 220
70 80 90 100 110 120
pF1KE6 RPWGICVGFLCQFGIMPLTGFILSVAFDILPLQAVVVLIIGCC-PGGTASNILAYWVDGD
: . .:.: :: .::: .:... .: .:: .. ::: : ::: .: ... . ::
CCDS14 SPQPMLLGLLGQFLVMPLYAFLMAKVF-MLPKALALGLIITCSSPGGGGSYLFSLLLGGD
230 240 250 260 270 280
130 140 150 160 170 180
pF1KE6 MDLSVSMTTCSTLLALGMMPLCLLIYTKMWVDSGSIVIPYDNIGTSLVALVVPVSIGMFV
. :..::: ::. : :..:: ::... .. .: ..: .:. ...:...:...
CCDS14 VTLAISMTFLSTVAATGFLPLSSAIYSRLLSIHETLHVPISKILGTLLFIAIPIAVGVLI
290 300 310 320 330 340
190 200 210 220 230
pF1KE6 NHKWPQKAKIILKIGSIAGAILIV---LIAVVGGILYQSAWIIAPKLWIIGTIFPVAGYS
. : :. ....:.. . . .:.. ..: :. . : : : . ..: :..:
CCDS14 KSKLPKFSQLLLQVVKPFSFVLLLGGLFLAYRMGV-FILAGIRLP-IVLVGITVPLVGLL
350 360 370 380 390
240 250 260 270 280 290
pF1KE6 LGFLLARIAGLPWYRCRTVAFETGMQNTQLCSTIVQLSFTPEELNVVFTFPLIYSIFQLA
.:. :: :: . :::..:.:.::. : ...:::. . . . :.: .. .
CCDS14 VGYCLATCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTS
400 410 420 430 440 450
300 310 320 330 340
pF1KE6 -FAAIFLGFYVAYKKCHGKNKAEIPESKENGTEPESSFYKANGGFQPDEK
. :. .: ..
CCDS14 EMLALVIGHFIYSSLFPVP
460 470
348 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 12:32:37 2016 done: Tue Nov 8 12:32:37 2016
Total Scan time: 1.940 Total Display time: 0.020
Function used was FASTA [36.3.4 Apr, 2011]