FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9782, 209 aa
1>>>pF1KB9782 209 - 209 aa - 209 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.6915+/-0.000789; mu= 8.0893+/- 0.048
mean_var=112.4716+/-22.237, 0's: 0 Z-trim(111.6): 31 B-trim: 9 in 1/50
Lambda= 0.120935
statistics sampled from 12499 (12522) to 12499 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.75), E-opt: 0.2 (0.385), width: 16
Scan time: 2.020
The best scores are: opt bits E(32554)
CCDS3361.1 MXD4 gene_id:10608|Hs108|chr4 ( 209) 1349 245.3 2e-65
CCDS1896.1 MXD1 gene_id:4084|Hs108|chr2 ( 221) 621 118.3 3.6e-27
CCDS7564.2 MXI1 gene_id:4601|Hs108|chr10 ( 228) 529 102.3 2.5e-22
CCDS7563.1 MXI1 gene_id:4601|Hs108|chr10 ( 295) 529 102.4 3.1e-22
CCDS31284.1 MXI1 gene_id:4601|Hs108|chr10 ( 182) 470 91.9 2.6e-19
CCDS47347.1 MXD3 gene_id:83463|Hs108|chr5 ( 193) 455 89.3 1.7e-18
CCDS4416.1 MXD3 gene_id:83463|Hs108|chr5 ( 206) 454 89.2 2e-18
CCDS56123.1 MXD1 gene_id:4084|Hs108|chr2 ( 211) 439 86.6 1.2e-17
>>CCDS3361.1 MXD4 gene_id:10608|Hs108|chr4 (209 aa)
initn: 1349 init1: 1349 opt: 1349 Z-score: 1288.1 bits: 245.3 E(32554): 2e-65
Smith-Waterman score: 1349; 100.0% identity (100.0% similar) in 209 aa overlap (1-209:1-209)
10 20 30 40 50 60
pF1KB9 MELNSLLILLEAAEYLERRDREAEHGYASVLPFDGDFAREKTKAAGLVRKAPNNRSSHNE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MELNSLLILLEAAEYLERRDREAEHGYASVLPFDGDFAREKTKAAGLVRKAPNNRSSHNE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 LEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALSIKEQLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALSIKEQLQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 QEHRFLKRRLEQLSVQSVERVRTDSTGSAVSTDDSEQEVDIEGMEFGPGELDSVGSSSDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QEHRFLKRRLEQLSVQSVERVRTDSTGSAVSTDDSEQEVDIEGMEFGPGELDSVGSSSDA
130 140 150 160 170 180
190 200
pF1KB9 DDHYSLQSGTGGDSGFGPHCRRLGRPALS
:::::::::::::::::::::::::::::
CCDS33 DDHYSLQSGTGGDSGFGPHCRRLGRPALS
190 200
>>CCDS1896.1 MXD1 gene_id:4084|Hs108|chr2 (221 aa)
initn: 559 init1: 519 opt: 621 Z-score: 601.3 bits: 118.3 E(32554): 3.6e-27
Smith-Waterman score: 621; 53.2% identity (79.6% similar) in 201 aa overlap (5-196:8-201)
10 20 30 40 50
pF1KB9 MELNSLLILLEAAEYLERRDREAEHGYASVLPF---DGDFAREKTKAAGLVRKAPNN
.. .:::::.:::::.:::::::::.::. : : ....:. .. ..
CCDS18 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSK---KNNSSS
10 20 30 40 50
60 70 80 90 100 110
pF1KB9 RSSHNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALS
::.:::.::.:::.::: ::.:: ::::::.:.:::::::: .::.::::::. ::.:.
CCDS18 RSTHNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVH
60 70 80 90 100 110
120 130 140 150 160
pF1KB9 IKEQLQQEHRFLKRRLEQLSVQSVERVRTDSTGSAVSTD--DSEQE---VDIEGMEFGPG
.:::.:.: :::.::.: ..::.: :: ::.::.. ::..: ::.:. .. :
CCDS18 QIDQLQREQRHLKRQLEKL---GIERIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTG
120 130 140 150 160 170
170 180 190 200
pF1KB9 ELD-SVGSSSDADDHYSLQSGTGGDSGFGPHCRRLGRPALS
.:: : .: ::.:.. :.:: :.: :.
CCDS18 DLDWSSSSVSDSDERGSMQS-LGSDEGYSSTSIKRIKLQDSHKACLGL
180 190 200 210 220
>>CCDS7564.2 MXI1 gene_id:4601|Hs108|chr10 (228 aa)
initn: 626 init1: 346 opt: 529 Z-score: 514.4 bits: 102.3 E(32554): 2.5e-22
Smith-Waterman score: 614; 51.4% identity (73.4% similar) in 214 aa overlap (9-203:12-224)
10 20 30 40
pF1KB9 MELNSLLILLEAAEYLERRDREAEHGYASVLPFDGD-----------FAREKTKAAG
::::::.::::.:: :::::: .: . ..: . ...:
CCDS75 MERVKMINVQRLLEAAEFLERRERECEHGYASSFPSMPSPRLQHSKPPRRLSRAQKHSSG
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB9 LVRKAPNNRSSHNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLE
. :::.::::::.:::.::: ::.:: :.::::: ::::::.::..::.::::::
CCDS75 SSNTSTANRSTHNELEKNRRAHLRLCLERLKVLIPLGPDCTRHTTLGLLNKAKAHIKKLE
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB9 EQDRRALSIKEQLQQEHRFLKRRLEQLS-VQSVERVRTDSTGSAVSTD--DSEQE---VD
: .:.. :.:..:.:::: :::::. : .::.: :: ::..:.: :::.: ::
CCDS75 EAERKSQHQLENLEREQRFLKWRLEQLQGPQEMERIRMDSIGSTISSDRSDSEREEIEVD
130 140 150 160 170 180
170 180 190 200
pF1KB9 IEGMEFGPGELDSVGSSS--DADDHYSLQSGTGGDSGFGPHCRRLGRPALS
.:. ::. ::.:.....: : ::: :: : :.: :.. .:
CCDS75 VESTEFSHGEVDNISTTSISDIDDHSSLPS-IGSDEGYSSASVKLSFTS
190 200 210 220
>>CCDS7563.1 MXI1 gene_id:4601|Hs108|chr10 (295 aa)
initn: 615 init1: 346 opt: 529 Z-score: 512.7 bits: 102.4 E(32554): 3.1e-22
Smith-Waterman score: 585; 48.4% identity (72.2% similar) in 223 aa overlap (3-203:70-291)
10 20
pF1KB9 MELNSLLILLEAAEYLE---RRDREAEHGYAS
:... :::::: ::: ..... ::::::
CCDS75 EDPAGAKPRCPFSDIFNTSENSMEKHINTFLQNVQILLEAASYLEQIEKENKKCEHGYAS
40 50 60 70 80 90
30 40 50 60 70
pF1KB9 VLPFDGD-----------FAREKTKAAGLVRKAPNNRSSHNELEKHRRAKLRLYLEQLKQ
.: . ..: . ...: . :::.::::::.:::.::: ::.::
CCDS75 SFPSMPSPRLQHSKPPRRLSRAQKHSSGSSNTSTANRSTHNELEKNRRAHLRLCLERLKV
100 110 120 130 140 150
80 90 100 110 120 130
pF1KB9 LVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALSIKEQLQQEHRFLKRRLEQLS-VQS
:.::::: ::::::.::..::.::::::: .:.. :.:..:.:::: :::::. :
CCDS75 LIPLGPDCTRHTTLGLLNKAKAHIKKLEEAERKSQHQLENLEREQRFLKWRLEQLQGPQE
160 170 180 190 200 210
140 150 160 170 180 190
pF1KB9 VERVRTDSTGSAVSTD--DSEQE---VDIEGMEFGPGELDSVGSSS--DADDHYSLQSGT
.::.: :: ::..:.: :::.: ::.:. ::. ::.:.....: : ::: :: :
CCDS75 MERIRMDSIGSTISSDRSDSEREEIEVDVESTEFSHGEVDNISTTSISDIDDHSSLPS-I
220 230 240 250 260 270
200
pF1KB9 GGDSGFGPHCRRLGRPALS
:.: :.. .:
CCDS75 GSDEGYSSASVKLSFTS
280 290
>>CCDS31284.1 MXI1 gene_id:4601|Hs108|chr10 (182 aa)
initn: 468 init1: 285 opt: 470 Z-score: 460.2 bits: 91.9 E(32554): 2.6e-19
Smith-Waterman score: 470; 50.9% identity (73.9% similar) in 165 aa overlap (47-203:15-178)
20 30 40 50 60 70
pF1KB9 ERRDREAEHGYASVLPFDGDFAREKTKAAGLVRKAPNNRSSHNELEKHRRAKLRLYLEQL
: : .. .: : .:::.::: ::.:
CCDS31 MPSPRLQHSKPPRRLSRAQKHSSGSSNTSTANRRAHLRLCLERL
10 20 30 40
80 90 100 110 120 130
pF1KB9 KQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALSIKEQLQQEHRFLKRRLEQLS-V
: :.::::: ::::::.::..::.::::::: .:.. :.:..:.:::: :::::.
CCDS31 KVLIPLGPDCTRHTTLGLLNKAKAHIKKLEEAERKSQHQLENLEREQRFLKWRLEQLQGP
50 60 70 80 90 100
140 150 160 170 180
pF1KB9 QSVERVRTDSTGSAVSTD--DSEQE---VDIEGMEFGPGELDSVGSSS--DADDHYSLQS
: .::.: :: ::..:.: :::.: ::.:. ::. ::.:.....: : ::: :: :
CCDS31 QEMERIRMDSIGSTISSDRSDSEREEIEVDVESTEFSHGEVDNISTTSISDIDDHSSLPS
110 120 130 140 150 160
190 200
pF1KB9 GTGGDSGFGPHCRRLGRPALS
:.: :.. .:
CCDS31 -IGSDEGYSSASVKLSFTS
170 180
>>CCDS47347.1 MXD3 gene_id:83463|Hs108|chr5 (193 aa)
initn: 418 init1: 304 opt: 455 Z-score: 445.6 bits: 89.3 E(32554): 1.7e-18
Smith-Waterman score: 455; 42.6% identity (73.9% similar) in 188 aa overlap (4-184:6-193)
10 20 30 40 50
pF1KB9 MELNSLLILLEAAEYLERRDREAEHGYASVLPF--DGDFAREKTKAAGLVRKAPNNRS
... .::.:::.::::.:::::::::. : : . :.: . ..::
CCDS47 MEPLASNIQVLLQAAEFLERREREAEHGYASLCPHRSPGPIHRRKKRPPQAPGAQDSGRS
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB9 SHNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALSIK
::::::.:::.:. ::.::: .::: : .:.::::::.::..::.:::.:..:: ..:
CCDS47 VHNELEKRRRAQLKRCLERLKQQMPLGADCARYTTLSLLRRARMHIQKLEDQEQRARQLK
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB9 EQLQQEHRFLKRRLEQL----SVQSVERVRTDSTGSA-VSTDDSEQEVDIEGMEFGPGEL
:.:..... :.:.:::: .. ::.:.:: :. .:.. :... . . . : .
CCDS47 ERLRSKQQSLQRQLEQLRGLAGAAERERLRADSLDSSGLSSERSDSDQVLPNENGGTPNH
130 140 150 160 170 180
180 190 200
pF1KB9 DSVGSSSDADDHYSLQSGTGGDSGFGPHCRRLGRPALS
.: ... ..:.
CCDS47 RPTGRGNNISSHH
190
>>CCDS4416.1 MXD3 gene_id:83463|Hs108|chr5 (206 aa)
initn: 462 init1: 304 opt: 454 Z-score: 444.3 bits: 89.2 E(32554): 2e-18
Smith-Waterman score: 484; 45.5% identity (73.5% similar) in 200 aa overlap (4-191:6-203)
10 20 30 40 50
pF1KB9 MELNSLLILLEAAEYLERRDREAEHGYASVLPF--DGDFAREKTKAAGLVRKAPNNRS
... .::.:::.::::.:::::::::. : : . :.: . ..::
CCDS44 MEPLASNIQVLLQAAEFLERREREAEHGYASLCPHRSPGPIHRRKKRPPQAPGAQDSGRS
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB9 SHNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALSIK
::::::.:::.:. ::.::: .::: : .:.::::::.::..::.:::.:..:: ..:
CCDS44 VHNELEKRRRAQLKRCLERLKQQMPLGADCARYTTLSLLRRARMHIQKLEDQEQRARQLK
70 80 90 100 110 120
120 130 140 150 160
pF1KB9 EQLQQEHRFLKRRLEQL----SVQSVERVRTDSTGSA-VSTD--DSEQE---VDIEGMEF
:.:..... :.:.:::: .. ::.:.:: :. .:.. ::.:: ::.:.. :
CCDS44 ERLRSKQQSLQRQLEQLRGLAGAAERERLRADSLDSSGLSSERSDSDQEELEVDVESLVF
130 140 150 160 170 180
170 180 190 200
pF1KB9 GPGELDSVGSSSDADDHYSLQSGTGGDSGFGPHCRRLGRPALS
: :: . . . ...: : . : :
CCDS44 G-GEAELLRGFVAGQEH-SYSHGGGAWL
190 200
>>CCDS56123.1 MXD1 gene_id:4084|Hs108|chr2 (211 aa)
initn: 512 init1: 338 opt: 439 Z-score: 430.0 bits: 86.6 E(32554): 1.2e-17
Smith-Waterman score: 562; 52.5% identity (75.8% similar) in 198 aa overlap (5-196:8-191)
10 20 30 40 50
pF1KB9 MELNSLLILLEAAEYLERRDREAEHGYASVLPFDGDFAREKTKAAGLVRKAPNNRSS
.. .:::::.:::::.:::::::::.::... :. : . .: :: ::
CCDS56 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNK-DRDALKRRNKSKK--NNSSS
10 20 30 40 50
60 70 80 90 100 110
pF1KB9 HNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALSIKE
:::.::: ::.:: ::::::.:.:::::::: .::.::::::. ::.:. .
CCDS56 -------RRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVHQID
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB9 QLQQEHRFLKRRLEQLSVQSVERVRTDSTGSAVSTD--DSEQE---VDIEGMEFGPGELD
:::.:.: :::.::.: ..::.: :: ::.::.. ::..: ::.:. .. :.::
CCDS56 QLQREQRHLKRQLEKL---GIERIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTGDLD
120 130 140 150 160
180 190 200
pF1KB9 -SVGSSSDADDHYSLQSGTGGDSGFGPHCRRLGRPALS
: .: ::.:.. :.:: :.: :.
CCDS56 WSSSSVSDSDERGSMQS-LGSDEGYSSTSIKRIKLQDSHKACLGL
170 180 190 200 210
209 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 18:53:53 2016 done: Fri Nov 4 18:53:53 2016
Total Scan time: 2.020 Total Display time: -0.020
Function used was FASTA [36.3.4 Apr, 2011]