FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7583, 221 aa
1>>>pF1KB7583 221 - 221 aa - 221 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.9348+/-0.000884; mu= 7.4152+/- 0.054
mean_var=117.4885+/-22.995, 0's: 0 Z-trim(109.6): 27 B-trim: 0 in 0/53
Lambda= 0.118325
statistics sampled from 10979 (11000) to 10979 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.701), E-opt: 0.2 (0.338), width: 16
Scan time: 1.800
The best scores are: opt bits E(32554)
CCDS1896.1 MXD1 gene_id:4084|Hs108|chr2 ( 221) 1420 252.7 1.3e-67
CCDS56123.1 MXD1 gene_id:4084|Hs108|chr2 ( 211) 1008 182.4 1.9e-46
CCDS7564.2 MXI1 gene_id:4601|Hs108|chr10 ( 228) 672 125.0 3.7e-29
CCDS7563.1 MXI1 gene_id:4601|Hs108|chr10 ( 295) 672 125.1 4.6e-29
CCDS3361.1 MXD4 gene_id:10608|Hs108|chr4 ( 209) 621 116.3 1.5e-26
CCDS31284.1 MXI1 gene_id:4601|Hs108|chr10 ( 182) 619 115.9 1.6e-26
CCDS4416.1 MXD3 gene_id:83463|Hs108|chr5 ( 206) 527 100.3 9.8e-22
CCDS47347.1 MXD3 gene_id:83463|Hs108|chr5 ( 193) 482 92.6 1.9e-19
>>CCDS1896.1 MXD1 gene_id:4084|Hs108|chr2 (221 aa)
initn: 1420 init1: 1420 opt: 1420 Z-score: 1327.1 bits: 252.7 E(32554): 1.3e-67
Smith-Waterman score: 1420; 100.0% identity (100.0% similar) in 221 aa overlap (1-221:1-221)
10 20 30 40 50 60
pF1KB7 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSKKNNSSSRST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSKKNNSSSRST
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 HNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVHQID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 HNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVHQID
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 QLQREQRHLKRQLEKLGIERIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTGDLDWSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 QLQREQRHLKRQLEKLGIERIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTGDLDWSS
130 140 150 160 170 180
190 200 210 220
pF1KB7 SSVSDSDERGSMQSLGSDEGYSSTSIKRIKLQDSHKACLGL
:::::::::::::::::::::::::::::::::::::::::
CCDS18 SSVSDSDERGSMQSLGSDEGYSSTSIKRIKLQDSHKACLGL
190 200 210 220
>>CCDS56123.1 MXD1 gene_id:4084|Hs108|chr2 (211 aa)
initn: 1001 init1: 1001 opt: 1008 Z-score: 947.3 bits: 182.4 E(32554): 1.9e-46
Smith-Waterman score: 1324; 95.5% identity (95.5% similar) in 221 aa overlap (1-221:1-211)
10 20 30 40 50 60
pF1KB7 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSKKNNSSSRST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSKKNNSSSR--
10 20 30 40 50
70 80 90 100 110 120
pF1KB7 HNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVHQID
::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 --------RAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVHQID
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB7 QLQREQRHLKRQLEKLGIERIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTGDLDWSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 QLQREQRHLKRQLEKLGIERIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTGDLDWSS
120 130 140 150 160 170
190 200 210 220
pF1KB7 SSVSDSDERGSMQSLGSDEGYSSTSIKRIKLQDSHKACLGL
:::::::::::::::::::::::::::::::::::::::::
CCDS56 SSVSDSDERGSMQSLGSDEGYSSTSIKRIKLQDSHKACLGL
180 190 200 210
>>CCDS7564.2 MXI1 gene_id:4601|Hs108|chr10 (228 aa)
initn: 777 init1: 377 opt: 672 Z-score: 636.9 bits: 125.0 E(32554): 3.7e-29
Smith-Waterman score: 784; 59.1% identity (81.4% similar) in 220 aa overlap (5-207:4-223)
10 20 30 40 50
pF1KB7 MAAAVRM-NIQMLLEAADYLERREREAEHGYASMLPYNNKDR----DALKRRNKSKKNNS
:.: :.: :::::..::::::: :::::: .: . : .: ....:..:
CCDS75 MERVKMINVQRLLEAAEFLERRERECEHGYASSFPSMPSPRLQHSKPPRRLSRAQKHSS
10 20 30 40 50
60 70 80 90 100
pF1KB7 SS-------RSTHNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKL
.: ::::::.:::::::::::::.:: :.::::. .:::::.::.::: :::::
CCDS75 GSSNTSTANRSTHNELEKNRRAHLRLCLERLKVLIPLGPDCTRHTTLGLLNKAKAHIKKL
60 70 80 90 100 110
110 120 130 140 150 160
pF1KB7 EDCDRKAVHQIDQLQREQRHLKRQLEKLG----IERIRMDSIGSTVSSERSDSDREEIDV
:. .::. ::...:.:::: :: .::.: .:::::::::::.::.::::.::::.:
CCDS75 EEAERKSQHQLENLEREQRFLKWRLEQLQGPQEMERIRMDSIGSTISSDRSDSEREEIEV
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB7 DVESTDYLTGDLD-WSSSSVSDSDERGSMQSLGSDEGYSSTSIKRIKLQDSHKACLGL
:::::.. :..: :..:.:: :...:. :.::::::::.:.:
CCDS75 DVESTEFSHGEVDNISTTSISDIDDHSSLPSIGSDEGYSSASVKLSFTS
180 190 200 210 220
>>CCDS7563.1 MXI1 gene_id:4601|Hs108|chr10 (295 aa)
initn: 708 init1: 377 opt: 672 Z-score: 635.2 bits: 125.1 E(32554): 4.6e-29
Smith-Waterman score: 750; 57.5% identity (80.4% similar) in 219 aa overlap (8-207:72-290)
10 20 30
pF1KB7 MAAAVRMNIQMLLEAADYLERREREA---EHGYASML
:.:.:::::.:::. :.: :::::: .
CCDS75 PAGAKPRCPFSDIFNTSENSMEKHINTFLQNVQILLEAASYLEQIEKENKKCEHGYASSF
50 60 70 80 90 100
40 50 60 70 80
pF1KB7 PYNNKDR----DALKRRNKSKKNNSSS-------RSTHNEMEKNRRAHLRLCLEKLKGLV
: . : .: ....:..:.: ::::::.:::::::::::::.:: :.
CCDS75 PSMPSPRLQHSKPPRRLSRAQKHSSGSSNTSTANRSTHNELEKNRRAHLRLCLERLKVLI
110 120 130 140 150 160
90 100 110 120 130
pF1KB7 PLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVHQIDQLQREQRHLKRQLEKLG----IE
::::. .:::::.::.::: ::::::. .::. ::...:.:::: :: .::.: .:
CCDS75 PLGPDCTRHTTLGLLNKAKAHIKKLEEAERKSQHQLENLEREQRFLKWRLEQLQGPQEME
170 180 190 200 210 220
140 150 160 170 180 190
pF1KB7 RIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTGDLD-WSSSSVSDSDERGSMQSLGSD
::::::::::.::.::::.::::.::::::.. :..: :..:.:: :...:. :.:::
CCDS75 RIRMDSIGSTISSDRSDSEREEIEVDVESTEFSHGEVDNISTTSISDIDDHSSLPSIGSD
230 240 250 260 270 280
200 210 220
pF1KB7 EGYSSTSIKRIKLQDSHKACLGL
:::::.:.:
CCDS75 EGYSSASVKLSFTS
290
>>CCDS3361.1 MXD4 gene_id:10608|Hs108|chr4 (209 aa)
initn: 559 init1: 519 opt: 621 Z-score: 590.4 bits: 116.3 E(32554): 1.5e-26
Smith-Waterman score: 621; 53.2% identity (79.6% similar) in 201 aa overlap (8-201:5-196)
10 20 30 40 50
pF1KB7 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSK---KNNSSS
.. .:::::.:::::.:::::::::.::. : : ....:. .. ..
CCDS33 MELNSLLILLEAAEYLERRDREAEHGYASVLPF---DGDFAREKTKAAGLVRKAPNN
10 20 30 40 50
60 70 80 90 100 110
pF1KB7 RSTHNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVH
::.:::.::.:::.::: ::.:: ::::::.:.:::::::: .::.::::::. ::.:.
CCDS33 RSSHNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALS
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB7 QIDQLQREQRHLKRQLEKLGI---ERIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTG
.:::.:.: :::.::.:.. ::.: :: ::.::.. ::..: ::.:. .. :
CCDS33 IKEQLQQEHRFLKRRLEQLSVQSVERVRTDSTGSAVSTD--DSEQE---VDIEGMEFGPG
120 130 140 150 160
180 190 200 210 220
pF1KB7 DLDWSSSSVSDSDERGSMQS-LGSDEGYSSTSIKRIKLQDSHKACLGL
.:: : .: ::.:.. :.:: :.: :.
CCDS33 ELD-SVGSSSDADDHYSLQSGTGGDSGFGPHCRRLGRPALS
170 180 190 200
>>CCDS31284.1 MXI1 gene_id:4601|Hs108|chr10 (182 aa)
initn: 614 init1: 322 opt: 619 Z-score: 589.4 bits: 115.9 E(32554): 1.6e-26
Smith-Waterman score: 619; 58.9% identity (85.1% similar) in 168 aa overlap (45-207:13-177)
20 30 40 50 60 70
pF1KB7 AADYLERREREAEHGYASMLPYNNKDRDALKRRNKSKKNNSSSRSTHNEMEKNRRAHLRL
.: ....:..:.: .: . ::::::::
CCDS31 MPSPRLQHSKPPRRLSRAQKHSSGSSNTSTA---NRRAHLRL
10 20 30
80 90 100 110 120 130
pF1KB7 CLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVHQIDQLQREQRHLKRQLE
:::.:: :.::::. .:::::.::.::: ::::::. .::. ::...:.:::: :: .::
CCDS31 CLERLKVLIPLGPDCTRHTTLGLLNKAKAHIKKLEEAERKSQHQLENLEREQRFLKWRLE
40 50 60 70 80 90
140 150 160 170 180
pF1KB7 KLG----IERIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTGDLD-WSSSSVSDSDER
.: .:::::::::::.::.::::.::::.::::::.. :..: :..:.:: :..
CCDS31 QLQGPQEMERIRMDSIGSTISSDRSDSEREEIEVDVESTEFSHGEVDNISTTSISDIDDH
100 110 120 130 140 150
190 200 210 220
pF1KB7 GSMQSLGSDEGYSSTSIKRIKLQDSHKACLGL
.:. :.::::::::.:.:
CCDS31 SSLPSIGSDEGYSSASVKLSFTS
160 170 180
>>CCDS4416.1 MXD3 gene_id:83463|Hs108|chr5 (206 aa)
initn: 574 init1: 295 opt: 527 Z-score: 503.7 bits: 100.3 E(32554): 9.8e-22
Smith-Waterman score: 527; 52.0% identity (79.2% similar) in 173 aa overlap (8-168:7-177)
10 20 30 40 50
pF1KB7 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSKKN----NSS
:::.::.::..::::::::::::::. :. .. ..::.: . ..:
CCDS44 MEPLASNIQVLLQAAEFLERREREAEHGYASLCPH--RSPGPIHRRKKRPPQAPGAQDS
10 20 30 40 50
60 70 80 90 100 110
pF1KB7 SRSTHNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAV
.::.:::.:: :::.:. :::.:: .::: . .:.:::::: .:..::.:::: ...:
CCDS44 GRSVHNELEKRRRAQLKRCLERLKQQMPLGADCARYTTLSLLRRARMHIQKLEDQEQRAR
60 70 80 90 100 110
120 130 140 150 160
pF1KB7 HQIDQLQREQRHLKRQLEKL-GI------ERIRMDSIGST-VSSERSDSDREEIDVDVES
. ..:. .:. :.::::.: :. ::.: ::. :. .::::::::.::..:::::
CCDS44 QLKERLRSKQQSLQRQLEQLRGLAGAAERERLRADSLDSSGLSSERSDSDQEELEVDVES
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB7 TDYLTGDLDWSSSSVSDSDERGSMQSLGSDEGYSSTSIKRIKLQDSHKACLGL
CCDS44 LVFGGEAELLRGFVAGQEHSYSHGGGAWL
180 190 200
>>CCDS47347.1 MXD3 gene_id:83463|Hs108|chr5 (193 aa)
initn: 509 init1: 295 opt: 482 Z-score: 462.6 bits: 92.6 E(32554): 1.9e-19
Smith-Waterman score: 482; 50.6% identity (78.0% similar) in 164 aa overlap (8-159:7-168)
10 20 30 40 50
pF1KB7 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSKKN----NSS
:::.::.::..::::::::::::::. :. .. ..::.: . ..:
CCDS47 MEPLASNIQVLLQAAEFLERREREAEHGYASLCPH--RSPGPIHRRKKRPPQAPGAQDS
10 20 30 40 50
60 70 80 90 100 110
pF1KB7 SRSTHNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAV
.::.:::.:: :::.:. :::.:: .::: . .:.:::::: .:..::.:::: ...:
CCDS47 GRSVHNELEKRRRAQLKRCLERLKQQMPLGADCARYTTLSLLRRARMHIQKLEDQEQRAR
60 70 80 90 100 110
120 130 140 150 160
pF1KB7 HQIDQLQREQRHLKRQLEKL-GI------ERIRMDSIGST-VSSERSDSDREEIDVDVES
. ..:. .:. :.::::.: :. ::.: ::. :. .::::::::.
CCDS47 QLKERLRSKQQSLQRQLEQLRGLAGAAERERLRADSLDSSGLSSERSDSDQVLPNENGGT
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB7 TDYLTGDLDWSSSSVSDSDERGSMQSLGSDEGYSSTSIKRIKLQDSHKACLGL
CCDS47 PNHRPTGRGNNISSHH
180 190
221 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 08:50:35 2016 done: Fri Nov 4 08:50:35 2016
Total Scan time: 1.800 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]