FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9782, 209 aa
1>>>pF1KB9782 209 - 209 aa - 209 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.5882+/-0.000321; mu= 8.7458+/- 0.020
mean_var=118.3953+/-23.906, 0's: 0 Z-trim(119.1): 46 B-trim: 1845 in 1/51
Lambda= 0.117871
statistics sampled from 32706 (32754) to 32706 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.745), E-opt: 0.2 (0.384), width: 16
Scan time: 6.610
The best scores are: opt bits E(85289)
NP_001189442 (OMIM: 600021) max dimerization prote ( 220) 623 116.1 4.4e-26
NP_002348 (OMIM: 600021) max dimerization protein ( 221) 621 115.8 5.5e-26
NP_005953 (OMIM: 176807,600020) max-interacting pr ( 228) 529 100.1 2.9e-21
NP_569157 (OMIM: 176807,600020) max-interacting pr ( 295) 529 100.2 3.6e-21
NP_001008541 (OMIM: 176807,600020) max-interacting ( 182) 470 90.0 2.6e-18
NP_001136407 (OMIM: 609450) max dimerization prote ( 193) 455 87.5 1.6e-17
NP_112590 (OMIM: 609450) max dimerization protein ( 206) 454 87.4 1.9e-17
NP_001189443 (OMIM: 600021) max dimerization prote ( 211) 439 84.8 1.1e-16
>>NP_001189442 (OMIM: 600021) max dimerization protein 1 (220 aa)
initn: 606 init1: 495 opt: 623 Z-score: 589.3 bits: 116.1 E(85289): 4.4e-26
Smith-Waterman score: 623; 53.5% identity (80.0% similar) in 200 aa overlap (5-196:8-200)
10 20 30 40 50
pF1KB9 MELNSLLILLEAAEYLERRDREAEHGYASVLPF---DGDFAREKTKAAGLVRKAPNN
.. .:::::.:::::.:::::::::.::. : : ....:. .. ..
NP_001 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSK---KNNSSS
10 20 30 40 50
60 70 80 90 100 110
pF1KB9 RSSHNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALS
::.:::.::.:::.::: ::.:: ::::::.:.:::::::: .::.::::::. ::.:.
NP_001 RSTHNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVH
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB9 IKEQLQQEHRFLKRRLEQLSVQSVERVRTDSTGSAVSTD--DSEQE--VDIEGMEFGPGE
.:::.:.: :::.::.: ..::.: :: ::.::.. ::..: ::.:. .. :.
NP_001 QIDQLQREQRHLKRQLEKL---GIERIRMDSIGSTVSSERSDSDREIDVDVESTDYLTGD
120 130 140 150 160 170
180 190 200
pF1KB9 LD-SVGSSSDADDHYSLQSGTGGDSGFGPHCRRLGRPALS
:: : .: ::.:.. :.:: :.: :.
NP_001 LDWSSSSVSDSDERGSMQS-LGSDEGYSSTSIKRIKLQDSHKACLGL
180 190 200 210 220
>>NP_002348 (OMIM: 600021) max dimerization protein 1 is (221 aa)
initn: 559 init1: 519 opt: 621 Z-score: 587.5 bits: 115.8 E(85289): 5.5e-26
Smith-Waterman score: 621; 53.2% identity (79.6% similar) in 201 aa overlap (5-196:8-201)
10 20 30 40 50
pF1KB9 MELNSLLILLEAAEYLERRDREAEHGYASVLPF---DGDFAREKTKAAGLVRKAPNN
.. .:::::.:::::.:::::::::.::. : : ....:. .. ..
NP_002 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSK---KNNSSS
10 20 30 40 50
60 70 80 90 100 110
pF1KB9 RSSHNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALS
::.:::.::.:::.::: ::.:: ::::::.:.:::::::: .::.::::::. ::.:.
NP_002 RSTHNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVH
60 70 80 90 100 110
120 130 140 150 160
pF1KB9 IKEQLQQEHRFLKRRLEQLSVQSVERVRTDSTGSAVSTD--DSEQE---VDIEGMEFGPG
.:::.:.: :::.::.: ..::.: :: ::.::.. ::..: ::.:. .. :
NP_002 QIDQLQREQRHLKRQLEKL---GIERIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTG
120 130 140 150 160 170
170 180 190 200
pF1KB9 ELD-SVGSSSDADDHYSLQSGTGGDSGFGPHCRRLGRPALS
.:: : .: ::.:.. :.:: :.: :.
NP_002 DLDWSSSSVSDSDERGSMQS-LGSDEGYSSTSIKRIKLQDSHKACLGL
180 190 200 210 220
>>NP_005953 (OMIM: 176807,600020) max-interacting protei (228 aa)
initn: 626 init1: 346 opt: 529 Z-score: 502.7 bits: 100.1 E(85289): 2.9e-21
Smith-Waterman score: 614; 51.4% identity (73.4% similar) in 214 aa overlap (9-203:12-224)
10 20 30 40
pF1KB9 MELNSLLILLEAAEYLERRDREAEHGYASVLPFDGD-----------FAREKTKAAG
::::::.::::.:: :::::: .: . ..: . ...:
NP_005 MERVKMINVQRLLEAAEFLERRERECEHGYASSFPSMPSPRLQHSKPPRRLSRAQKHSSG
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB9 LVRKAPNNRSSHNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLE
. :::.::::::.:::.::: ::.:: :.::::: ::::::.::..::.::::::
NP_005 SSNTSTANRSTHNELEKNRRAHLRLCLERLKVLIPLGPDCTRHTTLGLLNKAKAHIKKLE
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB9 EQDRRALSIKEQLQQEHRFLKRRLEQLS-VQSVERVRTDSTGSAVSTD--DSEQE---VD
: .:.. :.:..:.:::: :::::. : .::.: :: ::..:.: :::.: ::
NP_005 EAERKSQHQLENLEREQRFLKWRLEQLQGPQEMERIRMDSIGSTISSDRSDSEREEIEVD
130 140 150 160 170 180
170 180 190 200
pF1KB9 IEGMEFGPGELDSVGSSS--DADDHYSLQSGTGGDSGFGPHCRRLGRPALS
.:. ::. ::.:.....: : ::: :: : :.: :.. .:
NP_005 VESTEFSHGEVDNISTTSISDIDDHSSLPS-IGSDEGYSSASVKLSFTS
190 200 210 220
>>NP_569157 (OMIM: 176807,600020) max-interacting protei (295 aa)
initn: 615 init1: 346 opt: 529 Z-score: 501.2 bits: 100.2 E(85289): 3.6e-21
Smith-Waterman score: 585; 48.4% identity (72.2% similar) in 223 aa overlap (3-203:70-291)
10 20
pF1KB9 MELNSLLILLEAAEYLE---RRDREAEHGYAS
:... :::::: ::: ..... ::::::
NP_569 EDPAGAKPRCPFSDIFNTSENSMEKHINTFLQNVQILLEAASYLEQIEKENKKCEHGYAS
40 50 60 70 80 90
30 40 50 60 70
pF1KB9 VLPFDGD-----------FAREKTKAAGLVRKAPNNRSSHNELEKHRRAKLRLYLEQLKQ
.: . ..: . ...: . :::.::::::.:::.::: ::.::
NP_569 SFPSMPSPRLQHSKPPRRLSRAQKHSSGSSNTSTANRSTHNELEKNRRAHLRLCLERLKV
100 110 120 130 140 150
80 90 100 110 120 130
pF1KB9 LVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALSIKEQLQQEHRFLKRRLEQLS-VQS
:.::::: ::::::.::..::.::::::: .:.. :.:..:.:::: :::::. :
NP_569 LIPLGPDCTRHTTLGLLNKAKAHIKKLEEAERKSQHQLENLEREQRFLKWRLEQLQGPQE
160 170 180 190 200 210
140 150 160 170 180 190
pF1KB9 VERVRTDSTGSAVSTD--DSEQE---VDIEGMEFGPGELDSVGSSS--DADDHYSLQSGT
.::.: :: ::..:.: :::.: ::.:. ::. ::.:.....: : ::: :: :
NP_569 MERIRMDSIGSTISSDRSDSEREEIEVDVESTEFSHGEVDNISTTSISDIDDHSSLPS-I
220 230 240 250 260 270
200
pF1KB9 GGDSGFGPHCRRLGRPALS
:.: :.. .:
NP_569 GSDEGYSSASVKLSFTS
280 290
>>NP_001008541 (OMIM: 176807,600020) max-interacting pro (182 aa)
initn: 468 init1: 285 opt: 470 Z-score: 449.9 bits: 90.0 E(85289): 2.6e-18
Smith-Waterman score: 470; 50.9% identity (73.9% similar) in 165 aa overlap (47-203:15-178)
20 30 40 50 60 70
pF1KB9 ERRDREAEHGYASVLPFDGDFAREKTKAAGLVRKAPNNRSSHNELEKHRRAKLRLYLEQL
: : .. .: : .:::.::: ::.:
NP_001 MPSPRLQHSKPPRRLSRAQKHSSGSSNTSTANRRAHLRLCLERL
10 20 30 40
80 90 100 110 120 130
pF1KB9 KQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALSIKEQLQQEHRFLKRRLEQLS-V
: :.::::: ::::::.::..::.::::::: .:.. :.:..:.:::: :::::.
NP_001 KVLIPLGPDCTRHTTLGLLNKAKAHIKKLEEAERKSQHQLENLEREQRFLKWRLEQLQGP
50 60 70 80 90 100
140 150 160 170 180
pF1KB9 QSVERVRTDSTGSAVSTD--DSEQE---VDIEGMEFGPGELDSVGSSS--DADDHYSLQS
: .::.: :: ::..:.: :::.: ::.:. ::. ::.:.....: : ::: :: :
NP_001 QEMERIRMDSIGSTISSDRSDSEREEIEVDVESTEFSHGEVDNISTTSISDIDDHSSLPS
110 120 130 140 150 160
190 200
pF1KB9 GTGGDSGFGPHCRRLGRPALS
:.: :.. .:
NP_001 -IGSDEGYSSASVKLSFTS
170 180
>>NP_001136407 (OMIM: 609450) max dimerization protein 3 (193 aa)
initn: 418 init1: 304 opt: 455 Z-score: 435.7 bits: 87.5 E(85289): 1.6e-17
Smith-Waterman score: 455; 42.6% identity (73.9% similar) in 188 aa overlap (4-184:6-193)
10 20 30 40 50
pF1KB9 MELNSLLILLEAAEYLERRDREAEHGYASVLPF--DGDFAREKTKAAGLVRKAPNNRS
... .::.:::.::::.:::::::::. : : . :.: . ..::
NP_001 MEPLASNIQVLLQAAEFLERREREAEHGYASLCPHRSPGPIHRRKKRPPQAPGAQDSGRS
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB9 SHNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALSIK
::::::.:::.:. ::.::: .::: : .:.::::::.::..::.:::.:..:: ..:
NP_001 VHNELEKRRRAQLKRCLERLKQQMPLGADCARYTTLSLLRRARMHIQKLEDQEQRARQLK
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB9 EQLQQEHRFLKRRLEQL----SVQSVERVRTDSTGSA-VSTDDSEQEVDIEGMEFGPGEL
:.:..... :.:.:::: .. ::.:.:: :. .:.. :... . . . : .
NP_001 ERLRSKQQSLQRQLEQLRGLAGAAERERLRADSLDSSGLSSERSDSDQVLPNENGGTPNH
130 140 150 160 170 180
180 190 200
pF1KB9 DSVGSSSDADDHYSLQSGTGGDSGFGPHCRRLGRPALS
.: ... ..:.
NP_001 RPTGRGNNISSHH
190
>>NP_112590 (OMIM: 609450) max dimerization protein 3 is (206 aa)
initn: 462 init1: 304 opt: 454 Z-score: 434.4 bits: 87.4 E(85289): 1.9e-17
Smith-Waterman score: 484; 45.5% identity (73.5% similar) in 200 aa overlap (4-191:6-203)
10 20 30 40 50
pF1KB9 MELNSLLILLEAAEYLERRDREAEHGYASVLPF--DGDFAREKTKAAGLVRKAPNNRS
... .::.:::.::::.:::::::::. : : . :.: . ..::
NP_112 MEPLASNIQVLLQAAEFLERREREAEHGYASLCPHRSPGPIHRRKKRPPQAPGAQDSGRS
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB9 SHNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALSIK
::::::.:::.:. ::.::: .::: : .:.::::::.::..::.:::.:..:: ..:
NP_112 VHNELEKRRRAQLKRCLERLKQQMPLGADCARYTTLSLLRRARMHIQKLEDQEQRARQLK
70 80 90 100 110 120
120 130 140 150 160
pF1KB9 EQLQQEHRFLKRRLEQL----SVQSVERVRTDSTGSA-VSTD--DSEQE---VDIEGMEF
:.:..... :.:.:::: .. ::.:.:: :. .:.. ::.:: ::.:.. :
NP_112 ERLRSKQQSLQRQLEQLRGLAGAAERERLRADSLDSSGLSSERSDSDQEELEVDVESLVF
130 140 150 160 170 180
170 180 190 200
pF1KB9 GPGELDSVGSSSDADDHYSLQSGTGGDSGFGPHCRRLGRPALS
: :: . . . ...: : . : :
NP_112 G-GEAELLRGFVAGQEH-SYSHGGGAWL
190 200
>>NP_001189443 (OMIM: 600021) max dimerization protein 1 (211 aa)
initn: 512 init1: 338 opt: 439 Z-score: 420.5 bits: 84.8 E(85289): 1.1e-16
Smith-Waterman score: 562; 52.5% identity (75.8% similar) in 198 aa overlap (5-196:8-191)
10 20 30 40 50
pF1KB9 MELNSLLILLEAAEYLERRDREAEHGYASVLPFDGDFAREKTKAAGLVRKAPNNRSS
.. .:::::.:::::.:::::::::.::... :. : . .: :: ::
NP_001 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNK-DRDALKRRNKSKK--NNSSS
10 20 30 40 50
60 70 80 90 100 110
pF1KB9 HNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALSIKE
:::.::: ::.:: ::::::.:.:::::::: .::.::::::. ::.:. .
NP_001 -------RRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVHQID
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB9 QLQQEHRFLKRRLEQLSVQSVERVRTDSTGSAVSTD--DSEQE---VDIEGMEFGPGELD
:::.:.: :::.::.: ..::.: :: ::.::.. ::..: ::.:. .. :.::
NP_001 QLQREQRHLKRQLEKL---GIERIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTGDLD
120 130 140 150 160
180 190 200
pF1KB9 -SVGSSSDADDHYSLQSGTGGDSGFGPHCRRLGRPALS
: .: ::.:.. :.:: :.: :.
NP_001 WSSSSVSDSDERGSMQS-LGSDEGYSSTSIKRIKLQDSHKACLGL
170 180 190 200 210
209 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 18:53:53 2016 done: Fri Nov 4 18:53:54 2016
Total Scan time: 6.610 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]