FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB8985, 387 aa
1>>>pF1KB8985 387 - 387 aa - 387 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.5883+/-0.000934; mu= 3.0606+/- 0.055
mean_var=265.7092+/-56.068, 0's: 0 Z-trim(114.4): 857 B-trim: 0 in 0/52
Lambda= 0.078681
statistics sampled from 13999 (14974) to 13999 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.791), E-opt: 0.2 (0.46), width: 16
Scan time: 3.110
The best scores are: opt bits E(32554)
CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8 ( 387) 2704 319.9 2.4e-87
CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8 ( 349) 2380 283.1 2.6e-76
CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5 ( 543) 968 123.0 6.3e-28
CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10 ( 426) 768 100.2 3.7e-21
CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10 ( 476) 768 100.3 3.9e-21
CCDS1925.2 EGR4 gene_id:1961|Hs108|chr2 ( 589) 574 78.3 1.9e-14
>>CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8 (387 aa)
initn: 2704 init1: 2704 opt: 2704 Z-score: 1681.6 bits: 319.9 E(32554): 2.4e-87
Smith-Waterman score: 2704; 100.0% identity (100.0% similar) in 387 aa overlap (1-387:1-387)
10 20 30 40 50 60
pF1KB8 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSGSSDSVVHYNQMATENVMDIGLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSGSSDSVVHYNQMATENVMDIGLT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 NEKPNPELSYSGSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISLMSAGILGVPPASGAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 NEKPNPELSYSGSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISLMSAGILGVPPASGAL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 STQTSTASMVQPPQGDVEAMYPALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQSAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 STQTSTASMVQPPQGDVEAMYPALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQSAK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB8 PALDSNLFPMIPDYNLYHHPNDMGSIPEHKPFQGMDPIRVNPPPITPLETIKAFKDKQIH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 PALDSNLFPMIPDYNLYHHPNDMGSIPEHKPFQGMDPIRVNPPPITPLETIKAFKDKQIH
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB8 PGFGSLPQPPLTLKPIRPRKYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 PGFGSLPQPPLTLKPIRPRKYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHT
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB8 GHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 GHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKE
310 320 330 340 350 360
370 380
pF1KB8 KKAEKGGAPSASSAPPVSLAPVVTTCA
:::::::::::::::::::::::::::
CCDS60 KKAEKGGAPSASSAPPVSLAPVVTTCA
370 380
>>CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8 (349 aa)
initn: 2380 init1: 2380 opt: 2380 Z-score: 1483.4 bits: 283.1 E(32554): 2.6e-76
Smith-Waterman score: 2380; 100.0% identity (100.0% similar) in 336 aa overlap (52-387:14-349)
30 40 50 60 70 80
pF1KB8 DNLYPEEIPSALNLFSGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYSGSFQPAPGNK
::::::::::::::::::::::::::::::
CCDS56 MEPCAAWSPRGGRENVMDIGLTNEKPNPELSYSGSFQPAPGNK
10 20 30 40
90 100 110 120 130 140
pF1KB8 TVTYLGKFAFDSPSNWCQDNIISLMSAGILGVPPASGALSTQTSTASMVQPPQGDVEAMY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 TVTYLGKFAFDSPSNWCQDNIISLMSAGILGVPPASGALSTQTSTASMVQPPQGDVEAMY
50 60 70 80 90 100
150 160 170 180 190 200
pF1KB8 PALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQSAKPALDSNLFPMIPDYNLYHHPN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 PALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQSAKPALDSNLFPMIPDYNLYHHPN
110 120 130 140 150 160
210 220 230 240 250 260
pF1KB8 DMGSIPEHKPFQGMDPIRVNPPPITPLETIKAFKDKQIHPGFGSLPQPPLTLKPIRPRKY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 DMGSIPEHKPFQGMDPIRVNPPPITPLETIKAFKDKQIHPGFGSLPQPPLTLKPIRPRKY
170 180 190 200 210 220
270 280 290 300 310 320
pF1KB8 PNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFSRSDHLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 PNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFSRSDHLT
230 240 250 260 270 280
330 340 350 360 370 380
pF1KB8 THIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKEKKAEKGGAPSASSAPPVSLAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 THIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKEKKAEKGGAPSASSAPPVSLAP
290 300 310 320 330 340
pF1KB8 VVTTCA
::::::
CCDS56 VVTTCA
>>CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5 (543 aa)
initn: 1043 init1: 716 opt: 968 Z-score: 614.8 bits: 123.0 E(32554): 6.3e-28
Smith-Waterman score: 1025; 48.7% identity (70.0% similar) in 380 aa overlap (31-385:81-449)
10 20 30 40 50
pF1KB8 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSGSSDSVVH-YNQMATENVMDIGL
:. . :. ..:. . :.....:. ::.:
CCDS42 AAGAPEGSGSNSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEHLTAESFPDISL
60 70 80 90 100 110
60 70 80 90 100 110
pF1KB8 TNEKPNPELSYSGSFQPAPGNKTVTYLGKFAFDSPSN-----WCQDNIISLMSAGILGV-
.::: : :: .. : .:: :.:... : : . ..::.: :....
CCDS42 NNEKVLVETSYPSQTTRLP---PITYTGRFSLEPAPNSGNTLW-PEPLFSLVS-GLVSMT
120 130 140 150 160
120 130 140 150 160
pF1KB8 -PPASG--ALSTQTSTASMVQ-PP------QGDVEAMYPALPPY-SNCGDLYSEPVSFHD
::::. : : .:.:: : :: ..: .: : : . . :.. :: :
CCDS42 NPPASSSSAPSPAASSASASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQSQAF
170 180 190 200 210 220
170 180 190 200 210
pF1KB8 PQGNPGLA--YSPQDYQSAKPALDSNLFPMIPDYNLYHHPNDMG-SIPEHKPFQGMDPIR
: :. : : : : : .:: ... :::::: . .. .:.: . :..:::::.. :
CCDS42 P-GSAGTALQYPPPAYPAAKGGFQ---VPMIPDYLFPQQQGDLGLGTPDQKPFQGLES-R
230 240 250 260 270 280
220 230 240 250 260 270
pF1KB8 VNPPPITPLETIKAFKDKQIHPGFGSLP---QPPLTLKPIRPRKYPNRPSKTPLHERPHA
.. : .::: ::::: .. . .: : : .:: : ::::::::::: ::::.:
CCDS42 TQQPSLTPLSTIKAFATQSGSQDLKALNTSYQSQL-IKPSRMRKYPNRPSKTPPHERPYA
290 300 310 320 330
280 290 300 310 320 330
pF1KB8 CPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACE
::.:.::::::::::::::.:::::.::::::::::.::::::::::::::::::::::.
CCDS42 CPVESCDRRFSRSDELTRHIRIHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACD
340 350 360 370 380 390
340 350 360 370 380
pF1KB8 FCGRKFARSDERKRHAKIHLKQKEKKAEKGG-APSASSAPPVSLAPVVTTCA
.::::::::::::::.::::.::.:::.:. : ::.:. .::.:.
CCDS42 ICGRKFARSDERKRHTKIHLRQKDKKADKSVVASSATSSLSSYPSPVATSYPSPVTTSYP
400 410 420 430 440 450
CCDS42 SPATTSYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVT
460 470 480 490 500 510
>>CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10 (426 aa)
initn: 1136 init1: 731 opt: 768 Z-score: 493.4 bits: 100.2 E(32554): 3.7e-21
Smith-Waterman score: 1124; 51.1% identity (68.7% similar) in 403 aa overlap (47-387:2-394)
20 30 40 50 60 70
pF1KB8 LNQLPDNLYPEEIPSALNLFSGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYSGSFQP
: .: .....: .:.:: . .: : .:: :
CCDS44 MNGVAGDGMINIDMTGEKRSLDLPYPSSFAP
10 20 30
80 90 100 110 120
pF1KB8 --APGNKTVTYLGKFAFDS--PSNWCQ-DNIISLMSAGIL-GVP-PASGALSTQTSTAS-
:: :.: ::.:::..: :. : ..::...::::: :: ::: . :.....::
CCDS44 VSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGILQGVTSPASTTASSSVTSASP
40 50 60 70 80 90
130 140 150 160 170
pF1KB8 --MVQPPQG---------DVEAMY---PALPPYSNC-GDLYSEPVSFHDP---QGNPGLA
.. : : :.. .: : ::::.: ::::..: .: . . . .::
CCDS44 NPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGDLYQDPSAFLSAATTSTSSSLA
100 110 120 130 140 150
180 190 200 210 220
pF1KB8 YSPQ-DYQSAKPALDSNLFPMIPDYNLYHHPN----DM-GSI-PEHKPFQ-GMDPIRVNP
: : .: : ::: : .:::::::: . :. :. :. :..::: .: .:: :
CCDS44 YPPPPSYPSPKPATDPGLFPMIPDYPGFF-PSQCQRDLHGTAGPDRKPFPCPLDTLRV-P
160 170 180 190 200
230 240 250
pF1KB8 PPITPLETIKAF-----KDKQIHPGF--GSL-PQPP-------------------LTLKP
::.::: ::. : . :: :: :. : : :.:
CCDS44 PPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSAAAAAAAAAAYNPHHLPLRP
210 220 230 240 250 260
260 270 280 290 300 310
pF1KB8 I-RPRKYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSF
: :::::::::::::.::::. :::::::::::::::::::.::::::::::::::::.:
CCDS44 ILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNF
270 280 290 300 310 320
320 330 340 350 360 370
pF1KB8 SRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKEKKAEKGGAPSASSA
:::::::::::::::::::::..::::::::::::::.::::.:::.:. .::::: .
CCDS44 SRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIHLRQKERKS---SAPSAS-V
330 340 350 360 370 380
380
pF1KB8 PPVSLAPVVTTCA
: :: ...:.
CCDS44 P----APSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP
390 400 410 420
>>CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10 (476 aa)
initn: 1228 init1: 731 opt: 768 Z-score: 492.8 bits: 100.3 E(32554): 3.9e-21
Smith-Waterman score: 1125; 50.9% identity (68.9% similar) in 405 aa overlap (45-387:50-444)
20 30 40 50 60 70
pF1KB8 SLLNQLPDNLYPEEIPSALNLFSGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYSGSF
..: .: .....: .:.:: . .: : .::
CCDS72 QLSDNIYPVEDLAATSVTIFPNAELGGPFDQMNGVAGDGMINIDMTGEKRSLDLPYPSSF
20 30 40 50 60 70
80 90 100 110 120
pF1KB8 QP--APGNKTVTYLGKFAFDS--PSNWCQ-DNIISLMSAGIL-GVP-PASGALSTQTSTA
: :: :.: ::.:::..: :. : ..::...::::: :: ::: . :.....:
CCDS72 APVSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGILQGVTSPASTTASSSVTSA
80 90 100 110 120 130
130 140 150 160
pF1KB8 S---MVQPPQG---------DVEAMY---PALPPYSNC-GDLYSEPVSFHDP---QGNPG
: .. : : :.. .: : ::::.: ::::..: .: . . . .
CCDS72 SPNPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGDLYQDPSAFLSAATTSTSSS
140 150 160 170 180 190
170 180 190 200 210 220
pF1KB8 LAYSPQ-DYQSAKPALDSNLFPMIPDYNLYHHPN----DM-GSI-PEHKPFQ-GMDPIRV
::: : .: : ::: : .:::::::: . :. :. :. :..::: .: .::
CCDS72 LAYPPPPSYPSPKPATDPGLFPMIPDYPGFF-PSQCQRDLHGTAGPDRKPFPCPLDTLRV
200 210 220 230 240 250
230 240 250
pF1KB8 NPPPITPLETIKAF-----KDKQIHPGF--GSL-PQPP-------------------LTL
:::.::: ::. : . :: :: :. : : :
CCDS72 -PPPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSAAAAAAAAAAYNPHHLPL
260 270 280 290 300 310
260 270 280 290 300 310
pF1KB8 KPI-RPRKYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMR
.:: :::::::::::::.::::. :::::::::::::::::::.::::::::::::::::
CCDS72 RPILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMR
320 330 340 350 360 370
320 330 340 350 360 370
pF1KB8 SFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKEKKAEKGGAPSAS
.::::::::::::::::::::::..::::::::::::::.::::.:::.:. .:::::
CCDS72 NFSRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIHLRQKERKS---SAPSAS
380 390 400 410 420 430
380
pF1KB8 SAPPVSLAPVVTTCA
.: :: ...:.
CCDS72 -VP----APSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP
440 450 460 470
>>CCDS1925.2 EGR4 gene_id:1961|Hs108|chr2 (589 aa)
initn: 768 init1: 554 opt: 574 Z-score: 372.7 bits: 78.3 E(32554): 1.9e-14
Smith-Waterman score: 600; 34.2% identity (55.2% similar) in 404 aa overlap (9-365:183-573)
10 20 30
pF1KB8 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSG
: . : ... .:. .:.. . .::.::
CCDS19 LSWALNSCGASGDLADSCFLEGPAPTPPPGLSYSGSFFIQAVPE--HPHDPEALFNLMSG
160 170 180 190 200 210
40 50 60 70 80 90
pF1KB8 --SSDSVVHYNQMATENVMDI----GLTNEKPNPELSYSGSFQPAPGNKTVTYLGKFAFD
. . :... .: : :.: :: .. :: .. . :
CCDS19 ILGLAPFPGPEAAASRSPLDAPFPAGSDALLPGPPDLYSPDLGAAPFPEAFWEASPCA-G
220 230 240 250 260
100 110 120 130 140 150
pF1KB8 SPSNWCQDNIISL--MSAGILGVPPASGALSTQTSTASMVQPPQGDVEAMYPALPPYSNC
.::. . .: .. : : .:::: :: ...: . : . : . . : .::
CCDS19 APSQCLYEPQLSPPDVKPG-LRAPPASPAL----DAVSAFKGPYAPWELLSVGAP--GNC
270 280 290 300 310 320
160 170 180 190 200
pF1KB8 GDLYSEPVSFHDPQGN-PGLAYSPQDYQSAK-----PALDSN-LFPMIPDYNLYHHPNDM
:. . .. :.. : .. . .: : . ::. .: :.: . :.:.
CCDS19 GSQGDYQAA---PEARFPVIGTKIEDLLSISCPAELPAVPANRLYPSGAYDAFPLAPGDL
330 340 350 360 370
210 220 230 240
pF1KB8 GSIPEHKPF-------------QGMDPIRVNPPPITPLETIKA----FKDKQIH--PGFG
: : : .: . . . : ..:: .: : . :: .
CCDS19 GEGAEGLPGLLTPPSGEGGSSGDGGEFLASTQPQLSPLGLRSAAAADFPKPLVADIPGSS
380 390 400 410 420 430
250 260 270 280 290
pF1KB8 SLPQPPLTLKPIRP------RKYPNRPSKTPLH---ERPHA----CPAEGCDRRFSRSDE
.. ::. : : :. : .: . :::: ::.:.: : :.::::
CCDS19 GVAAPPVPPPPPTPFPQAKARRKGRRGGKCSTRCFCPRPHAKAFACPVESCVRSFARSDE
440 450 460 470 480 490
300 310 320 330 340 350
pF1KB8 LTRHLRIHTGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRH
:.:::::::::::::::::.:.::::::::::.:::::::::::. :::.::::::.:::
CCDS19 LNRHLRIHTGHKPFQCRICLRNFSRSDHLTTHVRTHTGEKPFACDVCGRRFARSDEKKRH
500 510 520 530 540 550
360 370 380
pF1KB8 AKIHLKQKEKKAEKGGAPSASSAPPVSLAPVVTTCA
.:.::::: . :.
CCDS19 SKVHLKQKARAEERLKGLGFYSLGLSFASL
560 570 580
387 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 08:28:10 2016 done: Sat Nov 5 08:28:10 2016
Total Scan time: 3.110 Total Display time: 0.020
Function used was FASTA [36.3.4 Apr, 2011]