FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7053, 543 aa
1>>>pF1KB7053 543 - 543 aa - 543 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 12.7062+/-0.00103; mu= -13.0814+/- 0.062
mean_var=449.9068+/-93.758, 0's: 0 Z-trim(116.2): 829 B-trim: 0 in 0/53
Lambda= 0.060466
statistics sampled from 15849 (16756) to 15849 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.786), E-opt: 0.2 (0.515), width: 16
Scan time: 4.400
The best scores are: opt bits E(32554)
CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5 ( 543) 3664 333.7 3.3e-91
CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8 ( 349) 968 98.4 1.5e-20
CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8 ( 387) 968 98.5 1.6e-20
CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10 ( 426) 823 85.8 1.1e-16
CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10 ( 476) 823 85.9 1.2e-16
>>CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5 (543 aa)
initn: 3664 init1: 3664 opt: 3664 Z-score: 1751.0 bits: 333.7 E(32554): 3.3e-91
Smith-Waterman score: 3664; 100.0% identity (100.0% similar) in 543 aa overlap (1-543:1-543)
10 20 30 40 50 60
pF1KB7 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKLEEMMLLSNGAPQFLGAAGAPEGSGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKLEEMMLLSNGAPQFLGAAGAPEGSGS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 NSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEHLTAESFPDISLNNEKVLVETS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 NSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEHLTAESFPDISLNNEKVLVETS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 YPSQTTRLPPITYTGRFSLEPAPNSGNTLWPEPLFSLVSGLVSMTNPPASSSSAPSPAAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 YPSQTTRLPPITYTGRFSLEPAPNSGNTLWPEPLFSLVSGLVSMTNPPASSSSAPSPAAS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 SASASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQSQAFPGSAGTALQYPPPAY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 SASASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQSQAFPGSAGTALQYPPPAY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 PAAKGGFQVPMIPDYLFPQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKAFATQSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 PAAKGGFQVPMIPDYLFPQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKAFATQSG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 SQDLKALNTSYQSQLIKPSRMRKYPNRPSKTPPHERPYACPVESCDRRFSRSDELTRHIR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 SQDLKALNTSYQSQLIKPSRMRKYPNRPSKTPPHERPYACPVESCDRRFSRSDELTRHIR
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 IHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDICGRKFARSDERKRHTKIHLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 IHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDICGRKFARSDERKRHTKIHLR
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB7 QKDKKADKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 QKDKKADKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB7 TYPSPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVTNSFSASTGLSDMTATFSPRTI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 TYPSPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVTNSFSASTGLSDMTATFSPRTI
490 500 510 520 530 540
pF1KB7 EIC
:::
CCDS42 EIC
>>CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8 (349 aa)
initn: 1004 init1: 716 opt: 968 Z-score: 482.6 bits: 98.4 E(32554): 1.5e-20
Smith-Waterman score: 1010; 50.4% identity (69.7% similar) in 357 aa overlap (103-449:14-347)
80 90 100 110 120
pF1KB7 GGGGSNSSSSSSTFNPQADTGEQPYEHLTAESFPDISLNNEKVLVETSYPSQTTRLP---
:. ::.:.::: : :: .. :
CCDS56 MEPCAAWSPRGGRENVMDIGLTNEKPNPELSYSGSFQPAPGNK
10 20 30 40
130 140 150 160 170 180
pF1KB7 PITYTGRFSLEPAPNSGNTLW-PEPLFSLVSGLVSMTNPPASSSSAPSPAASSASASQSP
.:: :.:... : : . ..::.:. . . :::: .: : .:.:: : :
CCDS56 TVTYLGKFAFDSPSN-----WCQDNIISLMSAGI-LGVPPAS--GALSTQTSTASMVQ-P
50 60 70 80 90
190 200 210 220 230 240
pF1KB7 PLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQSQAFP-GSAGTALQYPPPAYPAAKGGF
: ..: .: : : . . :.. :: : : :. : : : : : .:: ..
CCDS56 P------QGDVEAMYPALPPY-SNCGDLYSEPVSFHDPQGNPGLA--YSPQDYQSAKPAL
100 110 120 130 140
250 260 270 280 290 300
pF1KB7 Q---VPMIPDYLFPQQQGDLGLGTPDQKPFQGLES-RTQQPSLTPLSTIKAFATQSGSQD
. :::::: . .. .:.: . :..:::::.. :.. : .::: ::::: . :
CCDS56 DSNLFPMIPDYNLYHHPNDMG-SIPEHKPFQGMDPIRVNPPPITPLETIKAFKDK---QI
150 160 170 180 190 200
310 320 330 340 350 360
pF1KB7 LKALNTSYQSQL-IKPSRMRKYPNRPSKTPPHERPYACPVESCDRRFSRSDELTRHIRIH
.... : : .:: : ::::::::::: ::::.:::.:.::::::::::::::.:::
CCDS56 HPGFGSLPQPPLTLKPIRPRKYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIH
210 220 230 240 250 260
370 380 390 400 410 420
pF1KB7 TGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDICGRKFARSDERKRHTKIHLRQK
::.::::::::::.::::::::::::::::::::::..::::::::::::::.::::.::
CCDS56 TGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQK
270 280 290 300 310 320
430 440 450 460 470 480
pF1KB7 DKKADKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSSTY
.:::.:. : ::.:. .::.:.
CCDS56 EKKAEKGG-APSASSAPPVSLAPVVTTCA
330 340
>>CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8 (387 aa)
initn: 1043 init1: 716 opt: 968 Z-score: 482.0 bits: 98.5 E(32554): 1.6e-20
Smith-Waterman score: 1025; 48.9% identity (69.7% similar) in 380 aa overlap (81-449:31-385)
60 70 80 90 100 110
pF1KB7 AAGAPEGSGSNSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEHLTAESFPDISL
:. . :. ..:. . :.....:. ::.:
CCDS60 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSGSSDSVVH-YNQMATENVMDIGL
10 20 30 40 50
120 130 140 150 160
pF1KB7 NNEKVLVETSYPSQTTRLP---PITYTGRFSLEPAPNSGNTLW-PEPLFSLVSGLVSMTN
.::: : :: .. : .:: :.:... : : . ..::.:. . .
CCDS60 TNEKPNPELSYSGSFQPAPGNKTVTYLGKFAFDSPSN-----WCQDNIISLMSAGI-LGV
60 70 80 90 100 110
170 180 190 200 210 220
pF1KB7 PPASSSSAPSPAASSASASQSPPLSCAVPSNDSSPIYSAAPTFPTPNT-DIFPEPQSQAF
:::: .: : .:.:: : :: ..: .: : : : : :.. :: :
CCDS60 PPAS--GALSTQTSTASMVQ-PP------QGDVEAMYPALP--PYSNCGDLYSEPVSFHD
120 130 140 150 160
230 240 250 260 270 280
pF1KB7 P-GSAGTALQYPPPAYPAAKGGFQ---VPMIPDYLFPQQQGDLGLGTPDQKPFQGLES-R
: :. : : : : : .:: ... :::::: . .. .:.: . :..:::::.. :
CCDS60 PQGNPGLA--YSPQDYQSAKPALDSNLFPMIPDYNLYHHPNDMG-SIPEHKPFQGMDPIR
170 180 190 200 210
290 300 310 320 330
pF1KB7 TQQPSLTPLSTIKAFATQSGSQDLKALNTSYQSQL-IKPSRMRKYPNRPSKTPPHERPYA
.. : .::: ::::: . : .... : : .:: : ::::::::::: ::::.:
CCDS60 VNPPPITPLETIKAFKDK---QIHPGFGSLPQPPLTLKPIRPRKYPNRPSKTPLHERPHA
220 230 240 250 260 270
340 350 360 370 380 390
pF1KB7 CPVESCDRRFSRSDELTRHIRIHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACD
::.:.::::::::::::::.:::::.::::::::::.::::::::::::::::::::::.
CCDS60 CPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACE
280 290 300 310 320 330
400 410 420 430 440 450
pF1KB7 ICGRKFARSDERKRHTKIHLRQKDKKADKSVVASSATSSLSSYPSPVATSYPSPVTTSYP
.::::::::::::::.::::.::.:::.:. : ::.:. .::.:.
CCDS60 FCGRKFARSDERKRHAKIHLKQKEKKAEKGG-APSASSAPPVSLAPVVTTCA
340 350 360 370 380
460 470 480 490 500 510
pF1KB7 SPATTSYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVT
>>CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10 (426 aa)
initn: 939 init1: 708 opt: 823 Z-score: 413.1 bits: 85.8 E(32554): 1.1e-16
Smith-Waterman score: 998; 44.7% identity (66.5% similar) in 418 aa overlap (107-469:11-426)
80 90 100 110 120 130
pF1KB7 SNSSSSSSTFNPQADTGEQPYEHLTAESFPDISLNNEKVLVETSYPSQ-----TTRLPPI
.:....:: .. :::. . : .
CCDS44 MNGVAGDGMINIDMTGEKRSLDLPYPSSFAPVSAPRNQTF
10 20 30 40
140 150 160 170 180 190
pF1KB7 TYTGRFSLEPAPNSGNTLWPEPLFSLVS-GLVSMTNPPASSSSAPSPAASSASASQSPPL
:: :.::..: : . .:: ....:: :... .. :::.... : ...: . . ::
CCDS44 TYMGKFSIDPQ-YPGASCYPEGIINIVSAGILQGVTSPASTTASSSVTSASPNPLATGPL
50 60 70 80 90
200 210 220 230 240
pF1KB7 S-CAVPSN--DSSPIYSAAPTFPTPNT----DIFPEPQS--QAFPGSAGTALQYPPP-AY
. :.. .. : . .:: : : : . :.. .:.. .: :....: :::: .:
CCDS44 GVCTMSQTQPDLDHLYSPPPP-PPPYSGCAGDLYQDPSAFLSAATTSTSSSLAYPPPPSY
100 110 120 130 140 150
250 260 270 280 290
pF1KB7 PAAKGGFQ---VPMIPDY--LFPQQ-QGDL-GLGTPDQKPFQ-GLESRTQQPSLTPLSTI
:. : . . :::::: .::.: : :: : . ::.::: :.. : :::::::
CCDS44 PSPKPATDPGLFPMIPDYPGFFPSQCQRDLHGTAGPDRKPFPCPLDTLRVPPPLTPLSTI
160 170 180 190 200 210
300 310 320
pF1KB7 KAFA------------TQSGSQDLK-----------ALNTSYQSQLI--KPS-RMRKYPN
. :. ...::. . : ..:. . . .: : :::::
CCDS44 RNFTLGGPSAGVTGPGASGGSEGPRLPGSSSAAAAAAAAAAYNPHHLPLRPILRPRKYPN
220 230 240 250 260 270
330 340 350 360 370 380
pF1KB7 RPSKTPPHERPYACPVESCDRRFSRSDELTRHIRIHTGQKPFQCRICMRNFSRSDHLTTH
:::::: ::::: ::.:.::::::::::::::::::::.:::::::::::::::::::::
CCDS44 RPSKTPVHERPYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNFSRSDHLTTH
280 290 300 310 320 330
390 400 410 420 430 440
pF1KB7 IRTHTGEKPFACDICGRKFARSDERKRHTKIHLRQKDKKADK---SVVA-SSATSSLSSY
::::::::::::: ::::::::::::::::::::::..:.. :: : :.:. : .
CCDS44 IRTHTGEKPFACDYCGRKFARSDERKRHTKIHLRQKERKSSAPSASVPAPSTASCSGGVQ
340 350 360 370 380 390
450 460 470 480 490 500
pF1KB7 PSPVATSYPSPVTTSYP-SPATTSYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSS
:. . : : . : .: .. .:
CCDS44 PGGTLCSSNSSSLGGGPLAPCSSRTRTP
400 410 420
>>CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10 (476 aa)
initn: 939 init1: 708 opt: 823 Z-score: 412.4 bits: 85.9 E(32554): 1.2e-16
Smith-Waterman score: 1019; 43.1% identity (66.7% similar) in 448 aa overlap (80-469:32-476)
50 60 70 80 90 100
pF1KB7 GAAGAPEGSGSNSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEHLTA---ESFP
...: :. :.:. : :...... ...
CCDS72 MTAKAVDKIPVTLSGFVHQLSDNIYPVEDLAATSVTIFPNAELG-GPFDQMNGVAGDGMI
10 20 30 40 50 60
110 120 130 140 150 160
pF1KB7 DISLNNEKVLVETSYPSQ-----TTRLPPITYTGRFSLEPAPNSGNTLWPEPLFSLVS-G
.:....:: .. :::. . : .:: :.::..: : . .:: ....:: :
CCDS72 NIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSIDPQ-YPGASCYPEGIINIVSAG
70 80 90 100 110
170 180 190 200 210
pF1KB7 LVSMTNPPASSSSAPSPAASSASASQSPPLS-CAVPSN--DSSPIYSAAPTFPTPNT---
... .. :::.... : ...: . . ::. :.. .. : . .:: : : : .
CCDS72 ILQGVTSPASTTASSSVTSASPNPLATGPLGVCTMSQTQPDLDHLYSPPPP-PPPYSGCA
120 130 140 150 160 170
220 230 240 250 260
pF1KB7 -DIFPEPQS--QAFPGSAGTALQYPPP-AYPAAKGGFQ---VPMIPDY--LFPQQ-QGDL
:.. .:.. .: :....: :::: .::. : . . :::::: .::.: : ::
CCDS72 GDLYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDL
180 190 200 210 220 230
270 280 290 300
pF1KB7 -GLGTPDQKPFQ-GLESRTQQPSLTPLSTIKAFA------------TQSGSQDLK-----
: . ::.::: :.. : :::::::. :. ...::. .
CCDS72 HGTAGPDRKPFPCPLDTLRVPPPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSS
240 250 260 270 280 290
310 320 330 340 350
pF1KB7 ------ALNTSYQSQLI--KPS-RMRKYPNRPSKTPPHERPYACPVESCDRRFSRSDELT
: ..:. . . .: : ::::::::::: ::::: ::.:.::::::::::::
CCDS72 SAAAAAAAAAAYNPHHLPLRPILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELT
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB7 RHIRIHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDICGRKFARSDERKRHTK
::::::::.:::::::::::::::::::::::::::::::::: ::::::::::::::::
CCDS72 RHIRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTK
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB7 IHLRQKDKKADK---SVVA-SSATSSLSSYPSPVATSYPSPVTTSYP-SPATTSYPSPVP
::::::..:.. :: : :.:. : . :. . : : . : .: .. .:
CCDS72 IHLRQKERKSSAPSASVPAPSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB7 TSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVTNSFSASTGLSDM
543 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 09:59:15 2016 done: Sun Nov 6 09:59:16 2016
Total Scan time: 4.400 Total Display time: 0.020
Function used was FASTA [36.3.4 Apr, 2011]