FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7045, 476 aa
1>>>pF1KB7045 476 - 476 aa - 476 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 11.5172+/-0.000991; mu= -8.1016+/- 0.059
mean_var=452.2533+/-94.784, 0's: 0 Z-trim(117.3): 804 B-trim: 0 in 0/53
Lambda= 0.060309
statistics sampled from 17109 (18009) to 17109 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.819), E-opt: 0.2 (0.553), width: 16
Scan time: 4.240
The best scores are: opt bits E(32554)
CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10 ( 476) 3331 303.8 2.6e-82
CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10 ( 426) 3007 275.6 7.2e-74
CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5 ( 543) 823 85.7 1.4e-16
CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8 ( 349) 768 80.7 2.8e-15
CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8 ( 387) 768 80.7 3e-15
>>CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10 (476 aa)
initn: 3331 init1: 3331 opt: 3331 Z-score: 1591.4 bits: 303.8 E(32554): 2.6e-82
Smith-Waterman score: 3331; 100.0% identity (100.0% similar) in 476 aa overlap (1-476:1-476)
10 20 30 40 50 60
pF1KB7 MMTAKAVDKIPVTLSGFVHQLSDNIYPVEDLAATSVTIFPNAELGGPFDQMNGVAGDGMI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 MMTAKAVDKIPVTLSGFVHQLSDNIYPVEDLAATSVTIFPNAELGGPFDQMNGVAGDGMI
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 NIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 NIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGI
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 LQGVTSPASTTASSSVTSASPNPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 LQGVTSPASTTASSSVTSASPNPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 LYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDLHG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 LYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDLHG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 TAGPDRKPFPCPLDTLRVPPPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 TAGPDRKPFPCPLDTLRVPPPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 AAAAAAAAAYNPHHLPLRPILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 AAAAAAAAAYNPHHLPLRPILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRH
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 IRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 IRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIH
370 380 390 400 410 420
430 440 450 460 470
pF1KB7 LRQKERKSSAPSASVPAPSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 LRQKERKSSAPSASVPAPSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP
430 440 450 460 470
>>CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10 (426 aa)
initn: 3007 init1: 3007 opt: 3007 Z-score: 1439.6 bits: 275.6 E(32554): 7.2e-74
Smith-Waterman score: 3007; 100.0% identity (100.0% similar) in 426 aa overlap (51-476:1-426)
30 40 50 60 70 80
pF1KB7 LSDNIYPVEDLAATSVTIFPNAELGGPFDQMNGVAGDGMINIDMTGEKRSLDLPYPSSFA
::::::::::::::::::::::::::::::
CCDS44 MNGVAGDGMINIDMTGEKRSLDLPYPSSFA
10 20 30
90 100 110 120 130 140
pF1KB7 PVSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGILQGVTSPASTTASSSVTSAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PVSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGILQGVTSPASTTASSSVTSAS
40 50 60 70 80 90
150 160 170 180 190 200
pF1KB7 PNPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGDLYQDPSAFLSAATTSTSSSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PNPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGDLYQDPSAFLSAATTSTSSSL
100 110 120 130 140 150
210 220 230 240 250 260
pF1KB7 AYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDLHGTAGPDRKPFPCPLDTLRVPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDLHGTAGPDRKPFPCPLDTLRVPP
160 170 180 190 200 210
270 280 290 300 310 320
pF1KB7 PLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSAAAAAAAAAAYNPHHLPLRPI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSAAAAAAAAAAYNPHHLPLRPI
220 230 240 250 260 270
330 340 350 360 370 380
pF1KB7 LRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNFS
280 290 300 310 320 330
390 400 410 420 430 440
pF1KB7 RSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIHLRQKERKSSAPSASVPAPST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 RSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIHLRQKERKSSAPSASVPAPST
340 350 360 370 380 390
450 460 470
pF1KB7 ASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP
::::::::::::::::::::::::::::::::::::
CCDS44 ASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP
400 410 420
>>CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5 (543 aa)
initn: 896 init1: 708 opt: 823 Z-score: 411.3 bits: 85.7 E(32554): 1.4e-16
Smith-Waterman score: 1019; 43.1% identity (66.7% similar) in 448 aa overlap (32-476:80-469)
10 20 30 40 50 60
pF1KB7 MTAKAVDKIPVTLSGFVHQLSDNIYPVEDLAATSVTIFPNAELG-GPFDQMNGVAGDGMI
...: :. :.:. : :.... .....
CCDS42 GAAGAPEGSGSNSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEHL---TAESFP
50 60 70 80 90 100
70 80 90 100 110
pF1KB7 NIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSIDPQ-YPGASCYPEGIINIVSAG
.:....:: .. :::. . : .:: :.::..: : . .:: ....:: :
CCDS42 DISLNNEKVLVETSYPSQ-----TTRLPPITYTGRFSLEPAPNSGNTLWPEPLFSLVS-G
110 120 130 140 150 160
120 130 140 150 160 170
pF1KB7 ILQGVTSPASTTASSSVTSASPNPLATGPLGVCTMSQTQPDLDHLYSPPPP-PPPYSGCA
... .. :::.... : ...: . . ::. :.. .. : . .:: : : : .
CCDS42 LVSMTNPPASSSSAPSPAASSASASQSPPLS-CAVPSN--DSSPIYSAAPTFPTPNT---
170 180 190 200 210
180 190 200 210 220 230
pF1KB7 GDLYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDL
:.. .:.. .: :....: :::: .::. : . . :::::: .::.: : ::
CCDS42 -DIFPEPQS--QAFPGSAGTALQYPPP-AYPAAKGGFQ---VPMIPDY--LFPQQ-QGDL
220 230 240 250 260
240 250 260 270 280 290
pF1KB7 HGTAGPDRKPFPCPLDTLRVPPPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSS
: . ::.::: :.. : :::::::. :. ...::. .
CCDS42 -GLGTPDQKPFQ-GLESRTQQPSLTPLSTIKAFA------------TQSGSQDLK-----
270 280 290 300
300 310 320 330 340 350
pF1KB7 SAAAAAAAAAAYNPHHLPLRPILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELT
: ..:. . . .: : ::::::::::: ::::: ::.:.::::::::::::
CCDS42 ------ALNTSYQSQLI--KPS-RMRKYPNRPSKTPPHERPYACPVESCDRRFSRSDELT
310 320 330 340 350
360 370 380 390 400 410
pF1KB7 RHIRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTK
::::::::.:::::::::::::::::::::::::::::::::: ::::::::::::::::
CCDS42 RHIRIHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDICGRKFARSDERKRHTK
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB7 IHLRQKERKSSAPSASVPAPSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP
::::::..:.. :: : :.:. : . :. . : : . : .: .. .:
CCDS42 IHLRQKDKKADK---SVVA-SSATSSLSSYPSPVATSYPSPVTTSYP-SPATTSYPSPVP
420 430 440 450 460 470
CCDS42 TSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVTNSFSASTGLSDM
480 490 500 510 520 530
>>CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8 (349 aa)
initn: 1136 init1: 731 opt: 768 Z-score: 387.9 bits: 80.7 E(32554): 2.8e-15
Smith-Waterman score: 1115; 51.3% identity (68.8% similar) in 398 aa overlap (57-444:14-349)
30 40 50 60 70 80
pF1KB7 PVEDLAATSVTIFPNAELGGPFDQMNGVAGDGMINIDMTGEKRSLDLPYPSSFAPVSAPR
.....: .:.:: . .: : .:: : ::
CCDS56 MEPCAAWSPRGGRENVMDIGLTNEKPNPELSYSGSFQP--APG
10 20 30 40
90 100 110 120 130 140
pF1KB7 NQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGILQGVTSPASTTASSSVTSASPNPLAT
:.: ::.:::..: :. : ..::...::::: :: ::: . :.....:: ..
CCDS56 NKTVTYLGKFAFDS--PSNWCQ-DNIISLMSAGIL-GVP-PASGALSTQTSTAS---MVQ
50 60 70 80 90
150 160 170 180 190 200
pF1KB7 GPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGDLYQDPSAFLSAATTSTSSSLAYPPPP
: : :.. .: : ::::.: ::::..: .: . . . .::: :
CCDS56 PPQG---------DVEAMY---PALPPYSNC-GDLYSEPVSFHD---PQGNPGLAYSPQ-
100 110 120 130
210 220 230 240 250 260
pF1KB7 SYPSPKPATDPGLFPMIPDYPGFF-PSQCQRDLHGTAGPDRKPFPCPLDTLRV-PPPLTP
.: : ::: : .:::::::: . :. :. :. :..::: .: .:: :::.::
CCDS56 DYQSAKPALDSNLFPMIPDYNLYHHPN----DM-GSI-PEHKPFQ-GMDPIRVNPPPITP
140 150 160 170 180
270 280 290 300 310 320
pF1KB7 LSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSAAAAAAAAAAYNPHHLPLRPILRPR
: ::. : . :: :: :. : : :.:: :::
CCDS56 LETIKAF-----KDKQIHPGF--GSL-PQPP-------------------LTLKPI-RPR
190 200 210 220
330 340 350 360 370 380
pF1KB7 KYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNFSRSDH
::::::::::.::::. :::::::::::::::::::.::::::::::::::::.::::::
CCDS56 KYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFSRSDH
230 240 250 260 270 280
390 400 410 420 430
pF1KB7 LTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIHLRQKERKS---SAPSAS-VP----
::::::::::::::::..::::::::::::::.::::.:::.:. .::::: .:
CCDS56 LTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKEKKAEKGGAPSASSAPPVSL
290 300 310 320 330 340
440 450 460 470
pF1KB7 APSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP
:: ...:.
CCDS56 APVVTTCA
>>CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8 (387 aa)
initn: 1228 init1: 731 opt: 768 Z-score: 387.3 bits: 80.7 E(32554): 3e-15
Smith-Waterman score: 1208; 48.9% identity (69.0% similar) in 452 aa overlap (2-444:1-387)
10 20 30 40 50 60
pF1KB7 MMTAKAVDKIPVTLSGFVHQLSDNIYPVEDLAATSVTIFPNAELGGPFDQMNGVAGDGMI
::.: ..:.:::.:....:: ::.:: : .....: .. . ..: .: ....
CCDS60 MTGKLAEKLPVTMSSLLNQLPDNLYPEE--IPSALNLFSGS--SDSVVHYNQMATENVM
10 20 30 40 50
70 80 90 100 110 120
pF1KB7 NIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGI
.: .:.:: . .: : .:: : :: :.: ::.:::..: :. : ..::...::::
CCDS60 DIGLTNEKPNPELSYSGSFQP--APGNKTVTYLGKFAFDS--PSNWCQ-DNIISLMSAGI
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB7 LQGVTSPASTTASSSVTSASPNPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGD
: :: ::: . :.....:: .. : : :.. .: : ::::.: ::
CCDS60 L-GVP-PASGALSTQTSTAS---MVQPPQG---------DVEAMY---PALPPYSNC-GD
120 130 140 150
190 200 210 220 230 240
pF1KB7 LYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDLHG
::..: .: . . . .::: : .: : ::: : .:::::::: . . :. :
CCDS60 LYSEPVSFHDP---QGNPGLAYSPQ-DYQSAKPALDSNLFPMIPDYNLY---HHPNDM-G
160 170 180 190 200
250 260 270 280 290
pF1KB7 TAGPDRKPFPCPLDTLRV-PPPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSS
. :..::: .: .:: :::.::: ::. : . :: :: :. :
CCDS60 SI-PEHKPFQ-GMDPIRVNPPPITPLETIKAF-----KDKQIHPGF--GSL-PQPP----
210 220 230 240 250
300 310 320 330 340 350
pF1KB7 AAAAAAAAAAYNPHHLPLRPILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTR
: :.:: :::::::::::::.::::. ::::::::::::::::::
CCDS60 ---------------LTLKPI-RPRKYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTR
260 270 280 290
360 370 380 390 400 410
pF1KB7 HIRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKI
:.::::::::::::::::.::::::::::::::::::::::..::::::::::::::.::
CCDS60 HLRIHTGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKI
300 310 320 330 340 350
420 430 440 450 460 470
pF1KB7 HLRQKERKS---SAPSAS-VP----APSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSS
::.:::.:. .::::: .: :: ...:.
CCDS60 HLKQKEKKAEKGGAPSASSAPPVSLAPVVTTCA
360 370 380
pF1KB7 RTRTP
476 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 04:13:08 2016 done: Fri Nov 4 04:13:09 2016
Total Scan time: 4.240 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]