FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7053, 543 aa 1>>>pF1KB7053 543 - 543 aa - 543 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.7062+/-0.00103; mu= -13.0814+/- 0.062 mean_var=449.9068+/-93.758, 0's: 0 Z-trim(116.2): 829 B-trim: 0 in 0/53 Lambda= 0.060466 statistics sampled from 15849 (16756) to 15849 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.786), E-opt: 0.2 (0.515), width: 16 Scan time: 4.400 The best scores are: opt bits E(32554) CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5 ( 543) 3664 333.7 3.3e-91 CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8 ( 349) 968 98.4 1.5e-20 CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8 ( 387) 968 98.5 1.6e-20 CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10 ( 426) 823 85.8 1.1e-16 CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10 ( 476) 823 85.9 1.2e-16 >>CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5 (543 aa) initn: 3664 init1: 3664 opt: 3664 Z-score: 1751.0 bits: 333.7 E(32554): 3.3e-91 Smith-Waterman score: 3664; 100.0% identity (100.0% similar) in 543 aa overlap (1-543:1-543) 10 20 30 40 50 60 pF1KB7 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKLEEMMLLSNGAPQFLGAAGAPEGSGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKLEEMMLLSNGAPQFLGAAGAPEGSGS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 NSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEHLTAESFPDISLNNEKVLVETS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 NSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEHLTAESFPDISLNNEKVLVETS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 YPSQTTRLPPITYTGRFSLEPAPNSGNTLWPEPLFSLVSGLVSMTNPPASSSSAPSPAAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 YPSQTTRLPPITYTGRFSLEPAPNSGNTLWPEPLFSLVSGLVSMTNPPASSSSAPSPAAS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 SASASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQSQAFPGSAGTALQYPPPAY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 SASASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQSQAFPGSAGTALQYPPPAY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 PAAKGGFQVPMIPDYLFPQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKAFATQSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 PAAKGGFQVPMIPDYLFPQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKAFATQSG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 SQDLKALNTSYQSQLIKPSRMRKYPNRPSKTPPHERPYACPVESCDRRFSRSDELTRHIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 SQDLKALNTSYQSQLIKPSRMRKYPNRPSKTPPHERPYACPVESCDRRFSRSDELTRHIR 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 IHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDICGRKFARSDERKRHTKIHLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 IHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDICGRKFARSDERKRHTKIHLR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB7 QKDKKADKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 QKDKKADKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB7 TYPSPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVTNSFSASTGLSDMTATFSPRTI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 TYPSPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVTNSFSASTGLSDMTATFSPRTI 490 500 510 520 530 540 pF1KB7 EIC ::: CCDS42 EIC >>CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8 (349 aa) initn: 1004 init1: 716 opt: 968 Z-score: 482.6 bits: 98.4 E(32554): 1.5e-20 Smith-Waterman score: 1010; 50.4% identity (69.7% similar) in 357 aa overlap (103-449:14-347) 80 90 100 110 120 pF1KB7 GGGGSNSSSSSSTFNPQADTGEQPYEHLTAESFPDISLNNEKVLVETSYPSQTTRLP--- :. ::.:.::: : :: .. : CCDS56 MEPCAAWSPRGGRENVMDIGLTNEKPNPELSYSGSFQPAPGNK 10 20 30 40 130 140 150 160 170 180 pF1KB7 PITYTGRFSLEPAPNSGNTLW-PEPLFSLVSGLVSMTNPPASSSSAPSPAASSASASQSP .:: :.:... : : . ..::.:. . . :::: .: : .:.:: : : CCDS56 TVTYLGKFAFDSPSN-----WCQDNIISLMSAGI-LGVPPAS--GALSTQTSTASMVQ-P 50 60 70 80 90 190 200 210 220 230 240 pF1KB7 PLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQSQAFP-GSAGTALQYPPPAYPAAKGGF : ..: .: : : . . :.. :: : : :. : : : : : .:: .. CCDS56 P------QGDVEAMYPALPPY-SNCGDLYSEPVSFHDPQGNPGLA--YSPQDYQSAKPAL 100 110 120 130 140 250 260 270 280 290 300 pF1KB7 Q---VPMIPDYLFPQQQGDLGLGTPDQKPFQGLES-RTQQPSLTPLSTIKAFATQSGSQD . :::::: . .. .:.: . :..:::::.. :.. : .::: ::::: . : CCDS56 DSNLFPMIPDYNLYHHPNDMG-SIPEHKPFQGMDPIRVNPPPITPLETIKAFKDK---QI 150 160 170 180 190 200 310 320 330 340 350 360 pF1KB7 LKALNTSYQSQL-IKPSRMRKYPNRPSKTPPHERPYACPVESCDRRFSRSDELTRHIRIH .... : : .:: : ::::::::::: ::::.:::.:.::::::::::::::.::: CCDS56 HPGFGSLPQPPLTLKPIRPRKYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIH 210 220 230 240 250 260 370 380 390 400 410 420 pF1KB7 TGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDICGRKFARSDERKRHTKIHLRQK ::.::::::::::.::::::::::::::::::::::..::::::::::::::.::::.:: CCDS56 TGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQK 270 280 290 300 310 320 430 440 450 460 470 480 pF1KB7 DKKADKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSSTY .:::.:. : ::.:. .::.:. CCDS56 EKKAEKGG-APSASSAPPVSLAPVVTTCA 330 340 >>CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8 (387 aa) initn: 1043 init1: 716 opt: 968 Z-score: 482.0 bits: 98.5 E(32554): 1.6e-20 Smith-Waterman score: 1025; 48.9% identity (69.7% similar) in 380 aa overlap (81-449:31-385) 60 70 80 90 100 110 pF1KB7 AAGAPEGSGSNSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEHLTAESFPDISL :. . :. ..:. . :.....:. ::.: CCDS60 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSGSSDSVVH-YNQMATENVMDIGL 10 20 30 40 50 120 130 140 150 160 pF1KB7 NNEKVLVETSYPSQTTRLP---PITYTGRFSLEPAPNSGNTLW-PEPLFSLVSGLVSMTN .::: : :: .. : .:: :.:... : : . ..::.:. . . CCDS60 TNEKPNPELSYSGSFQPAPGNKTVTYLGKFAFDSPSN-----WCQDNIISLMSAGI-LGV 60 70 80 90 100 110 170 180 190 200 210 220 pF1KB7 PPASSSSAPSPAASSASASQSPPLSCAVPSNDSSPIYSAAPTFPTPNT-DIFPEPQSQAF :::: .: : .:.:: : :: ..: .: : : : : :.. :: : CCDS60 PPAS--GALSTQTSTASMVQ-PP------QGDVEAMYPALP--PYSNCGDLYSEPVSFHD 120 130 140 150 160 230 240 250 260 270 280 pF1KB7 P-GSAGTALQYPPPAYPAAKGGFQ---VPMIPDYLFPQQQGDLGLGTPDQKPFQGLES-R : :. : : : : : .:: ... :::::: . .. .:.: . :..:::::.. : CCDS60 PQGNPGLA--YSPQDYQSAKPALDSNLFPMIPDYNLYHHPNDMG-SIPEHKPFQGMDPIR 170 180 190 200 210 290 300 310 320 330 pF1KB7 TQQPSLTPLSTIKAFATQSGSQDLKALNTSYQSQL-IKPSRMRKYPNRPSKTPPHERPYA .. : .::: ::::: . : .... : : .:: : ::::::::::: ::::.: CCDS60 VNPPPITPLETIKAFKDK---QIHPGFGSLPQPPLTLKPIRPRKYPNRPSKTPLHERPHA 220 230 240 250 260 270 340 350 360 370 380 390 pF1KB7 CPVESCDRRFSRSDELTRHIRIHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACD ::.:.::::::::::::::.:::::.::::::::::.::::::::::::::::::::::. CCDS60 CPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACE 280 290 300 310 320 330 400 410 420 430 440 450 pF1KB7 ICGRKFARSDERKRHTKIHLRQKDKKADKSVVASSATSSLSSYPSPVATSYPSPVTTSYP .::::::::::::::.::::.::.:::.:. : ::.:. .::.:. CCDS60 FCGRKFARSDERKRHAKIHLKQKEKKAEKGG-APSASSAPPVSLAPVVTTCA 340 350 360 370 380 460 470 480 490 500 510 pF1KB7 SPATTSYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVT >>CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10 (426 aa) initn: 939 init1: 708 opt: 823 Z-score: 413.1 bits: 85.8 E(32554): 1.1e-16 Smith-Waterman score: 998; 44.7% identity (66.5% similar) in 418 aa overlap (107-469:11-426) 80 90 100 110 120 130 pF1KB7 SNSSSSSSTFNPQADTGEQPYEHLTAESFPDISLNNEKVLVETSYPSQ-----TTRLPPI .:....:: .. :::. . : . CCDS44 MNGVAGDGMINIDMTGEKRSLDLPYPSSFAPVSAPRNQTF 10 20 30 40 140 150 160 170 180 190 pF1KB7 TYTGRFSLEPAPNSGNTLWPEPLFSLVS-GLVSMTNPPASSSSAPSPAASSASASQSPPL :: :.::..: : . .:: ....:: :... .. :::.... : ...: . . :: CCDS44 TYMGKFSIDPQ-YPGASCYPEGIINIVSAGILQGVTSPASTTASSSVTSASPNPLATGPL 50 60 70 80 90 200 210 220 230 240 pF1KB7 S-CAVPSN--DSSPIYSAAPTFPTPNT----DIFPEPQS--QAFPGSAGTALQYPPP-AY . :.. .. : . .:: : : : . :.. .:.. .: :....: :::: .: CCDS44 GVCTMSQTQPDLDHLYSPPPP-PPPYSGCAGDLYQDPSAFLSAATTSTSSSLAYPPPPSY 100 110 120 130 140 150 250 260 270 280 290 pF1KB7 PAAKGGFQ---VPMIPDY--LFPQQ-QGDL-GLGTPDQKPFQ-GLESRTQQPSLTPLSTI :. : . . :::::: .::.: : :: : . ::.::: :.. : ::::::: CCDS44 PSPKPATDPGLFPMIPDYPGFFPSQCQRDLHGTAGPDRKPFPCPLDTLRVPPPLTPLSTI 160 170 180 190 200 210 300 310 320 pF1KB7 KAFA------------TQSGSQDLK-----------ALNTSYQSQLI--KPS-RMRKYPN . :. ...::. . : ..:. . . .: : ::::: CCDS44 RNFTLGGPSAGVTGPGASGGSEGPRLPGSSSAAAAAAAAAAYNPHHLPLRPILRPRKYPN 220 230 240 250 260 270 330 340 350 360 370 380 pF1KB7 RPSKTPPHERPYACPVESCDRRFSRSDELTRHIRIHTGQKPFQCRICMRNFSRSDHLTTH :::::: ::::: ::.:.::::::::::::::::::::.::::::::::::::::::::: CCDS44 RPSKTPVHERPYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNFSRSDHLTTH 280 290 300 310 320 330 390 400 410 420 430 440 pF1KB7 IRTHTGEKPFACDICGRKFARSDERKRHTKIHLRQKDKKADK---SVVA-SSATSSLSSY ::::::::::::: ::::::::::::::::::::::..:.. :: : :.:. : . CCDS44 IRTHTGEKPFACDYCGRKFARSDERKRHTKIHLRQKERKSSAPSASVPAPSTASCSGGVQ 340 350 360 370 380 390 450 460 470 480 490 500 pF1KB7 PSPVATSYPSPVTTSYP-SPATTSYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSS :. . : : . : .: .. .: CCDS44 PGGTLCSSNSSSLGGGPLAPCSSRTRTP 400 410 420 >>CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10 (476 aa) initn: 939 init1: 708 opt: 823 Z-score: 412.4 bits: 85.9 E(32554): 1.2e-16 Smith-Waterman score: 1019; 43.1% identity (66.7% similar) in 448 aa overlap (80-469:32-476) 50 60 70 80 90 100 pF1KB7 GAAGAPEGSGSNSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEHLTA---ESFP ...: :. :.:. : :...... ... CCDS72 MTAKAVDKIPVTLSGFVHQLSDNIYPVEDLAATSVTIFPNAELG-GPFDQMNGVAGDGMI 10 20 30 40 50 60 110 120 130 140 150 160 pF1KB7 DISLNNEKVLVETSYPSQ-----TTRLPPITYTGRFSLEPAPNSGNTLWPEPLFSLVS-G .:....:: .. :::. . : .:: :.::..: : . .:: ....:: : CCDS72 NIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSIDPQ-YPGASCYPEGIINIVSAG 70 80 90 100 110 170 180 190 200 210 pF1KB7 LVSMTNPPASSSSAPSPAASSASASQSPPLS-CAVPSN--DSSPIYSAAPTFPTPNT--- ... .. :::.... : ...: . . ::. :.. .. : . .:: : : : . CCDS72 ILQGVTSPASTTASSSVTSASPNPLATGPLGVCTMSQTQPDLDHLYSPPPP-PPPYSGCA 120 130 140 150 160 170 220 230 240 250 260 pF1KB7 -DIFPEPQS--QAFPGSAGTALQYPPP-AYPAAKGGFQ---VPMIPDY--LFPQQ-QGDL :.. .:.. .: :....: :::: .::. : . . :::::: .::.: : :: CCDS72 GDLYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDL 180 190 200 210 220 230 270 280 290 300 pF1KB7 -GLGTPDQKPFQ-GLESRTQQPSLTPLSTIKAFA------------TQSGSQDLK----- : . ::.::: :.. : :::::::. :. ...::. . CCDS72 HGTAGPDRKPFPCPLDTLRVPPPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSS 240 250 260 270 280 290 310 320 330 340 350 pF1KB7 ------ALNTSYQSQLI--KPS-RMRKYPNRPSKTPPHERPYACPVESCDRRFSRSDELT : ..:. . . .: : ::::::::::: ::::: ::.:.:::::::::::: CCDS72 SAAAAAAAAAAYNPHHLPLRPILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELT 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB7 RHIRIHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDICGRKFARSDERKRHTK ::::::::.:::::::::::::::::::::::::::::::::: :::::::::::::::: CCDS72 RHIRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTK 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB7 IHLRQKDKKADK---SVVA-SSATSSLSSYPSPVATSYPSPVTTSYP-SPATTSYPSPVP ::::::..:.. :: : :.:. : . :. . : : . : .: .. .: CCDS72 IHLRQKERKSSAPSASVPAPSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB7 TSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVTNSFSASTGLSDM 543 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 09:59:15 2016 done: Sun Nov 6 09:59:16 2016 Total Scan time: 4.400 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]