FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7986, 325 aa
1>>>pF1KB7986 325 - 325 aa - 325 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.0419+/-0.000794; mu= 7.9806+/- 0.048
mean_var=109.5141+/-21.509, 0's: 0 Z-trim(111.2): 18 B-trim: 0 in 0/51
Lambda= 0.122557
statistics sampled from 12196 (12214) to 12196 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.753), E-opt: 0.2 (0.375), width: 16
Scan time: 2.860
The best scores are: opt bits E(32554)
CCDS4155.1 IRF1 gene_id:3659|Hs108|chr5 ( 325) 2245 407.3 8.6e-114
CCDS3835.1 IRF2 gene_id:3660|Hs108|chr4 ( 349) 722 138.0 1.1e-32
CCDS10956.1 IRF8 gene_id:3394|Hs108|chr16 ( 426) 395 80.2 3.2e-15
CCDS4469.1 IRF4 gene_id:3662|Hs108|chr6 ( 451) 382 77.9 1.7e-14
CCDS43645.1 IRF5 gene_id:3663|Hs108|chr7 ( 514) 382 78.0 1.9e-14
CCDS56512.1 IRF5 gene_id:3663|Hs108|chr7 ( 412) 377 77.0 2.8e-14
CCDS5808.1 IRF5 gene_id:3663|Hs108|chr7 ( 498) 377 77.1 3.3e-14
CCDS1492.1 IRF6 gene_id:3664|Hs108|chr1 ( 467) 360 74.0 2.5e-13
CCDS9615.1 IRF9 gene_id:10379|Hs108|chr14 ( 393) 350 72.2 7.4e-13
>>CCDS4155.1 IRF1 gene_id:3659|Hs108|chr5 (325 aa)
initn: 2245 init1: 2245 opt: 2245 Z-score: 2156.4 bits: 407.3 E(32554): 8.6e-114
Smith-Waterman score: 2245; 100.0% identity (100.0% similar) in 325 aa overlap (1-325:1-325)
10 20 30 40 50 60
pF1KB7 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKDACLFRSWAI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKDACLFRSWAI
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 HTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRMLPPLTKNQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 HTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRMLPPLTKNQR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 KERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSSYTVPGYMQDLEVEQALT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 KERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSSYTVPGYMQDLEVEQALT
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 PALSPCAVSSTLPDWHIPVEVVPDSTSDLYNFQVSPMPSTSEATTDEDEEGKLPEDIMKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 PALSPCAVSSTLPDWHIPVEVVPDSTSDLYNFQVSPMPSTSEATTDEDEEGKLPEDIMKL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 LEQSEWQPTNVDGKGYLLNEPGVQPTSVYGDFSCKEEPEIDSPGGDIGLSLQRVFTDLKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 LEQSEWQPTNVDGKGYLLNEPGVQPTSVYGDFSCKEEPEIDSPGGDIGLSLQRVFTDLKN
250 260 270 280 290 300
310 320
pF1KB7 MDATWLDSLLTPVRLPSIQAIPCAP
:::::::::::::::::::::::::
CCDS41 MDATWLDSLLTPVRLPSIQAIPCAP
310 320
>>CCDS3835.1 IRF2 gene_id:3660|Hs108|chr4 (349 aa)
initn: 718 init1: 675 opt: 722 Z-score: 700.5 bits: 138.0 E(32554): 1.1e-32
Smith-Waterman score: 760; 46.7% identity (67.6% similar) in 272 aa overlap (1-259:1-265)
10 20 30 40 50 60
pF1KB7 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKDACLFRSWAI
::. ::::::::: ::::: :::: :.:::. :::::: :::.::::..::: :::.:::
CCDS38 MPVERMRMRPWLEEQINSNTIPGLKWLNKEKKIFQIPWMHAARHGWDVEKDAPLFRNWAI
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 HTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRMLPPLTKNQR
:::... : .:::::::::::::::::::::::::.: .::..: ::::::: . ..
CCDS38 HTGKHQPGVDKPDPKTWKANFRCAMNSLPDIEEVKDKSIKKGNNAFRVYRMLPLSERPSK
70 80 90 100 110 120
130 140 150 160 170
pF1KB7 KERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSSYT------VPGYMQDLE
: .: :. .. : : .. .:: .:.:.:. : ... : : . .. .
CCDS38 KGKKPKTEKEDKVKHIKQEPVESSLG-LSNGVSD--LSPEYAVLTSTIKNEVDSTVNIIV
130 140 150 160 170
180 190 200 210 220
pF1KB7 VEQA-LTPALSPCAVSSTLPDWHIPVEVV------PDSTSDLYNFQVSPMPSTSEATTDE
: :. : . . .. :: :::. : : :.:: .:.::. : .:. : .
CCDS38 VGQSHLDSNIENQEIVTNPPDICQVVEVTTESDEQPVSMSELYPLQISPVSSYAESETTD
180 190 200 210 220 230
230 240 250 260 270 280
pF1KB7 DEEGKLPEDIMKLLEQSEWQPTNVDGKGYLLNEPGVQPTSVYGDFSCKEEPEIDSPGGDI
. .: : . . .:. :..:: :: :
CCDS38 S----VPSDEESAEGRPHWRKRNIEGKQYLSNMGTRGSYLLPGMASFVTSNKPDLQVTIK
240 250 260 270 280 290
290 300 310 320
pF1KB7 GLSLQRVFTDLKNMDATWLDSLLTPVRLPSIQAIPCAP
CCDS38 EESNPVPYNSSWPPFQDLPLSSSMTPASSSSRPDRETRASVIKKTSDITQARVKSC
300 310 320 330 340
>>CCDS10956.1 IRF8 gene_id:3394|Hs108|chr16 (426 aa)
initn: 455 init1: 235 opt: 395 Z-score: 386.7 bits: 80.2 E(32554): 3.2e-15
Smith-Waterman score: 408; 31.2% identity (57.5% similar) in 266 aa overlap (7-270:9-243)
10 20 30 40 50
pF1KB7 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKDACLFRSW
:.: :: ::.:.. ::::: :.:. .:.::::::.:. .. . :: .:..:
CCDS10 MCDRNGGRRLRQWLIEQIDSSMYPGLIWENEEKSMFRIPWKHAGKQDYNQEVDASIFKAW
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB7 AIHTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRMLPPLTKN
:. :..: :.: .: :::. .:::.:. ::.::: :.:. : .:::..: ..
CCDS10 AVFKGKFKEGDKA-EPATWKTRLRCALNKSPDFEEVTDRSQLDISEPYKVYRIVP---EE
70 80 90 100 110
120 130 140 150 160 170
pF1KB7 QRKERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSSYTVPGYMQDLEVEQA
..: . . .. ... . :: : : . .. .. : :: ....
CCDS10 EQKCKLGVATAGCVNEVTEMECGRSEIDEL---IKEPSVDD---------YMG--MIKRS
120 130 140 150 160
180 190 200 210 220 230
pF1KB7 LTPALSPCAVSSTLPDW--HIPVEVVPDSTSDLYNFQVSPMPSTSEATTDEDEEGKLPED
.: : :. :::: . : :: :. :. . . :. . . :::
CCDS10 PSPP-EACR-SQLLPDWWAQQPSTGVPLVTG--YTTYDAHHSAFSQMVISFYYGGKLV--
170 180 190 200 210
240 250 260 270 280 290
pF1KB7 IMKLLEQSEWQPTNVDGKGYLLNEPGVQPTSVYGDFSCKEEPEIDSPGGDIGLSLQRVFT
.. : .: :..::. :..::
CCDS10 -------GQATTTCPEGCRLSLSQPGLPGTKLYGPEGLELVRFPPADAIPSERQRQVTRK
220 230 240 250 260
300 310 320
pF1KB7 DLKNMDATWLDSLLTPVRLPSIQAIPCAP
CCDS10 LFGHLERGVLLHSSRQGVFVKRLCQGRVFCSGNAVVCKGRPNKLERDEVVQVFDTSQFFR
270 280 290 300 310 320
>>CCDS4469.1 IRF4 gene_id:3662|Hs108|chr6 (451 aa)
initn: 406 init1: 382 opt: 382 Z-score: 373.9 bits: 77.9 E(32554): 1.7e-14
Smith-Waterman score: 382; 43.1% identity (75.9% similar) in 116 aa overlap (7-122:23-138)
10 20 30 40
pF1KB7 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKH
..: :: ::.:.. :::.: :.:. ::.::::::.:.
CCDS44 MNLEGGGRGGEFGMSAVSCGNGKLRQWLIDQIDSGKYPGLVWENEEKSIFRIPWKHAGKQ
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB7 GWDINKDACLFRSWAIHTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSS
.. ..:: ::..::. :... : .::: :::. .:::.:. :.::. ..:. :.
CCDS44 DYNREEDAALFKAWALFKGKFREGIDKPDPPTWKTRLRCALNKSNDFEELVERSQLDISD
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB7 AVRVYRMLPPLTKNQRKERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSSY
.:::..: .:. :.
CCDS44 PYKVYRIVPEGAKKGAKQLTLEDPQMSMSHPYTMTTPYPSLPAQQVHNYMMPPLDRSWRD
130 140 150 160 170 180
>>CCDS43645.1 IRF5 gene_id:3663|Hs108|chr7 (514 aa)
initn: 376 init1: 324 opt: 382 Z-score: 373.0 bits: 78.0 E(32554): 1.9e-14
Smith-Waterman score: 385; 28.7% identity (52.5% similar) in 341 aa overlap (2-322:11-322)
10 20 30 40 50
pF1KB7 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKD
: :.:..::: :.:: : ::: :.: :. .: :::.::..:: . . :
CCDS43 MNQSIPVAPTPPRRVRLKPWLVAQVNSCQYPGLQWVNGEKKLFCIPWRHATRHGPSQDGD
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB7 ACLFRSWAIHTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRM
.:..:: .::.: : : :: ::::.:::.:. :.. . : :. . ..:..
CCDS43 NTIFKAWAKETGKYTEGVDEADPAKWKANLRCALNKSRDFRLIYDGPRDMPPQPYKIYEV
70 80 90 100 110 120
120 130 140 150 160
pF1KB7 LPPLTKNQRKERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSS--YTVPGY
.: :. .: . : .. . . .. : : .: : .: . .:
CCDS43 ----CSNGPAPTDSQPPEDYSFGAGEE---EEEEEELQRMLPSLSLTDAVQSGPHMTPYS
130 140 150 160 170
170 180 190 200 210 220
pF1KB7 M--QDLEVEQALTP-ALSPCAVSSTLPDWHIPVEVVPDSTSDLYNFQVSPMPSTS----E
. .:.. .: : .: : ... : . :: . : . . ..: :.. :
CCDS43 LLKEDVKWPPTLQPPTLRPPTLQP--PTLQPPVVLGPPAPDP---SPLAPPPGNPAGFRE
180 190 200 210 220
230 240 250 260 270
pF1KB7 ATTDEDEEGKLPEDIMKLLEQSEWQPTNVDGKGYLLNEPGVQP-TSVYGDFSCKEEPE--
.. : : :: .. :: : :: : . : :.. :. . .:
CCDS43 LLSEVLEPGPLPASLPPAGEQ--LLPD-------LLISPHMLPLTDLEIKFQYRGRPPRA
230 240 250 260 270
280 290 300 310 320
pF1KB7 --IDSPGGDIGLSLQRVFTDLKNMDATWLD-SLLTP-----VRLPSIQAIPCAP
:..: : :.: ....:: . :. : ::.:: . ::
CCDS43 LTISNPHG------CRLF--YSQLEATQEQVELFGPISLEQVRFPSPEDIPSDKQRFYTN
280 290 300 310 320 330
CCDS43 QLLDVLDRGLILQLQGQDLYAIRLCQCKVFWSGPCASAHDSCPNPIQREVKTKLFSLEHF
340 350 360 370 380 390
>>CCDS56512.1 IRF5 gene_id:3663|Hs108|chr7 (412 aa)
initn: 374 init1: 324 opt: 377 Z-score: 369.8 bits: 77.0 E(32554): 2.8e-14
Smith-Waterman score: 377; 40.9% identity (64.6% similar) in 127 aa overlap (2-125:11-137)
10 20 30 40 50
pF1KB7 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKD
: :.:..::: :.:: : ::: :.: :. .: :::.::..:: . . :
CCDS56 MNQSIPVAPTPPRRVRLKPWLVAQVNSCQYPGLQWVNGEKKLFCIPWRHATRHGPSQDGD
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB7 ACLFRSWAIHTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRM
.:..:: .::.: : : :: ::::.:::.:. :.. . : :. . ..:..
CCDS56 NTIFKAWAKETGKYTEGVDEADPAKWKANLRCALNKSRDFRLIYDGPRDMPPQPYKIYEV
70 80 90 100 110 120
120 130 140 150 160
pF1KB7 L---PPLTKNQRKERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSSYTVPG
: : .: : :
CCDS56 CSNGPAPTDSQPPEDYSFGAGEEEEEEEELQRMLPSLSLTVTDLEIKFQYRGRPPRALTI
130 140 150 160 170 180
>>CCDS5808.1 IRF5 gene_id:3663|Hs108|chr7 (498 aa)
initn: 427 init1: 375 opt: 377 Z-score: 368.5 bits: 77.1 E(32554): 3.3e-14
Smith-Waterman score: 377; 40.9% identity (64.6% similar) in 127 aa overlap (2-125:11-137)
10 20 30 40 50
pF1KB7 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKD
: :.:..::: :.:: : ::: :.: :. .: :::.::..:: . . :
CCDS58 MNQSIPVAPTPPRRVRLKPWLVAQVNSCQYPGLQWVNGEKKLFCIPWRHATRHGPSQDGD
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB7 ACLFRSWAIHTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRM
.:..:: .::.: : : :: ::::.:::.:. :.. . : :. . ..:..
CCDS58 NTIFKAWAKETGKYTEGVDEADPAKWKANLRCALNKSRDFRLIYDGPRDMPPQPYKIYEV
70 80 90 100 110 120
120 130 140 150 160
pF1KB7 L---PPLTKNQRKERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSSYTVPG
: : .: : :
CCDS58 CSNGPAPTDSQPPEDYSFGAGEEEEEEEELQRMLPSLSLTEDVKWPPTLQPPTLRPPTLQ
130 140 150 160 170 180
>>CCDS1492.1 IRF6 gene_id:3664|Hs108|chr1 (467 aa)
initn: 366 init1: 315 opt: 360 Z-score: 352.7 bits: 74.0 E(32554): 2.5e-13
Smith-Waterman score: 372; 28.1% identity (56.0% similar) in 352 aa overlap (5-325:7-329)
10 20 30 40 50
pF1KB7 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKDACLFRSW
:.:..::: :..:. :::::.... ::::::::..:. . ... .:..:
CCDS14 MALHPRRVRLKPWLVAQVDSGLYPGLIWLHRDSKRFQIPWKHATRHSPQQEEENTIFKAW
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB7 AIHTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRMLPPLTKN
:..::.:. : .::: :::..:::.:. ... . : ... . :..:.. . .
CCDS14 AVETGKYQEGVDDPDPAKWKAQLRCALNKSREFNLMYDGTKEVPMNPVKIYQVCD-IPQP
70 80 90 100 110
120 130 140 150 160 170
pF1KB7 QRKERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSSYTVPGYMQD----LE
: . . :. .: : . : . . : : :.:.. :: .:: :.
CCDS14 QGSIINPGSTGSAPWDEKDN---DVDEEDEEDEL-------DQSQHHVP--IQDTFPFLN
120 130 140 150 160
180 190 200 210 220
pF1KB7 VEQA-LTPA-LSPCAVSSTLPD--WHI--PVEV-VPDSTSDLYNFQVSP-MPSTSEATTD
.. . ..:: .. :.:.. :. : :.:. ::.. . : :: . .: ::
CCDS14 INGSPMAPASVGNCSVGNCSPEAVWPKTEPLEMEVPQAP--IQPFYSSPELWISSLPMTD
170 180 190 200 210 220
230 240 250 260 270 280
pF1KB7 ED----EEGKLPEDIMKLLEQSEWQPTNVDGKGYLLNEPGVQPTS--VYGDFSCKEEPEI
: .:: . : . .: .: . .. : .: . ..: : .. .
CCDS14 LDIKFQYRGKEYGQTMTV--------SNPQGCRLFYGDLGPMPDQEELFGPVSLEQ---V
230 240 250 260 270
290 300 310 320
pF1KB7 DSPGGD-IGLSLQRVFTDLKNMDATWLD-SLLTPVRLPSIQAI-----------PCAP
:: . : :..::. : .:. .: .:. : .: :: ::::
CCDS14 KFPGPEHITNEKQKLFTS-KLLDV--MDRGLILEVSGHAIYAIRLCQCKVYWSGPCAPSL
280 290 300 310 320 330
CCDS14 VAPNLIERQKKVKLFCLETFLSDLIAHQKGQIEKQPPFEIYLCFGEEWPDGKPLERKLIL
340 350 360 370 380 390
>>CCDS9615.1 IRF9 gene_id:10379|Hs108|chr14 (393 aa)
initn: 306 init1: 177 opt: 350 Z-score: 344.3 bits: 72.2 E(32554): 7.4e-13
Smith-Waterman score: 350; 34.0% identity (69.9% similar) in 156 aa overlap (7-154:11-165)
10 20 30 40 50
pF1KB7 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKDACLFR
..: :. :..:.:.::. : . . .:.::::::.:. . ..:: .:.
CCDS96 MASGRARCTRKLRNWVVEQVESGQFPGVCWDDTAKTMFRIPWKHAGKQDFREDQDAAFFK
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB7 SWAIHTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRMLPP-L
.::: :.:: :. : .::. .:::.:. ...:: ...: . .::..::: .
CCDS96 AWAIFKGKYKEGDT-GGPAVWKTRLRCALNKSSEFKEVPERGRMDVAEPYKVYQLLPPGI
70 80 90 100 110
120 130 140 150 160
pF1KB7 TKNQRKERKSKSSRDAKS-KAKRKSCGDS------SPDTFSDGLSSSTLPDDHSSYTVPG
...: .: :.:. .: ...:: :. ::....:.:..
CCDS96 VSGQPGTQKVPSKRQHSSVSSERKEEEDAMQNCTLSPSVLQDSLNNEEEGASGGAVHSDI
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB7 YMQDLEVEQALTPALSPCAVSSTLPDWHIPVEVVPDSTSDLYNFQVSPMPSTSEATTDED
CCDS96 GSSSSSSSPEPQEVTDTTEAPFQGDQRSLEFLLPPEPDYSLLLTFIYNGRVVGEAQVQSL
180 190 200 210 220 230
325 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 14:51:22 2016 done: Sat Nov 5 14:51:22 2016
Total Scan time: 2.860 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]