FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3428, 602 aa
1>>>pF1KE3428 602 - 602 aa - 602 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.4088+/-0.000881; mu= 14.1784+/- 0.053
mean_var=87.0859+/-17.300, 0's: 0 Z-trim(107.4): 16 B-trim: 2 in 1/49
Lambda= 0.137436
statistics sampled from 9568 (9576) to 9568 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.655), E-opt: 0.2 (0.294), width: 16
Scan time: 3.510
The best scores are: opt bits E(32554)
CCDS54749.1 LCORL gene_id:254251|Hs108|chr4 ( 602) 3946 792.5 0
CCDS3425.1 LCORL gene_id:254251|Hs108|chr4 ( 318) 1741 355.2 7.3e-98
CCDS53561.1 LCOR gene_id:84458|Hs108|chr10 ( 406) 389 87.2 4.5e-17
CCDS7451.1 LCOR gene_id:84458|Hs108|chr10 ( 433) 389 87.2 4.8e-17
>>CCDS54749.1 LCORL gene_id:254251|Hs108|chr4 (602 aa)
initn: 3946 init1: 3946 opt: 3946 Z-score: 4228.9 bits: 792.5 E(32554): 0
Smith-Waterman score: 3946; 100.0% identity (100.0% similar) in 602 aa overlap (1-602:1-602)
10 20 30 40 50 60
pF1KE3 MDKGRERMAAAAAAAAAAAAAAQCRSPRCAAERRGFRRELDSWRHRLMHCVGFESILEGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 MDKGRERMAAAAAAAAAAAAAAQCRSPRCAAERRGFRRELDSWRHRLMHCVGFESILEGL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 YGPRLRRDLSLFEDCEPEELTDWSMDEKCSFCNLQREAVSDCIPSLDSSQSTPTEELSSQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 YGPRLRRDLSLFEDCEPEELTDWSMDEKCSFCNLQREAVSDCIPSLDSSQSTPTEELSSQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 GQSNTDKIECQAENYLNALFRKKDLPQNCDPNIPLVAQELMKKMIRQFAIEYISKSGKTQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 GQSNTDKIECQAENYLNALFRKKDLPQNCDPNIPLVAQELMKKMIRQFAIEYISKSGKTQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 ENRNGSIGPSIVCKSIQMNQAENSLQEEQEGPLDLTVNRMQEQNTQQGDGVLDLSTKKTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 ENRNGSIGPSIVCKSIQMNQAENSLQEEQEGPLDLTVNRMQEQNTQQGDGVLDLSTKKTS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 IKSEESSICDPSSENSVAGRLHRNREDYVERSAEFADGLLSKALKDIQSGALDINKAGIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 IKSEESSICDPSSENSVAGRLHRNREDYVERSAEFADGLLSKALKDIQSGALDINKAGIL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 YGIPQKTLLLHLEALPAGKPASFKNKTRDFHDSYSYKDSKETCAVLQKVALWARAQAERT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 YGIPQKTLLLHLEALPAGKPASFKNKTRDFHDSYSYKDSKETCAVLQKVALWARAQAERT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 EKSKLNLLETSEIKFPTASTYLHQLTLQKMVTQFKEKNESLQYETSNPTVQLKIPQLRVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 EKSKLNLLETSEIKFPTASTYLHQLTLQKMVTQFKEKNESLQYETSNPTVQLKIPQLRVS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 SVSKSQPDGSGLLDVMYQVSKTSSVLEGSALQKLKNILPKQNKIECSGPVTHSSVDSYFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 SVSKSQPDGSGLLDVMYQVSKTSSVLEGSALQKLKNILPKQNKIECSGPVTHSSVDSYFL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 HGDLSPLCLNSKNGTVDGTSENTEDGLDRKDSKQPRKKRGRYRQYDHEIMEEAIAMVMSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 HGDLSPLCLNSKNGTVDGTSENTEDGLDRKDSKQPRKKRGRYRQYDHEIMEEAIAMVMSG
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 KMSVSKAQGIYGVPHSTLEYKVKERSGTLKTPPKKKLRLPDTGLYNMTDSGTGSCKNSSK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 KMSVSKAQGIYGVPHSTLEYKVKERSGTLKTPPKKKLRLPDTGLYNMTDSGTGSCKNSSK
550 560 570 580 590 600
pF1KE3 PV
::
CCDS54 PV
>>CCDS3425.1 LCORL gene_id:254251|Hs108|chr4 (318 aa)
initn: 1838 init1: 1741 opt: 1741 Z-score: 1870.4 bits: 355.2 E(32554): 7.3e-98
Smith-Waterman score: 1741; 95.6% identity (97.8% similar) in 274 aa overlap (1-274:1-274)
10 20 30 40 50 60
pF1KE3 MDKGRERMAAAAAAAAAAAAAAQCRSPRCAAERRGFRRELDSWRHRLMHCVGFESILEGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MDKGRERMAAAAAAAAAAAAAAQCRSPRCAAERRGFRRELDSWRHRLMHCVGFESILEGL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 YGPRLRRDLSLFEDCEPEELTDWSMDEKCSFCNLQREAVSDCIPSLDSSQSTPTEELSSQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 YGPRLRRDLSLFEDCEPEELTDWSMDEKCSFCNLQREAVSDCIPSLDSSQSTPTEELSSQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 GQSNTDKIECQAENYLNALFRKKDLPQNCDPNIPLVAQELMKKMIRQFAIEYISKSGKTQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 GQSNTDKIECQAENYLNALFRKKDLPQNCDPNIPLVAQELMKKMIRQFAIEYISKSGKTQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 ENRNGSIGPSIVCKSIQMNQAENSLQEEQEGPLDLTVNRMQEQNTQQGDGVLDLSTKKTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 ENRNGSIGPSIVCKSIQMNQAENSLQEEQEGPLDLTVNRMQEQNTQQGDGVLDLSTKKTS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 IKSEESSICDPSSENSVAGRLHRNREDYVERSAEFADGLLSKALKDIQSGALDINKAGIL
::::::::::::::::::: :. . .. .. : :
CCDS34 IKSEESSICDPSSENSVAGMLQVKTDEKLNVSDENTASCPLSPIKMCLNRPIEWNLNLTT
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 YGIPQKTLLLHLEALPAGKPASFKNKTRDFHDSYSYKDSKETCAVLQKVALWARAQAERT
CCDS34 ASLTSCTVHNQNLKSEEK
310
>>CCDS53561.1 LCOR gene_id:84458|Hs108|chr10 (406 aa)
initn: 571 init1: 383 opt: 389 Z-score: 419.9 bits: 87.2 E(32554): 4.5e-17
Smith-Waterman score: 607; 35.7% identity (60.0% similar) in 443 aa overlap (161-579:1-403)
140 150 160 170 180
pF1KE3 QAENYLNALFRKKDLPQNCDPNIPLVAQELMKKMIRQFAIEYISKSGKTQE------NRN
:..::.::: :: ::...::. ..:
CCDS53 MQRMIQQFAAEYTSKNSSTQDPSQPNSTKN
10 20 30
190 200 210 220 230
pF1KE3 GSIGP-SIVCKSIQMNQAENS-----LQEEQEGPLDLTVNRMQEQNTQQGDGVLDLSTKK
:. : : : ..: :. .:..:::::: . : . ..: ::::::::::
CCDS53 QSLPKASPVTTSPTAATTQNPVLSKLLMADQDSPLDLTVRKSQSEPSEQ-DGVLDLSTKK
40 50 60 70 80
240 250 260 270 280 290
pF1KE3 T----SIKSEESSICDPSSENSVAGRLHRNREDYVERSAEFADGLLSKALKDIQSGALDI
. : . .: :. .. :. :: . : : . ::. ::. ..:.: :. .
CCDS53 SPCAGSTSLSHSPGCSSTQGNGRPGRPSQYRPDGL-RSG---DGVPPRSLQD---GTREG
90 100 110 120 130 140
300 310 320 330 340 350
pF1KE3 NKAGILYGIP-QKTLLLHLEALPAGK---PASFKNKTRDFHDSYSYKDSKETCAVLQKVA
. .: ..: . : : .. ::. . . : .. .:.. :
CCDS53 FGHSTSLKVPLARSLQISEELLSRNQLSTAASLGPSGLQNHGQH---------LILSREA
150 160 170 180 190
360 370 380 390 400
pF1KE3 LWARAQAERTEKSKLNLLETSEIKFPTASTYLHQLT-LQKMVTQFKEKNESLQYETSNPT
::. . : . :.... .. .. . .: . . . ::. : :. ... . :.:
CCDS53 SWAKPHYE-FNLSRMKFRGNGALSNISDLPFLAENSAFPKMALQAKQDGKK-DVSHSSP-
200 210 220 230 240 250
410 420 430 440 450 460
pF1KE3 VQLKIPQLRVSSVS-KSQPDGSGLLDVMYQVSKTSSVLEGSALQKLKNILPKQNK--IEC
:.:::::.: ..: .:. . . . . :.: :.: .::. :::::.. .
CCDS53 VDLKIPQVRGMDLSWESRTGDQYSYSSLVMGSQTESALS----KKLRAILPKQSRKSMLD
260 270 280 290 300
470 480 490 500 510 520
pF1KE3 SGPVTHSSVDSYFLHGDLSPLCLNSKNGTVDGTSENTEDGLDRKDSKQPRKKRGRYRQYD
.:: ::. : .. . ...: : : ::::::::::::::.
CCDS53 AGP------DSW---G-------SDAEQSTSGQPYPTSDQEGDPGSKQPRKKRGRYRQYN
310 320 330 340 350
530 540 550 560 570 580
pF1KE3 HEIMEEAIAMVMSGKMSVSKAQGIYGVPHSTLEYKVKERSGTLKTPPKKKLRLPDTGLYN
::.::::..::::::::::::.:::.:::::::::::: ::::.:::::..:
CCDS53 SEILEEAISVVMSGKMSVSKAQSIYGIPHSTLEYKVKERLGTLKNPPKKKMKLMSG
360 370 380 390 400
590 600
pF1KE3 MTDSGTGSCKNSSKPV
>>CCDS7451.1 LCOR gene_id:84458|Hs108|chr10 (433 aa)
initn: 571 init1: 383 opt: 389 Z-score: 419.5 bits: 87.2 E(32554): 4.8e-17
Smith-Waterman score: 607; 35.7% identity (60.0% similar) in 443 aa overlap (161-579:1-403)
140 150 160 170 180
pF1KE3 QAENYLNALFRKKDLPQNCDPNIPLVAQELMKKMIRQFAIEYISKSGKTQE------NRN
:..::.::: :: ::...::. ..:
CCDS74 MQRMIQQFAAEYTSKNSSTQDPSQPNSTKN
10 20 30
190 200 210 220 230
pF1KE3 GSIGP-SIVCKSIQMNQAENS-----LQEEQEGPLDLTVNRMQEQNTQQGDGVLDLSTKK
:. : : : ..: :. .:..:::::: . : . ..: ::::::::::
CCDS74 QSLPKASPVTTSPTAATTQNPVLSKLLMADQDSPLDLTVRKSQSEPSEQ-DGVLDLSTKK
40 50 60 70 80
240 250 260 270 280 290
pF1KE3 T----SIKSEESSICDPSSENSVAGRLHRNREDYVERSAEFADGLLSKALKDIQSGALDI
. : . .: :. .. :. :: . : : . ::. ::. ..:.: :. .
CCDS74 SPCAGSTSLSHSPGCSSTQGNGRPGRPSQYRPDGL-RSG---DGVPPRSLQD---GTREG
90 100 110 120 130 140
300 310 320 330 340 350
pF1KE3 NKAGILYGIP-QKTLLLHLEALPAGK---PASFKNKTRDFHDSYSYKDSKETCAVLQKVA
. .: ..: . : : .. ::. . . : .. .:.. :
CCDS74 FGHSTSLKVPLARSLQISEELLSRNQLSTAASLGPSGLQNHGQH---------LILSREA
150 160 170 180 190
360 370 380 390 400
pF1KE3 LWARAQAERTEKSKLNLLETSEIKFPTASTYLHQLT-LQKMVTQFKEKNESLQYETSNPT
::. . : . :.... .. .. . .: . . . ::. : :. ... . :.:
CCDS74 SWAKPHYE-FNLSRMKFRGNGALSNISDLPFLAENSAFPKMALQAKQDGKK-DVSHSSP-
200 210 220 230 240 250
410 420 430 440 450 460
pF1KE3 VQLKIPQLRVSSVS-KSQPDGSGLLDVMYQVSKTSSVLEGSALQKLKNILPKQNK--IEC
:.:::::.: ..: .:. . . . . :.: :.: .::. :::::.. .
CCDS74 VDLKIPQVRGMDLSWESRTGDQYSYSSLVMGSQTESALS----KKLRAILPKQSRKSMLD
260 270 280 290 300
470 480 490 500 510 520
pF1KE3 SGPVTHSSVDSYFLHGDLSPLCLNSKNGTVDGTSENTEDGLDRKDSKQPRKKRGRYRQYD
.:: ::. : .. . ...: : : ::::::::::::::.
CCDS74 AGP------DSW---G-------SDAEQSTSGQPYPTSDQEGDPGSKQPRKKRGRYRQYN
310 320 330 340 350
530 540 550 560 570 580
pF1KE3 HEIMEEAIAMVMSGKMSVSKAQGIYGVPHSTLEYKVKERSGTLKTPPKKKLRLPDTGLYN
::.::::..::::::::::::.:::.:::::::::::: ::::.:::::..:
CCDS74 SEILEEAISVVMSGKMSVSKAQSIYGIPHSTLEYKVKERLGTLKNPPKKKMKLMRSEGPD
360 370 380 390 400 410
590 600
pF1KE3 MTDSGTGSCKNSSKPV
CCDS74 VSVKIELDPQGEAAQSANESKNE
420 430
602 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 05:07:51 2016 done: Sun Nov 6 05:07:51 2016
Total Scan time: 3.510 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]