FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3428, 602 aa 1>>>pF1KE3428 602 - 602 aa - 602 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.4088+/-0.000881; mu= 14.1784+/- 0.053 mean_var=87.0859+/-17.300, 0's: 0 Z-trim(107.4): 16 B-trim: 2 in 1/49 Lambda= 0.137436 statistics sampled from 9568 (9576) to 9568 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.655), E-opt: 0.2 (0.294), width: 16 Scan time: 3.510 The best scores are: opt bits E(32554) CCDS54749.1 LCORL gene_id:254251|Hs108|chr4 ( 602) 3946 792.5 0 CCDS3425.1 LCORL gene_id:254251|Hs108|chr4 ( 318) 1741 355.2 7.3e-98 CCDS53561.1 LCOR gene_id:84458|Hs108|chr10 ( 406) 389 87.2 4.5e-17 CCDS7451.1 LCOR gene_id:84458|Hs108|chr10 ( 433) 389 87.2 4.8e-17 >>CCDS54749.1 LCORL gene_id:254251|Hs108|chr4 (602 aa) initn: 3946 init1: 3946 opt: 3946 Z-score: 4228.9 bits: 792.5 E(32554): 0 Smith-Waterman score: 3946; 100.0% identity (100.0% similar) in 602 aa overlap (1-602:1-602) 10 20 30 40 50 60 pF1KE3 MDKGRERMAAAAAAAAAAAAAAQCRSPRCAAERRGFRRELDSWRHRLMHCVGFESILEGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MDKGRERMAAAAAAAAAAAAAAQCRSPRCAAERRGFRRELDSWRHRLMHCVGFESILEGL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 YGPRLRRDLSLFEDCEPEELTDWSMDEKCSFCNLQREAVSDCIPSLDSSQSTPTEELSSQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 YGPRLRRDLSLFEDCEPEELTDWSMDEKCSFCNLQREAVSDCIPSLDSSQSTPTEELSSQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 GQSNTDKIECQAENYLNALFRKKDLPQNCDPNIPLVAQELMKKMIRQFAIEYISKSGKTQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GQSNTDKIECQAENYLNALFRKKDLPQNCDPNIPLVAQELMKKMIRQFAIEYISKSGKTQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 ENRNGSIGPSIVCKSIQMNQAENSLQEEQEGPLDLTVNRMQEQNTQQGDGVLDLSTKKTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 ENRNGSIGPSIVCKSIQMNQAENSLQEEQEGPLDLTVNRMQEQNTQQGDGVLDLSTKKTS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 IKSEESSICDPSSENSVAGRLHRNREDYVERSAEFADGLLSKALKDIQSGALDINKAGIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 IKSEESSICDPSSENSVAGRLHRNREDYVERSAEFADGLLSKALKDIQSGALDINKAGIL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 YGIPQKTLLLHLEALPAGKPASFKNKTRDFHDSYSYKDSKETCAVLQKVALWARAQAERT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 YGIPQKTLLLHLEALPAGKPASFKNKTRDFHDSYSYKDSKETCAVLQKVALWARAQAERT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 EKSKLNLLETSEIKFPTASTYLHQLTLQKMVTQFKEKNESLQYETSNPTVQLKIPQLRVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 EKSKLNLLETSEIKFPTASTYLHQLTLQKMVTQFKEKNESLQYETSNPTVQLKIPQLRVS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 SVSKSQPDGSGLLDVMYQVSKTSSVLEGSALQKLKNILPKQNKIECSGPVTHSSVDSYFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 SVSKSQPDGSGLLDVMYQVSKTSSVLEGSALQKLKNILPKQNKIECSGPVTHSSVDSYFL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 HGDLSPLCLNSKNGTVDGTSENTEDGLDRKDSKQPRKKRGRYRQYDHEIMEEAIAMVMSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 HGDLSPLCLNSKNGTVDGTSENTEDGLDRKDSKQPRKKRGRYRQYDHEIMEEAIAMVMSG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 KMSVSKAQGIYGVPHSTLEYKVKERSGTLKTPPKKKLRLPDTGLYNMTDSGTGSCKNSSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 KMSVSKAQGIYGVPHSTLEYKVKERSGTLKTPPKKKLRLPDTGLYNMTDSGTGSCKNSSK 550 560 570 580 590 600 pF1KE3 PV :: CCDS54 PV >>CCDS3425.1 LCORL gene_id:254251|Hs108|chr4 (318 aa) initn: 1838 init1: 1741 opt: 1741 Z-score: 1870.4 bits: 355.2 E(32554): 7.3e-98 Smith-Waterman score: 1741; 95.6% identity (97.8% similar) in 274 aa overlap (1-274:1-274) 10 20 30 40 50 60 pF1KE3 MDKGRERMAAAAAAAAAAAAAAQCRSPRCAAERRGFRRELDSWRHRLMHCVGFESILEGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MDKGRERMAAAAAAAAAAAAAAQCRSPRCAAERRGFRRELDSWRHRLMHCVGFESILEGL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 YGPRLRRDLSLFEDCEPEELTDWSMDEKCSFCNLQREAVSDCIPSLDSSQSTPTEELSSQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 YGPRLRRDLSLFEDCEPEELTDWSMDEKCSFCNLQREAVSDCIPSLDSSQSTPTEELSSQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 GQSNTDKIECQAENYLNALFRKKDLPQNCDPNIPLVAQELMKKMIRQFAIEYISKSGKTQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 GQSNTDKIECQAENYLNALFRKKDLPQNCDPNIPLVAQELMKKMIRQFAIEYISKSGKTQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 ENRNGSIGPSIVCKSIQMNQAENSLQEEQEGPLDLTVNRMQEQNTQQGDGVLDLSTKKTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 ENRNGSIGPSIVCKSIQMNQAENSLQEEQEGPLDLTVNRMQEQNTQQGDGVLDLSTKKTS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 IKSEESSICDPSSENSVAGRLHRNREDYVERSAEFADGLLSKALKDIQSGALDINKAGIL ::::::::::::::::::: :. . .. .. : : CCDS34 IKSEESSICDPSSENSVAGMLQVKTDEKLNVSDENTASCPLSPIKMCLNRPIEWNLNLTT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 YGIPQKTLLLHLEALPAGKPASFKNKTRDFHDSYSYKDSKETCAVLQKVALWARAQAERT CCDS34 ASLTSCTVHNQNLKSEEK 310 >>CCDS53561.1 LCOR gene_id:84458|Hs108|chr10 (406 aa) initn: 571 init1: 383 opt: 389 Z-score: 419.9 bits: 87.2 E(32554): 4.5e-17 Smith-Waterman score: 607; 35.7% identity (60.0% similar) in 443 aa overlap (161-579:1-403) 140 150 160 170 180 pF1KE3 QAENYLNALFRKKDLPQNCDPNIPLVAQELMKKMIRQFAIEYISKSGKTQE------NRN :..::.::: :: ::...::. ..: CCDS53 MQRMIQQFAAEYTSKNSSTQDPSQPNSTKN 10 20 30 190 200 210 220 230 pF1KE3 GSIGP-SIVCKSIQMNQAENS-----LQEEQEGPLDLTVNRMQEQNTQQGDGVLDLSTKK :. : : : ..: :. .:..:::::: . : . ..: :::::::::: CCDS53 QSLPKASPVTTSPTAATTQNPVLSKLLMADQDSPLDLTVRKSQSEPSEQ-DGVLDLSTKK 40 50 60 70 80 240 250 260 270 280 290 pF1KE3 T----SIKSEESSICDPSSENSVAGRLHRNREDYVERSAEFADGLLSKALKDIQSGALDI . : . .: :. .. :. :: . : : . ::. ::. ..:.: :. . CCDS53 SPCAGSTSLSHSPGCSSTQGNGRPGRPSQYRPDGL-RSG---DGVPPRSLQD---GTREG 90 100 110 120 130 140 300 310 320 330 340 350 pF1KE3 NKAGILYGIP-QKTLLLHLEALPAGK---PASFKNKTRDFHDSYSYKDSKETCAVLQKVA . .: ..: . : : .. ::. . . : .. .:.. : CCDS53 FGHSTSLKVPLARSLQISEELLSRNQLSTAASLGPSGLQNHGQH---------LILSREA 150 160 170 180 190 360 370 380 390 400 pF1KE3 LWARAQAERTEKSKLNLLETSEIKFPTASTYLHQLT-LQKMVTQFKEKNESLQYETSNPT ::. . : . :.... .. .. . .: . . . ::. : :. ... . :.: CCDS53 SWAKPHYE-FNLSRMKFRGNGALSNISDLPFLAENSAFPKMALQAKQDGKK-DVSHSSP- 200 210 220 230 240 250 410 420 430 440 450 460 pF1KE3 VQLKIPQLRVSSVS-KSQPDGSGLLDVMYQVSKTSSVLEGSALQKLKNILPKQNK--IEC :.:::::.: ..: .:. . . . . :.: :.: .::. :::::.. . CCDS53 VDLKIPQVRGMDLSWESRTGDQYSYSSLVMGSQTESALS----KKLRAILPKQSRKSMLD 260 270 280 290 300 470 480 490 500 510 520 pF1KE3 SGPVTHSSVDSYFLHGDLSPLCLNSKNGTVDGTSENTEDGLDRKDSKQPRKKRGRYRQYD .:: ::. : .. . ...: : : ::::::::::::::. CCDS53 AGP------DSW---G-------SDAEQSTSGQPYPTSDQEGDPGSKQPRKKRGRYRQYN 310 320 330 340 350 530 540 550 560 570 580 pF1KE3 HEIMEEAIAMVMSGKMSVSKAQGIYGVPHSTLEYKVKERSGTLKTPPKKKLRLPDTGLYN ::.::::..::::::::::::.:::.:::::::::::: ::::.:::::..: CCDS53 SEILEEAISVVMSGKMSVSKAQSIYGIPHSTLEYKVKERLGTLKNPPKKKMKLMSG 360 370 380 390 400 590 600 pF1KE3 MTDSGTGSCKNSSKPV >>CCDS7451.1 LCOR gene_id:84458|Hs108|chr10 (433 aa) initn: 571 init1: 383 opt: 389 Z-score: 419.5 bits: 87.2 E(32554): 4.8e-17 Smith-Waterman score: 607; 35.7% identity (60.0% similar) in 443 aa overlap (161-579:1-403) 140 150 160 170 180 pF1KE3 QAENYLNALFRKKDLPQNCDPNIPLVAQELMKKMIRQFAIEYISKSGKTQE------NRN :..::.::: :: ::...::. ..: CCDS74 MQRMIQQFAAEYTSKNSSTQDPSQPNSTKN 10 20 30 190 200 210 220 230 pF1KE3 GSIGP-SIVCKSIQMNQAENS-----LQEEQEGPLDLTVNRMQEQNTQQGDGVLDLSTKK :. : : : ..: :. .:..:::::: . : . ..: :::::::::: CCDS74 QSLPKASPVTTSPTAATTQNPVLSKLLMADQDSPLDLTVRKSQSEPSEQ-DGVLDLSTKK 40 50 60 70 80 240 250 260 270 280 290 pF1KE3 T----SIKSEESSICDPSSENSVAGRLHRNREDYVERSAEFADGLLSKALKDIQSGALDI . : . .: :. .. :. :: . : : . ::. ::. ..:.: :. . CCDS74 SPCAGSTSLSHSPGCSSTQGNGRPGRPSQYRPDGL-RSG---DGVPPRSLQD---GTREG 90 100 110 120 130 140 300 310 320 330 340 350 pF1KE3 NKAGILYGIP-QKTLLLHLEALPAGK---PASFKNKTRDFHDSYSYKDSKETCAVLQKVA . .: ..: . : : .. ::. . . : .. .:.. : CCDS74 FGHSTSLKVPLARSLQISEELLSRNQLSTAASLGPSGLQNHGQH---------LILSREA 150 160 170 180 190 360 370 380 390 400 pF1KE3 LWARAQAERTEKSKLNLLETSEIKFPTASTYLHQLT-LQKMVTQFKEKNESLQYETSNPT ::. . : . :.... .. .. . .: . . . ::. : :. ... . :.: CCDS74 SWAKPHYE-FNLSRMKFRGNGALSNISDLPFLAENSAFPKMALQAKQDGKK-DVSHSSP- 200 210 220 230 240 250 410 420 430 440 450 460 pF1KE3 VQLKIPQLRVSSVS-KSQPDGSGLLDVMYQVSKTSSVLEGSALQKLKNILPKQNK--IEC :.:::::.: ..: .:. . . . . :.: :.: .::. :::::.. . CCDS74 VDLKIPQVRGMDLSWESRTGDQYSYSSLVMGSQTESALS----KKLRAILPKQSRKSMLD 260 270 280 290 300 470 480 490 500 510 520 pF1KE3 SGPVTHSSVDSYFLHGDLSPLCLNSKNGTVDGTSENTEDGLDRKDSKQPRKKRGRYRQYD .:: ::. : .. . ...: : : ::::::::::::::. CCDS74 AGP------DSW---G-------SDAEQSTSGQPYPTSDQEGDPGSKQPRKKRGRYRQYN 310 320 330 340 350 530 540 550 560 570 580 pF1KE3 HEIMEEAIAMVMSGKMSVSKAQGIYGVPHSTLEYKVKERSGTLKTPPKKKLRLPDTGLYN ::.::::..::::::::::::.:::.:::::::::::: ::::.:::::..: CCDS74 SEILEEAISVVMSGKMSVSKAQSIYGIPHSTLEYKVKERLGTLKNPPKKKMKLMRSEGPD 360 370 380 390 400 410 590 600 pF1KE3 MTDSGTGSCKNSSKPV CCDS74 VSVKIELDPQGEAAQSANESKNE 420 430 602 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 05:07:51 2016 done: Sun Nov 6 05:07:51 2016 Total Scan time: 3.510 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]