FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2192, 574 aa 1>>>pF1KE2192 574 - 574 aa - 574 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.9518+/-0.000895; mu= 15.7269+/- 0.054 mean_var=83.8371+/-16.349, 0's: 0 Z-trim(106.7): 33 B-trim: 0 in 0/50 Lambda= 0.140074 statistics sampled from 9090 (9116) to 9090 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.65), E-opt: 0.2 (0.28), width: 16 Scan time: 3.120 The best scores are: opt bits E(32554) CCDS63768.1 MBD4 gene_id:8930|Hs108|chr3 ( 574) 3845 787.2 0 CCDS3058.1 MBD4 gene_id:8930|Hs108|chr3 ( 580) 3823 782.7 0 CCDS63766.1 MBD4 gene_id:8930|Hs108|chr3 ( 572) 3639 745.6 3.9e-215 CCDS63767.1 MBD4 gene_id:8930|Hs108|chr3 ( 540) 3505 718.5 5.3e-207 CCDS63769.1 MBD4 gene_id:8930|Hs108|chr3 ( 262) 1267 266.0 4e-71 >>CCDS63768.1 MBD4 gene_id:8930|Hs108|chr3 (574 aa) initn: 3845 init1: 3845 opt: 3845 Z-score: 4200.8 bits: 787.2 E(32554): 0 Smith-Waterman score: 3845; 100.0% identity (100.0% similar) in 574 aa overlap (1-574:1-574) 10 20 30 40 50 60 pF1KE2 MGTTGLESLSLGDRGAAPTVTSSERLVPDPPNDLRKEDVAMELERVGEDEEQMMIKRSSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 MGTTGLESLSLGDRGAAPTVTSSERLVPDPPNDLRKEDVAMELERVGEDEEQMMIKRSSE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 CNPLLQEPIASAQFGATAGTECRKSVPCGWERVVKQRLFGKTAGRFDVYFISPQGLKFRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 CNPLLQEPIASAQFGATAGTECRKSVPCGWERVVKQRLFGKTAGRFDVYFISPQGLKFRS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 KSSLANYLHKNGETSLKPEDFDFTVLSKRGIKSRYKDCSMAALTSHLQNQSNNSNWNLRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 KSSLANYLHKNGETSLKPEDFDFTVLSKRGIKSRYKDCSMAALTSHLQNQSNNSNWNLRT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 RSKCKKDVFMPPSSSSELQESRGLSNFTSTHLLLKEDEGVDDVNFRKVRKPKGKVTILKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 RSKCKKDVFMPPSSSSELQESRGLSNFTSTHLLLKEDEGVDDVNFRKVRKPKGKVTILKG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 IPIKKTKKGCRKSCSGFVQSDSKRESVCNKADAESEPVAQKSQLDRTVCISDAGACGETL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 IPIKKTKKGCRKSCSGFVQSDSKRESVCNKADAESEPVAQKSQLDRTVCISDAGACGETL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 SVTSEENSLVKKKERSLSSGSNFCSEQKTSGIINKFCSAKDSEHNEKYEDTFLESEEIGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 SVTSEENSLVKKKERSLSSGSNFCSEQKTSGIINKFCSAKDSEHNEKYEDTFLESEEIGT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 KVEVVERKEHLHTDILKRGSEMDNNCSPTRKDFTEDTIPRTQIERRKTSLYFSSKYNKEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 KVEVVERKEHLHTDILKRGSEMDNNCSPTRKDFTEDTIPRTQIERRKTSLYFSSKYNKEA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 LSPPRRKAFKKWTPPRSPFNLVQETLFHDPWKLLIATIFLNRTSGKMAIPVLWKFLEKYP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 LSPPRRKAFKKWTPPRSPFNLVQETLFHDPWKLLIATIFLNRTSGKMAIPVLWKFLEKYP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 SAEVARTADWRDVSELLKPLGLYDLRAKTIVKFSDEYLTKQWKYPIELHGIGKYGNDSYR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 SAEVARTADWRDVSELLKPLGLYDLRAKTIVKFSDEYLTKQWKYPIELHGIGKYGNDSYR 490 500 510 520 530 540 550 560 570 pF1KE2 IFCVNEWKQVHPEDHKLNKYHDWLWENHEKLSLS :::::::::::::::::::::::::::::::::: CCDS63 IFCVNEWKQVHPEDHKLNKYHDWLWENHEKLSLS 550 560 570 >>CCDS3058.1 MBD4 gene_id:8930|Hs108|chr3 (580 aa) initn: 2598 init1: 2598 opt: 3823 Z-score: 4176.7 bits: 782.7 E(32554): 0 Smith-Waterman score: 3823; 99.0% identity (99.0% similar) in 580 aa overlap (1-574:1-580) 10 20 30 40 50 60 pF1KE2 MGTTGLESLSLGDRGAAPTVTSSERLVPDPPNDLRKEDVAMELERVGEDEEQMMIKRSSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 MGTTGLESLSLGDRGAAPTVTSSERLVPDPPNDLRKEDVAMELERVGEDEEQMMIKRSSE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 CNPLLQEPIASAQFGATAGTECRKSVPCGWERVVKQRLFGKTAGRFDVYFISPQGLKFRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 CNPLLQEPIASAQFGATAGTECRKSVPCGWERVVKQRLFGKTAGRFDVYFISPQGLKFRS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 KSSLANYLHKNGETSLKPEDFDFTVLSKRGIKSRYKDCSMAALTSHLQNQSNNSNWNLRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 KSSLANYLHKNGETSLKPEDFDFTVLSKRGIKSRYKDCSMAALTSHLQNQSNNSNWNLRT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 RSKCKKDVFMPPSSSSELQESRGLSNFTSTHLLLKEDEGVDDVNFRKVRKPKGKVTILKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 RSKCKKDVFMPPSSSSELQESRGLSNFTSTHLLLKEDEGVDDVNFRKVRKPKGKVTILKG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 IPIKKTKKGCRKSCSGFVQSDSKRESVCNKADAESEPVAQKSQLDRTVCISDAGACGETL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 IPIKKTKKGCRKSCSGFVQSDSKRESVCNKADAESEPVAQKSQLDRTVCISDAGACGETL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 SVTSEENSLVKKKERSLSSGSNFCSEQKTSGIINKFCSAKDSEHNEKYEDTFLESEEIGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 SVTSEENSLVKKKERSLSSGSNFCSEQKTSGIINKFCSAKDSEHNEKYEDTFLESEEIGT 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 KVEVVERKEHLHTDILKRGSEMDNNCSPTRKDFT------EDTIPRTQIERRKTSLYFSS :::::::::::::::::::::::::::::::::: :::::::::::::::::::: CCDS30 KVEVVERKEHLHTDILKRGSEMDNNCSPTRKDFTGEKIFQEDTIPRTQIERRKTSLYFSS 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE2 KYNKEALSPPRRKAFKKWTPPRSPFNLVQETLFHDPWKLLIATIFLNRTSGKMAIPVLWK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 KYNKEALSPPRRKAFKKWTPPRSPFNLVQETLFHDPWKLLIATIFLNRTSGKMAIPVLWK 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE2 FLEKYPSAEVARTADWRDVSELLKPLGLYDLRAKTIVKFSDEYLTKQWKYPIELHGIGKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 FLEKYPSAEVARTADWRDVSELLKPLGLYDLRAKTIVKFSDEYLTKQWKYPIELHGIGKY 490 500 510 520 530 540 540 550 560 570 pF1KE2 GNDSYRIFCVNEWKQVHPEDHKLNKYHDWLWENHEKLSLS :::::::::::::::::::::::::::::::::::::::: CCDS30 GNDSYRIFCVNEWKQVHPEDHKLNKYHDWLWENHEKLSLS 550 560 570 580 >>CCDS63766.1 MBD4 gene_id:8930|Hs108|chr3 (572 aa) initn: 2598 init1: 2598 opt: 3639 Z-score: 3975.8 bits: 745.6 E(32554): 3.9e-215 Smith-Waterman score: 3639; 98.9% identity (98.9% similar) in 556 aa overlap (1-550:1-556) 10 20 30 40 50 60 pF1KE2 MGTTGLESLSLGDRGAAPTVTSSERLVPDPPNDLRKEDVAMELERVGEDEEQMMIKRSSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 MGTTGLESLSLGDRGAAPTVTSSERLVPDPPNDLRKEDVAMELERVGEDEEQMMIKRSSE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 CNPLLQEPIASAQFGATAGTECRKSVPCGWERVVKQRLFGKTAGRFDVYFISPQGLKFRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 CNPLLQEPIASAQFGATAGTECRKSVPCGWERVVKQRLFGKTAGRFDVYFISPQGLKFRS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 KSSLANYLHKNGETSLKPEDFDFTVLSKRGIKSRYKDCSMAALTSHLQNQSNNSNWNLRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 KSSLANYLHKNGETSLKPEDFDFTVLSKRGIKSRYKDCSMAALTSHLQNQSNNSNWNLRT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 RSKCKKDVFMPPSSSSELQESRGLSNFTSTHLLLKEDEGVDDVNFRKVRKPKGKVTILKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 RSKCKKDVFMPPSSSSELQESRGLSNFTSTHLLLKEDEGVDDVNFRKVRKPKGKVTILKG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 IPIKKTKKGCRKSCSGFVQSDSKRESVCNKADAESEPVAQKSQLDRTVCISDAGACGETL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 IPIKKTKKGCRKSCSGFVQSDSKRESVCNKADAESEPVAQKSQLDRTVCISDAGACGETL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 SVTSEENSLVKKKERSLSSGSNFCSEQKTSGIINKFCSAKDSEHNEKYEDTFLESEEIGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 SVTSEENSLVKKKERSLSSGSNFCSEQKTSGIINKFCSAKDSEHNEKYEDTFLESEEIGT 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 KVEVVERKEHLHTDILKRGSEMDNNCSPTRKDFT------EDTIPRTQIERRKTSLYFSS :::::::::::::::::::::::::::::::::: :::::::::::::::::::: CCDS63 KVEVVERKEHLHTDILKRGSEMDNNCSPTRKDFTGEKIFQEDTIPRTQIERRKTSLYFSS 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE2 KYNKEALSPPRRKAFKKWTPPRSPFNLVQETLFHDPWKLLIATIFLNRTSGKMAIPVLWK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 KYNKEALSPPRRKAFKKWTPPRSPFNLVQETLFHDPWKLLIATIFLNRTSGKMAIPVLWK 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE2 FLEKYPSAEVARTADWRDVSELLKPLGLYDLRAKTIVKFSDEYLTKQWKYPIELHGIGKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 FLEKYPSAEVARTADWRDVSELLKPLGLYDLRAKTIVKFSDEYLTKQWKYPIELHGIGKY 490 500 510 520 530 540 540 550 560 570 pF1KE2 GNDSYRIFCVNEWKQVHPEDHKLNKYHDWLWENHEKLSLS :::::::::::::::: CCDS63 GNDSYRIFCVNEWKQVRLTPIHNSAHLVSEAK 550 560 570 >>CCDS63767.1 MBD4 gene_id:8930|Hs108|chr3 (540 aa) initn: 2598 init1: 2598 opt: 3505 Z-score: 3829.8 bits: 718.5 E(32554): 5.3e-207 Smith-Waterman score: 3505; 98.9% identity (98.9% similar) in 538 aa overlap (1-532:1-538) 10 20 30 40 50 60 pF1KE2 MGTTGLESLSLGDRGAAPTVTSSERLVPDPPNDLRKEDVAMELERVGEDEEQMMIKRSSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 MGTTGLESLSLGDRGAAPTVTSSERLVPDPPNDLRKEDVAMELERVGEDEEQMMIKRSSE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 CNPLLQEPIASAQFGATAGTECRKSVPCGWERVVKQRLFGKTAGRFDVYFISPQGLKFRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 CNPLLQEPIASAQFGATAGTECRKSVPCGWERVVKQRLFGKTAGRFDVYFISPQGLKFRS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 KSSLANYLHKNGETSLKPEDFDFTVLSKRGIKSRYKDCSMAALTSHLQNQSNNSNWNLRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 KSSLANYLHKNGETSLKPEDFDFTVLSKRGIKSRYKDCSMAALTSHLQNQSNNSNWNLRT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 RSKCKKDVFMPPSSSSELQESRGLSNFTSTHLLLKEDEGVDDVNFRKVRKPKGKVTILKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 RSKCKKDVFMPPSSSSELQESRGLSNFTSTHLLLKEDEGVDDVNFRKVRKPKGKVTILKG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 IPIKKTKKGCRKSCSGFVQSDSKRESVCNKADAESEPVAQKSQLDRTVCISDAGACGETL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 IPIKKTKKGCRKSCSGFVQSDSKRESVCNKADAESEPVAQKSQLDRTVCISDAGACGETL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 SVTSEENSLVKKKERSLSSGSNFCSEQKTSGIINKFCSAKDSEHNEKYEDTFLESEEIGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 SVTSEENSLVKKKERSLSSGSNFCSEQKTSGIINKFCSAKDSEHNEKYEDTFLESEEIGT 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 KVEVVERKEHLHTDILKRGSEMDNNCSPTRKDFT------EDTIPRTQIERRKTSLYFSS :::::::::::::::::::::::::::::::::: :::::::::::::::::::: CCDS63 KVEVVERKEHLHTDILKRGSEMDNNCSPTRKDFTGEKIFQEDTIPRTQIERRKTSLYFSS 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE2 KYNKEALSPPRRKAFKKWTPPRSPFNLVQETLFHDPWKLLIATIFLNRTSGKMAIPVLWK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 KYNKEALSPPRRKAFKKWTPPRSPFNLVQETLFHDPWKLLIATIFLNRTSGKMAIPVLWK 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE2 FLEKYPSAEVARTADWRDVSELLKPLGLYDLRAKTIVKFSDEYLTKQWKYPIELHGIGKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 FLEKYPSAEVARTADWRDVSELLKPLGLYDLRAKTIVKFSDEYLTKQWKYPIELHGIGAP 490 500 510 520 530 540 540 550 560 570 pF1KE2 GNDSYRIFCVNEWKQVHPEDHKLNKYHDWLWENHEKLSLS >>CCDS63769.1 MBD4 gene_id:8930|Hs108|chr3 (262 aa) initn: 1272 init1: 1246 opt: 1267 Z-score: 1390.3 bits: 266.0 E(32554): 4e-71 Smith-Waterman score: 1267; 80.8% identity (87.6% similar) in 234 aa overlap (341-574:29-262) 320 330 340 350 360 370 pF1KE2 KKKERSLSSGSNFCSEQKTSGIINKFCSAKDSEHNEKYEDTFLESEEIGTKVEVVERKEH : .. . ::. .: :..: : . :. CCDS63 MGTTGLESLSLGDRGAAPTVTSSERLVPDPPNDLRKEDVAMELERVGEDEEQMMIKRS 10 20 30 40 50 380 390 400 410 420 430 pF1KE2 LHTDILKRGSEMDNNCSPTRKDFTEDTIPRTQIERRKTSLYFSSKYNKEALSPPRRKAFK . . : . . . . : .::::::::::::::::::::::::::::::::::: CCDS63 SECNPLLQEPIASAQFGATAGTECQDTIPRTQIERRKTSLYFSSKYNKEALSPPRRKAFK 60 70 80 90 100 110 440 450 460 470 480 490 pF1KE2 KWTPPRSPFNLVQETLFHDPWKLLIATIFLNRTSGKMAIPVLWKFLEKYPSAEVARTADW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 KWTPPRSPFNLVQETLFHDPWKLLIATIFLNRTSGKMAIPVLWKFLEKYPSAEVARTADW 120 130 140 150 160 170 500 510 520 530 540 550 pF1KE2 RDVSELLKPLGLYDLRAKTIVKFSDEYLTKQWKYPIELHGIGKYGNDSYRIFCVNEWKQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 RDVSELLKPLGLYDLRAKTIVKFSDEYLTKQWKYPIELHGIGKYGNDSYRIFCVNEWKQV 180 190 200 210 220 230 560 570 pF1KE2 HPEDHKLNKYHDWLWENHEKLSLS :::::::::::::::::::::::: CCDS63 HPEDHKLNKYHDWLWENHEKLSLS 240 250 260 574 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 16:16:52 2016 done: Mon Nov 7 16:16:52 2016 Total Scan time: 3.120 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]