FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1461, 1494 aa 1>>>pF1KA1461 1494 - 1494 aa - 1494 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 13.2814+/-0.00113; mu= -14.4266+/- 0.067 mean_var=372.8384+/-77.917, 0's: 0 Z-trim(113.4): 34 B-trim: 406 in 1/52 Lambda= 0.066422 statistics sampled from 14048 (14072) to 14048 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.735), E-opt: 0.2 (0.432), width: 16 Scan time: 7.010 The best scores are: opt bits E(32554) CCDS33302.1 MBD5 gene_id:55777|Hs108|chr2 (1494) 10118 984.8 0 CCDS8944.1 MBD6 gene_id:114785|Hs108|chr12 (1003) 624 74.9 1.3e-12 >>CCDS33302.1 MBD5 gene_id:55777|Hs108|chr2 (1494 aa) initn: 10118 init1: 10118 opt: 10118 Z-score: 5253.8 bits: 984.8 E(32554): 0 Smith-Waterman score: 10118; 99.9% identity (99.9% similar) in 1494 aa overlap (1-1494:1-1494) 10 20 30 40 50 60 pF1KA1 MNGGKECDGGDKEGGLPAIQVPVGWQRRVDQNGVLYVSPSGSLLSCLEQVKTYLLTDGTC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MNGGKECDGGDKEGGLPAIQVPVGWQRRVDQNGVLYVSPSGSLLSCLEQVKTYLLTDGTC 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 KCGLECPLILPKVFNFDPGAAVKQRTAEDVKADEDVTKLCIHKRKIIAVATLHKSMEAPH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KCGLECPLILPKVFNFDPGAAVKQRTAEDVKADEDVTKLCIHKRKIIAVATLHKSMEAPH 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 PSLVLTSPGGGTNATPVVPSRAATPRSVRNKSHEGITNSVMPECKNPFKLMIGSSNAMGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PSLVLTSPGGGTNATPVVPSRAATPRSVRNKSHEGITNSVMPECKNPFKLMIGSSNAMGR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 LYVQELPGSQQQELHPVYPRQRLGSSEHGQKSPFRGSHGGLPSPASSGSQIYGDGSISPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LYVQELPGSQQQELHPVYPRQRLGSSEHGQKSPFRGSHGGLPSPASSGSQIYGDGSISPR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 TDPLGSPDVFTRSNPGFHGAPNSSPIHLNRTPLSPPSVMLHGSPVQSSCAMAGRTNIPLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TDPLGSPDVFTRSNPGFHGAPNSSPIHLNRTPLSPPSVMLHGSPVQSSCAMAGRTNIPLS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 PTLTTKSPVMKKPMCNFSTNMEIPRAMFHHKPPQGPPPPPPPSCALQKKPLTSEKDPLGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PTLTTKSPVMKKPMCNFSTNMEIPRAMFHHKPPQGPPPPPPPSCALQKKPLTSEKDPLGI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 LDPIPSKPVNQNPVIINPTSFHSNVHSQVPMMNVSMPPAVVPLPSNLPLPTVKPGHMNHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LDPIPSKPVNQNPVIINPTSFHSNVHSQVPMMNVSMPPAVVPLPSNLPLPTVKPGHMNHG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 SHVQRVQHSASTSLSPSPVTSPVHMMGTGIGRIEASPQRSRSSSTSSDHGNFMMPPVGPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SHVQRVQHSASTSLSPSPVTSPVHMMGTGIGRIEASPQRSRSSSTSSDHGNFMMPPVGPQ 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 ATSSGIKVPPRSPRSTIGSPRPSMPSSPSTKSDGHHQYKDIPNPLIAGISNVLNTPSSAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ATSSGIKVPPRSPRSTIGSPRPSMPSSPSTKSDGHHQYKDIPNPLIAGISNVLNTPSSAA 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA1 FPTASAGSSSVKSQPGLLGMPLNQILNQHNAASFPASSLLSAAAKAQLANQNKLAGNNSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 FPTASAGSSSVKSQPGLLGMPLNQILNQHNAASFPASSLLSAAAKAQLANQNKLAGNNSS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA1 SSSNSGAVAGSGNTEGHSTLNTMFPPTANMLLPTGEGQSGRAALRDKLMSQQKDALRKRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SSSNSGAVAGSGNTEGHSTLNTMFPPTANMLLPTGEGQSGRAALRDKLMSQQKDALRKRK 610 620 630 640 650 660 670 680 690 700 710 720 pF1KA1 QPPTTVLSLLRQSQMDSSAVPKPGPDLLRKQGQGSFPISSMSQLLQSMSCQSSHLSSNST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QPPTTVLSLLRQSQMDSSAVPKPGPDLLRKQGQGSFPISSMSQLLQSMSCQSSHLSSNST 670 680 690 700 710 720 730 740 750 760 770 780 pF1KA1 PGCGASNTALPCSANQLHFTDPSMNSSVLQNIPLRGEAVHCHNANTNFVHSNSPVPNHHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PGCGASNTALPCSANQLHFTDPSMNSSVLQNIPLRGEAVHCHNANTNFVHSNSPVPNHHL 730 740 750 760 770 780 790 800 810 820 830 840 pF1KA1 AGLINQIQASGNCGMLSQSGMALGNSLHPNPPQSRISTSSTPVIPNSIVSSYNQTSSEAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 AGLINQIQASGNCGMLSQSGMALGNSLHPNPPQSRISTSSTPVIPNSIVSSYNQTSSEAG 790 800 810 820 830 840 850 860 870 880 890 900 pF1KA1 GSGPSSSIAIAGTNHPAITKTTSVLQDGVIVTTAAGNPLQSQLPIGSDFPFVGQEHALHF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GSGPSSSIAIAGTNHPAITKTTSVLQDGVIVTTAAGNPLQSQLPIGSDFPFVGQEHALHF 850 860 870 880 890 900 910 920 930 940 950 960 pF1KA1 PSNSTSNNHLPHPLNPSLLSSLPISLPVNQQHLLNQNLLNILQPSAGEGDMSSINNTLSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PSNSTSNNHLPHPLNPSLLSSLPISLPVNQQHLLNQNLLNILQPSAGEGDMSSINNTLSN 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KA1 HQLTHLQSLLNNNQMFPPNQQQQQLLQGYQNLQAFQGQSTIPCPANNNPMACLFQNFQVI ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 HQLTHLQSLLNNNQMFPPNQQQQQLLQGYQNLQAFQGQSTIPCPANNNPMACLFQNFQVR 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KA1 MQEDAALLNKRISTQPGLTALPENPNTTLPPFQDTPCELQPRIDPSLGQQVKDGLVVGGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MQEDAALLNKRISTQPGLTALPENPNTTLPPFQDTPCELQPRIDPSLGQQVKDGLVVGGP 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KA1 GDASVDAIYKAVVDAASKGMQVVITTAVNSTTQISPIPALSAMSAFTASIGDPLNLSSAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GDASVDAIYKAVVDAASKGMQVVITTAVNSTTQISPIPALSAMSAFTASIGDPLNLSSAV 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KA1 SAVIHGRNMGGVDHDGRLRNSRGARLPKNLDHGKNVNEGDGFEYFKSASCHTSKKQWDGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SAVIHGRNMGGVDHDGRLRNSRGARLPKNLDHGKNVNEGDGFEYFKSASCHTSKKQWDGE 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KA1 QSPRGERNRWKYEEFLDHPGHIHSSPCHERPNNVSTLPFLPGEQHPILLPPRNCPGDKIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QSPRGERNRWKYEEFLDHPGHIHSSPCHERPNNVSTLPFLPGEQHPILLPPRNCPGDKIL 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KA1 EENFRYNNYKRTMMSFKERLENTVERCAHINGNRPRQSRGFGELLSTAKQDLVLEEQSPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 EENFRYNNYKRTMMSFKERLENTVERCAHINGNRPRQSRGFGELLSTAKQDLVLEEQSPS 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KA1 SSNSLENSLVKDYIHYNGDFNAKSVNGCVPSPSDAKSISSEDDLRNPDSPSSNELIHYRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SSNSLENSLVKDYIHYNGDFNAKSVNGCVPSPSDAKSISSEDDLRNPDSPSSNELIHYRP 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KA1 RTFNVGDLVWGQIKGLTSWPGKLVREDDVHNSCQQSPEEGKVEPEKLKTLTEGLEAYSRV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RTFNVGDLVWGQIKGLTSWPGKLVREDDVHNSCQQSPEEGKVEPEKLKTLTEGLEAYSRV 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 pF1KA1 RKRNRKSGKLNNHLEAAIHEAMSELDKMSGTVHQIPQGDRQMRPPKPKRRKISR :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RKRNRKSGKLNNHLEAAIHEAMSELDKMSGTVHQIPQGDRQMRPPKPKRRKISR 1450 1460 1470 1480 1490 >>CCDS8944.1 MBD6 gene_id:114785|Hs108|chr12 (1003 aa) initn: 601 init1: 389 opt: 624 Z-score: 339.6 bits: 74.9 E(32554): 1.3e-12 Smith-Waterman score: 713; 29.2% identity (48.4% similar) in 859 aa overlap (1-812:1-767) 10 20 30 40 50 60 pF1KA1 MNGGKECDGGDKEGGLPAIQVPVGWQRRVDQNGVLYVSPSGSLLSCLEQVKTYLLTDGTC ::::.: .:.:. :: : .::.:::: : ...:::.::::. :: :::...:::.:::: CCDS89 MNGGNESSGADRAGGPVATSVPIGWQRCVREGAVLYISPSGTELSSLEQTRSYLLSDGTC 10 20 30 40 50 60 70 80 90 100 110 pF1KA1 KCGLECPLILPKVFNFDPGAAVKQRTAEDVKA-DEDVTKLCIHKRKIIAVATLHKSMEAP :::::::: .:::::::: : : : : .::.:::: :.:: .:.:::..:::. CCDS89 KCGLECPLNVPKVFNFDPLAPVTPGGAGVGPASEEDMTKLCNHRRKAVAMATLYRSMET- 70 80 90 100 110 120 130 140 150 160 170 pF1KA1 HPSLVLTSPGGGTNATP-VVPSRAATPRSVRNKSHEGITNSVMPECKNPFKLMIGSSNAM . .::: : :.: . . . : :.: . :. : .: .: .. CCDS89 --TCSHSSPGEG--ASPQMFHTVSPGPPSARPPCRVPPTT---PLNGGPGSLPPEPPSVS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KA1 GRLYVQELPGSQQQELHPVYPRQRLGSSEHGQKSPFRGSHGGLPSPA-------SSGSQI . . ::. : : :: :..:: .:. :::: : .. CCDS89 QAFPTLAGPGG----LFP--PRLADPVPSGGSSSPRFLPRGNAPSPAPPPPPAISLNAPS 180 190 200 210 220 240 250 260 270 280 pF1KA1 YGDG-----SISPRTDPLGSPDV-FTRSNPGFHGAPNSSPIHLNRTPLSPPSVMLHGSPV :. : :. : .: :::: . . :.: :.. :. :.:: . : CCDS89 YNWGAALRSSLVP-SD-LGSPPAPHASSSP-----PSDPPLFHCSDALTPPPL----PPS 230 240 250 260 270 290 300 310 320 330 pF1KA1 QSSCAMAGRTNIPLSPTLTTKSPVMKKPMCNFSTNMEIPRA-------MFHHKPPQGPPP .. : : .. : . : . :.. :. . : .: : : .. :: CCDS89 NNLPAHPGPASQPPVSSATMHLPLVLGPLGGAPT-VEGPGAPPFLASSLLSAAAKAQHPP 280 290 300 310 320 330 340 350 360 370 380 390 pF1KA1 PPPPSCALQKKPLTSEKDPLGILDPIPSKPVNQNPVIINPTSFH--SNVHSQVPMMNVSM :::: ..: .. . . ::. . : :: :. . :.: . CCDS89 LPPPSTLQGRRPRAQAPSASHSSSLRPSQRRPRRP----PTVFRLLEGRGPQTPRRSRPR 340 350 360 370 380 390 400 410 420 430 440 450 pF1KA1 PPAVVPLPSNLPLPTVKPGHMNHGSHVQRVQHSASTSLSPSPVTSPVHMMGTG--IGRIE :: :: : .:: :. : . :. :: :. .: : :. .: CCDS89 APAPVPQPFSLPEPS------------QPILPSV-LSLLGLPTPGPSHSDGSFNLLGSDA 400 410 420 430 460 470 480 490 500 510 pF1KA1 ASPQRSRSSSTSSDHGNFMMPPVGPQATSSGIKVPPRSPRSTIGSPRPSMPS----SPST : :: : . . : : .::.... : .: .: : .:: ::: CCDS89 HLPPPPTLSSGSPPQPRHPIQPSLPGTTSGSLSSVPGAPAPPAASKAPVVPSPVLQSPS- 440 450 460 470 480 490 520 530 540 550 560 pF1KA1 KSDGHHQYKDIPNPLIAGISNVLNTPSSAAFPTASAGSS-SVKSQPGLLG-MPLNQILNQ .. : : : .:: . ::. : . : . ::.:: .:: :.: CCDS89 EGLGMGAGPACPLPPLAG-------GEAFPFPSPEQGLALSGAGFPGMLGALPLPLSLGQ 500 510 520 530 540 570 580 590 600 610 620 pF1KA1 HNAASFPASSLLSAAAKAQLANQNKLAGNNSSSSSNSGAVAGSGNTEGHSTLNTMFPPTA : : ::. : :...:.: :. . ..:: . CCDS89 P-----PPSPLLN--------------------HSLFGVLTGGG---GQPPPEPLLPPPG 550 560 570 580 630 640 650 660 670 pF1KA1 NMLLPTGEGQS-GRAALRDKLMSQQ-KDALRKRKQPPTTVLS----LL----RQSQMDSS . : . :. : . : .:. .: : . ::...:. :: .. ..: CCDS89 GPGPPLAPGEPEGPSLLVASLLPPPPSDLLPPPSAPPSNLLASFLPLLALGPTAGDGEGS 590 600 610 620 630 640 680 690 700 710 720 730 pF1KA1 AVPKPGPDLLRKQGQGS-----FPISSMSQLLQSMSCQSSHLSSNSTPGCGASNTALPCS : ::. .: :. :: : : ... :. :... : :. :: CCDS89 AEGAGGPSGEPFSGLGDLSPLLFPPLSAPPTLIALN--SALLAATLDPPSGTP--PQPCV 650 660 670 680 690 740 750 760 770 780 790 pF1KA1 ANQLHFTDPSMNSSVLQNIPLRGEAVHCHNANTNFVHSNSPVPNHHLAGLINQIQASGNC . . :. ::: : . . . . ::: : . :. :.. . :. CCDS89 LSAPQPGPPT--SSVTTATTDPGAS------SLGKAPSNSGRPPQLLSPLLGA-SLLGDL 700 710 720 730 740 800 810 820 830 840 850 pF1KA1 GMLSQSGMALGNSLHPNPPQSRISTSSTPVIPNSIVSSYNQTSSEAGGSGPSSSIAIAGT . :..: :: . :.: : CCDS89 SSLTSSPGALPSLLQPPGPLLSGQLGLQLLPGGGAPPPLSEASSPLACLLQSLQIPPEQP 750 760 770 780 790 800 1494 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 03:46:39 2016 done: Mon Nov 7 03:46:40 2016 Total Scan time: 7.010 Total Display time: 0.130 Function used was FASTA [36.3.4 Apr, 2011]