FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5686, 563 aa 1>>>pF1KE5686 563 - 563 aa - 563 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.9618+/-0.000474; mu= 7.8803+/- 0.030 mean_var=271.4582+/-55.819, 0's: 0 Z-trim(116.8): 75 B-trim: 1645 in 1/54 Lambda= 0.077844 statistics sampled from 28092 (28181) to 28092 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.692), E-opt: 0.2 (0.33), width: 16 Scan time: 8.980 The best scores are: opt bits E(85289) NP_037418 (OMIM: 612602) putative RNA-binding prot ( 890) 3759 436.6 1.6e-121 NP_001188474 (OMIM: 606077) putative RNA-binding p ( 969) 1088 136.6 3.4e-31 NP_073605 (OMIM: 606077) putative RNA-binding prot ( 977) 1088 136.6 3.4e-31 NP_055816 (OMIM: 613484) msx2-interacting protein (3664) 364 56.1 2.3e-06 >>NP_037418 (OMIM: 612602) putative RNA-binding protein (890 aa) initn: 3759 init1: 3759 opt: 3759 Z-score: 2302.5 bits: 436.6 E(85289): 1.6e-121 Smith-Waterman score: 3759; 99.8% identity (100.0% similar) in 563 aa overlap (1-563:328-890) 10 20 30 pF1KE5 MPEDDQRATRNLFIGNLDHSVSEVELRRAF :::::::::::::::::::::::::::::: NP_037 LSRERALDYYGLYDDRGRPYGYPAVCEEDLMPEDDQRATRNLFIGNLDHSVSEVELRRAF 300 310 320 330 340 350 40 50 60 70 80 90 pF1KE5 EKYGIIEEVVIKRPARGQGGAYAFLKFQNLDMAHRAKVAMSGRVIGRNPIKIGYGKANPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_037 EKYGIIEEVVIKRPARGQGGAYAFLKFQNLDMAHRAKVAMSGRVIGRNPIKIGYGKANPT 360 370 380 390 400 410 100 110 120 130 140 150 pF1KE5 TRLWVGGLGPNTSLAALAREFDRFGSIRTIDHVKGDSFAYIQYESLDAAQAACAKMRGFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_037 TRLWVGGLGPNTSLAALAREFDRFGSIRTIDHVKGDSFAYIQYESLDAAQAACAKMRGFP 420 430 440 450 460 470 160 170 180 190 200 210 pF1KE5 LGGPDRRLRVDFAKAEETRYPQQYQPSPLPVHYELLTDGYTRHRNLDADLVRDRTPPHLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_037 LGGPDRRLRVDFAKAEETRYPQQYQPSPLPVHYELLTDGYTRHRNLDADLVRDRTPPHLL 480 490 500 510 520 530 220 230 240 250 260 270 pF1KE5 YSDRDRTFLEGDWTSPSKSSDRRNSLEGYSRSVRSRSGERWGADGDRGLPKPWEEKRKRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::.:::: NP_037 YSDRDRTFLEGDWTSPSKSSDRRNSLEGYSRSVRSRSGERWGADGDRGLPKPWEERRKRR 540 550 560 570 580 590 280 290 300 310 320 330 pF1KE5 SLSSDRGRTTHSPYEERSRTKGSGQQSERGSDRTPERSRKENHSSEGTKESSSNSLSNSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_037 SLSSDRGRTTHSPYEERSRTKGSGQQSERGSDRTPERSRKENHSSEGTKESSSNSLSNSR 600 610 620 630 640 650 340 350 360 370 380 390 pF1KE5 HGAEERGHHHHHHEAADSSHGKKARDSERNHRTTEAEPKPLEEPKHETKKLKNLSEYAQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_037 HGAEERGHHHHHHEAADSSHGKKARDSERNHRTTEAEPKPLEEPKHETKKLKNLSEYAQT 660 670 680 690 700 710 400 410 420 430 440 450 pF1KE5 LQLGWNGLLVLKNSCFPTSMHILEGDQGVISSLLKDHTSGSKLTQLKIAQRLRLDQPKLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_037 LQLGWNGLLVLKNSCFPTSMHILEGDQGVISSLLKDHTSGSKLTQLKIAQRLRLDQPKLD 720 730 740 750 760 770 460 470 480 490 500 510 pF1KE5 EVTRRIKQGSPNGYAVLLATQATPSGLGTEGMPTVEPGLQRRLLRNLVSYLKQKQAAGVI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_037 EVTRRIKQGSPNGYAVLLATQATPSGLGTEGMPTVEPGLQRRLLRNLVSYLKQKQAAGVI 780 790 800 810 820 830 520 530 540 550 560 pF1KE5 SLPVGGSKGRDGTGMLYAFPPCDFSQQYLQSALRTLGKLEEEHMVIVIVRDTA ::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_037 SLPVGGSKGRDGTGMLYAFPPCDFSQQYLQSALRTLGKLEEEHMVIVIVRDTA 840 850 860 870 880 890 >>NP_001188474 (OMIM: 606077) putative RNA-binding prote (969 aa) initn: 1639 init1: 888 opt: 1088 Z-score: 681.0 bits: 136.6 E(85289): 3.4e-31 Smith-Waterman score: 1746; 51.6% identity (72.7% similar) in 601 aa overlap (2-560:366-954) 10 20 30 pF1KE5 MPEDDQRATRNLFIGNLDHSVSEVELRRAFE :::::::.:.::.:::: .:.: .:::::. NP_001 YERVRPAYSLEPRVGAGAGAAPFREVDEISPEDDQRANRTLFLGNLDITVTESDLRRAFD 340 350 360 370 380 390 40 50 60 70 80 90 pF1KE5 KYGIIEEVVIKRPARGQGGAYAFLKFQNLDMAHRAKVAMSGRVIGRNPIKIGYGKANPTT ..:.: :: ::::.::: ..:.::::.::::.::::.::::..: :::::::::::.::: NP_001 RFGVITEVDIKRPSRGQTSTYGFLKFENLDMSHRAKLAMSGKIIIRNPIKIGYGKATPTT 400 410 420 430 440 450 100 110 120 130 140 150 pF1KE5 RLWVGGLGPNTSLAALAREFDRFGSIRTIDHVKGDSFAYIQYESLDAAQAACAKMRGFPL ::::::::: . ::::::::::::.:::::. ::::.:::::::::::.:: ..:::::: NP_001 RLWVGGLGPWVPLAALAREFDRFGTIRTIDYRKGDSWAYIQYESLDAAHAAWTHMRGFPL 460 470 480 490 500 510 160 170 180 190 200 pF1KE5 GGPDRRLRVDFAKAEETRYPQQY-QPSPLPVHYELLTDGYTRHRNLDA-DLVRDRTPPHL :::::::::::: .:. :: ::: :: :: .::::.::.. :: : .:::::: : NP_001 GGPDRRLRVDFADTEH-RYQQQYLQPLPL-THYELVTDAFG-HRAPDPLRGARDRTPP-L 520 530 540 550 560 570 210 220 230 240 250 pF1KE5 LYSDRDRTFL-EGDWTSPSKSSDRRNSLEGYSRSV----------RSRSGERWGAD---G :: :::: . ..::. : :. : . . :: : :.: :. : : NP_001 LYRDRDRDLYPDSDWVPPPPPV-RERSTRTAATSVPAYEPLDSLDRRRDG--WSLDRDRG 580 590 600 610 620 260 270 280 290 300 pF1KE5 DRGLPKPWEEKRKRR------------SLSSDRGRTTH-SPYEERS-RTKGSGQQSERGS :: ::. .. :::: : ::: : : .: .:: . ..: .. . . NP_001 DRDLPSSRDQPRKRRLPEESGGRHLDRSPESDRPRKRHCAPSPDRSPELSSSRDRYNSDN 630 640 650 660 670 680 310 320 330 340 350 pF1KE5 DRT---------PERSRKEN-HSSEGTKESSSNSLSNSRHGAEERGHHHHHHEAADSSHG ::. : :.:. . ..:.: :.. .:: : : .: :. . : NP_001 DRSSRLLLERPSPIRDRRGSLEKSQGDKRDRKNSASAER----DRKHRTTAPTEGKSPLK 690 700 710 720 730 740 360 370 380 390 400 410 pF1KE5 KKARDSERNHRTTEAEPKPLEEP-KHETKKLKNLSEYAQTLQLGWNGLLVLKNSCFPTSM :. :.. :. : : :. : ... .. . : :.:.:.:.:::: ::..: NP_001 KEDRSDGSAPSTSTASSK-LKSPSQKQDGGTAPVASASPKLCLAWQGMLLLKNSNFPSNM 750 760 770 780 790 800 420 430 440 450 460 470 pF1KE5 HILEGDQGVISSLLKDHTSGSKLTQLKIAQRLRLDQPKLDEVTRRIKQGSPNGYAVLLAT :.:.:: : :::: . ..:.:..::::.:::::::::::::::::: ..:::::.:::. NP_001 HLLQGDLQVASSLLVEGSTGGKVAQLKITQRLRLDQPKLDEVTRRIKVAGPNGYAILLAV 810 820 830 840 850 860 480 490 500 510 520 pF1KE5 QATPSGLGTEGMPTVEPGLQ-RRLLRNLVSYLKQKQAAGVISLPVGGSKGRDGTGMLYAF .. .. .. . . . . . .: :::::::::::::::::::::::.: ...::.:.:: NP_001 PGSSDSRSSSSSAASDTATSTQRPLRNLVSYLKQKQAAGVISLPVGGNKDKENTGVLHAF 870 880 890 900 910 920 530 540 550 560 pF1KE5 PPCDFSQQYLQSALRTLGKLEEEHMVIVIVRDTA :::.::::.:.: ..:.: ::...:..::: NP_001 PPCEFSQQFLDSPAKALAKSEEDYLVMIIVRAKLVEQRMKIWNSKL 930 940 950 960 >>NP_073605 (OMIM: 606077) putative RNA-binding protein (977 aa) initn: 1639 init1: 888 opt: 1088 Z-score: 680.9 bits: 136.6 E(85289): 3.4e-31 Smith-Waterman score: 1746; 51.6% identity (72.7% similar) in 601 aa overlap (2-560:366-954) 10 20 30 pF1KE5 MPEDDQRATRNLFIGNLDHSVSEVELRRAFE :::::::.:.::.:::: .:.: .:::::. NP_073 YERVRPAYSLEPRVGAGAGAAPFREVDEISPEDDQRANRTLFLGNLDITVTESDLRRAFD 340 350 360 370 380 390 40 50 60 70 80 90 pF1KE5 KYGIIEEVVIKRPARGQGGAYAFLKFQNLDMAHRAKVAMSGRVIGRNPIKIGYGKANPTT ..:.: :: ::::.::: ..:.::::.::::.::::.::::..: :::::::::::.::: NP_073 RFGVITEVDIKRPSRGQTSTYGFLKFENLDMSHRAKLAMSGKIIIRNPIKIGYGKATPTT 400 410 420 430 440 450 100 110 120 130 140 150 pF1KE5 RLWVGGLGPNTSLAALAREFDRFGSIRTIDHVKGDSFAYIQYESLDAAQAACAKMRGFPL ::::::::: . ::::::::::::.:::::. ::::.:::::::::::.:: ..:::::: NP_073 RLWVGGLGPWVPLAALAREFDRFGTIRTIDYRKGDSWAYIQYESLDAAHAAWTHMRGFPL 460 470 480 490 500 510 160 170 180 190 200 pF1KE5 GGPDRRLRVDFAKAEETRYPQQY-QPSPLPVHYELLTDGYTRHRNLDA-DLVRDRTPPHL :::::::::::: .:. :: ::: :: :: .::::.::.. :: : .:::::: : NP_073 GGPDRRLRVDFADTEH-RYQQQYLQPLPL-THYELVTDAFG-HRAPDPLRGARDRTPP-L 520 530 540 550 560 570 210 220 230 240 250 pF1KE5 LYSDRDRTFL-EGDWTSPSKSSDRRNSLEGYSRSV----------RSRSGERWGAD---G :: :::: . ..::. : :. : . . :: : :.: :. : : NP_073 LYRDRDRDLYPDSDWVPPPPPV-RERSTRTAATSVPAYEPLDSLDRRRDG--WSLDRDRG 580 590 600 610 620 260 270 280 290 300 pF1KE5 DRGLPKPWEEKRKRR------------SLSSDRGRTTH-SPYEERS-RTKGSGQQSERGS :: ::. .. :::: : ::: : : .: .:: . ..: .. . . NP_073 DRDLPSSRDQPRKRRLPEESGGRHLDRSPESDRPRKRHCAPSPDRSPELSSSRDRYNSDN 630 640 650 660 670 680 310 320 330 340 350 pF1KE5 DRT---------PERSRKEN-HSSEGTKESSSNSLSNSRHGAEERGHHHHHHEAADSSHG ::. : :.:. . ..:.: :.. .:: : : .: :. . : NP_073 DRSSRLLLERPSPIRDRRGSLEKSQGDKRDRKNSASAER----DRKHRTTAPTEGKSPLK 690 700 710 720 730 740 360 370 380 390 400 410 pF1KE5 KKARDSERNHRTTEAEPKPLEEP-KHETKKLKNLSEYAQTLQLGWNGLLVLKNSCFPTSM :. :.. :. : : :. : ... .. . : :.:.:.:.:::: ::..: NP_073 KEDRSDGSAPSTSTASSK-LKSPSQKQDGGTAPVASASPKLCLAWQGMLLLKNSNFPSNM 750 760 770 780 790 800 420 430 440 450 460 470 pF1KE5 HILEGDQGVISSLLKDHTSGSKLTQLKIAQRLRLDQPKLDEVTRRIKQGSPNGYAVLLAT :.:.:: : :::: . ..:.:..::::.:::::::::::::::::: ..:::::.:::. NP_073 HLLQGDLQVASSLLVEGSTGGKVAQLKITQRLRLDQPKLDEVTRRIKVAGPNGYAILLAV 810 820 830 840 850 860 480 490 500 510 520 pF1KE5 QATPSGLGTEGMPTVEPGLQ-RRLLRNLVSYLKQKQAAGVISLPVGGSKGRDGTGMLYAF .. .. .. . . . . . .: :::::::::::::::::::::::.: ...::.:.:: NP_073 PGSSDSRSSSSSAASDTATSTQRPLRNLVSYLKQKQAAGVISLPVGGNKDKENTGVLHAF 870 880 890 900 910 920 530 540 550 560 pF1KE5 PPCDFSQQYLQSALRTLGKLEEEHMVIVIVRDTA :::.::::.:.: ..:.: ::...:..::: NP_073 PPCEFSQQFLDSPAKALAKSEEDYLVMIIVRGFGFQIGVRYENKKRENLALTLL 930 940 950 960 970 >>NP_055816 (OMIM: 613484) msx2-interacting protein [Hom (3664 aa) initn: 390 init1: 220 opt: 364 Z-score: 235.1 bits: 56.1 E(85289): 2.3e-06 Smith-Waterman score: 418; 26.4% identity (55.5% similar) in 409 aa overlap (7-390:435-835) 10 20 30 pF1KE5 MPEDDQRATRNLFIGNLDHSVSEVELRRAFEKYGII .:::.::::::..... .:: :...: : NP_055 QIEVTAWIGPETESENEFRPLDERIDEFHPKATRTLFIGNLEKTTTYHDLRNIFQRFGEI 410 420 430 440 450 460 40 50 60 70 80 90 pF1KE5 EEVVIKRPARGQGGAYAFLKFQNLDMAHRAKVAMSGRVIGRNPIKIGYGKANPTTRLWVG .. ::. . : ::::.. .. . .: :.:. .: : .:.:.::. ::. .:. NP_055 VDIDIKK-VNGVP-QYAFLQYCDIASVCKAIKKMDGEYLGNNRLKLGFGKSMPTNCVWLD 470 480 490 500 510 520 100 110 120 130 140 150 pF1KE5 GLGPNTSLAALAREFDRFGSIRTI--DHVKGDSFAYIQYESLDAAQAACAKMRGFPLGGP ::. :.: :.:.: :.: . . :..:: .: . :. .. :::: . .: .:: NP_055 GLSSNVSDQYLTRHFCRYGPVVKVVFDRLKG--MALVLYNEIEYAQAAVKETKGRKIGG- 530 540 550 560 570 160 170 180 190 200 pF1KE5 DRRLRVDFAKAE-ETRYPQQYQPSPLPVH--YELLTDGYTRHRNLDADLVRDRT------ ...::::. : . . . .. : .. ::.:.. ..: . : .::: NP_055 -NKIKVDFANRESQLAFYHCMEKSGQDIRDFYEMLAE-RREERRASYDYNQDRTYYESVR 580 590 600 610 620 630 210 220 230 240 250 pF1KE5 PPHLLYSDRDRTF------LEGDWTSPSKSSDRRNSLEGYSRSVRSRSGERWGADGDRGL : : : . . ..: . ... .. : :. .. . : . NP_055 TPGTYPEDSRRDYPARGREFYSEWET-YQGDYYESRYYDDPREYRDYRNDPYEQDIREYS 640 650 660 670 680 690 260 270 280 290 300 310 pF1KE5 PKPWEEKRKRRSLSSDRGRTTHSPYEERS------RTKGSGQQSERGSDRTPERSRKENH . :..:.:. . ::: : . ::: : : : ..: : :... . NP_055 YRQRERERERERFESDRDRDHERRPIERSQSPVHLRRPQSPGASPSQAERLPSDSERRLY 700 710 720 730 740 750 320 330 340 350 360 370 pF1KE5 SSEGTKESSSNSLSNSRHGA--EERGHHHHHHEAADSSHGKKARDSERNHRTTEAEPKPL : . . .: .::: :. . : ... ..: .:. . . ::..: . : NP_055 SRSSDRSGSCSSLSPPRYEKLDKSRLERYTKNEKTDKERTFDPERVERERRLIRKEKVEK 760 770 780 790 800 810 380 390 400 410 420 430 pF1KE5 EEPKHETKKLKNLSEYAQTLQLGWNGLLVLKNSCFPTSMHILEGDQGVISSLLKDHTSGS .. .. .: : : .:. NP_055 DKTDKQKRKGKVHSPSSQSSETDQENEREQSPEKPRSCNKLSREKADKEGIAKNRLELMP 820 830 840 850 860 870 563 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 05:51:21 2016 done: Tue Nov 8 05:51:22 2016 Total Scan time: 8.980 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]