FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2375, 730 aa 1>>>pF1KE2375 730 - 730 aa - 730 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.5431+/-0.00104; mu= 17.2829+/- 0.063 mean_var=176.6149+/-37.610, 0's: 0 Z-trim(109.3): 105 B-trim: 0 in 0/50 Lambda= 0.096507 statistics sampled from 10669 (10769) to 10669 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.648), E-opt: 0.2 (0.331), width: 16 Scan time: 3.840 The best scores are: opt bits E(32554) CCDS12203.1 HNRNPM gene_id:4670|Hs108|chr19 ( 730) 4939 700.7 2e-201 CCDS12204.1 HNRNPM gene_id:4670|Hs108|chr19 ( 691) 3628 518.1 1.7e-146 CCDS32230.1 MYEF2 gene_id:50804|Hs108|chr15 ( 600) 1512 223.5 7.7e-58 CCDS73722.1 MYEF2 gene_id:50804|Hs108|chr15 ( 576) 1506 222.6 1.3e-57 >>CCDS12203.1 HNRNPM gene_id:4670|Hs108|chr19 (730 aa) initn: 4939 init1: 4939 opt: 4939 Z-score: 3729.6 bits: 700.7 E(32554): 2e-201 Smith-Waterman score: 4939; 100.0% identity (100.0% similar) in 730 aa overlap (1-730:1-730) 10 20 30 40 50 60 pF1KE2 MAAGVEAAAEVAATEIKMEEESGAPGVPSGNGAPGPKGEGERPAQNEKRKEKNIKRGGNR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MAAGVEAAAEVAATEIKMEEESGAPGVPSGNGAPGPKGEGERPAQNEKRKEKNIKRGGNR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 FEPYANPTKRYRAFITNIPFDVKWQSLKDLVKEKVGEVTYVELLMDAEGKSRGCAVVEFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 FEPYANPTKRYRAFITNIPFDVKWQSLKDLVKEKVGEVTYVELLMDAEGKSRGCAVVEFK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 MEESMKKAAEVLNKHSLSGRPLKVKEDPDGEHARRAMQKVMATTGGMGMGPGGPGMITIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MEESMKKAAEVLNKHSLSGRPLKVKEDPDGEHARRAMQKVMATTGGMGMGPGGPGMITIP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 PSILNNPNIPNEIIHALQAGRLGSTVFVANLDYKVGWKKLKEVFSMAGVVVRADILEDKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PSILNNPNIPNEIIHALQAGRLGSTVFVANLDYKVGWKKLKEVFSMAGVVVRADILEDKD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 GKSRGIGTVTFEQSIEAVQAISMFNGQLLFDRPMHVKMDERALPKGDFFPPERPQQLPHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GKSRGIGTVTFEQSIEAVQAISMFNGQLLFDRPMHVKMDERALPKGDFFPPERPQQLPHG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 LGGIGMGLGPGGQPIDANHLNKGIGMGNIGPAGMGMEGIGFGINKMGGMEGPFGGGMENM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LGGIGMGLGPGGQPIDANHLNKGIGMGNIGPAGMGMEGIGFGINKMGGMEGPFGGGMENM 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 GRFGSGMNMGRINEILSNALKRGEIIAKQGGGGGGGSVPGIERMGPGIDRLGGAGMERMG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GRFGSGMNMGRINEILSNALKRGEIIAKQGGGGGGGSVPGIERMGPGIDRLGGAGMERMG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 AGLGHGMDRVGSEIERMGLVMDRMGSVERMGSGIERMGPLGLDHMASSIERMGQTMERIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AGLGHGMDRVGSEIERMGLVMDRMGSVERMGSGIERMGPLGLDHMASSIERMGQTMERIG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 SGVERMGAGMGFGLERMAAPIDRVGQTIERMGSGVERMGPAIERMGLSMERMVPAGMGAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 SGVERMGAGMGFGLERMAAPIDRVGQTIERMGSGVERMGPAIERMGLSMERMVPAGMGAG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 LERMGPVMDRMATGLERMGANNLERMGLERMGANSLERMGLERMGANSLERMGPAMGPAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LERMGPVMDRMATGLERMGANNLERMGLERMGANSLERMGLERMGANSLERMGPAMGPAL 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 GAGIERMGLAMGGGGGASFDRAIEMERGNFGGSFAGSFGGAGGHAPGVARKACQIFVRNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GAGIERMGLAMGGGGGASFDRAIEMERGNFGGSFAGSFGGAGGHAPGVARKACQIFVRNL 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 PFDFTWKMLKDKFNECGHVLYADIKMENGKSKGCGVVKFESPEVAERACRMMNGMKLSGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PFDFTWKMLKDKFNECGHVLYADIKMENGKSKGCGVVKFESPEVAERACRMMNGMKLSGR 670 680 690 700 710 720 730 pF1KE2 EIDVRIDRNA :::::::::: CCDS12 EIDVRIDRNA 730 >>CCDS12204.1 HNRNPM gene_id:4670|Hs108|chr19 (691 aa) initn: 3625 init1: 3625 opt: 3628 Z-score: 2743.4 bits: 518.1 E(32554): 1.7e-146 Smith-Waterman score: 4581; 94.7% identity (94.7% similar) in 730 aa overlap (1-730:1-691) 10 20 30 40 50 60 pF1KE2 MAAGVEAAAEVAATEIKMEEESGAPGVPSGNGAPGPKGEGERPAQNEKRKEKNIKRGGNR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MAAGVEAAAEVAATEIKMEEESGAPGVPSGNGAPGPKGEGERPAQNEKRKEKNIKRGGNR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 FEPYANPTKRYRAFITNIPFDVKWQSLKDLVKEKVGEVTYVELLMDAEGKSRGCAVVEFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 FEPYANPTKRYRAFITNIPFDVKWQSLKDLVKEKVGEVTYVELLMDAEGKSRGCAVVEFK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 MEESMKKAAEVLNKHSLSGRPLKVKEDPDGEHARRAMQKVMATTGGMGMGPGGPGMITIP ::::::::::::::::::::::::::::::::::::::: CCDS12 MEESMKKAAEVLNKHSLSGRPLKVKEDPDGEHARRAMQK--------------------- 130 140 150 190 200 210 220 230 240 pF1KE2 PSILNNPNIPNEIIHALQAGRLGSTVFVANLDYKVGWKKLKEVFSMAGVVVRADILEDKD :::::::::::::::::::::::::::::::::::::::::: CCDS12 ------------------AGRLGSTVFVANLDYKVGWKKLKEVFSMAGVVVRADILEDKD 160 170 180 190 200 250 260 270 280 290 300 pF1KE2 GKSRGIGTVTFEQSIEAVQAISMFNGQLLFDRPMHVKMDERALPKGDFFPPERPQQLPHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GKSRGIGTVTFEQSIEAVQAISMFNGQLLFDRPMHVKMDERALPKGDFFPPERPQQLPHG 210 220 230 240 250 260 310 320 330 340 350 360 pF1KE2 LGGIGMGLGPGGQPIDANHLNKGIGMGNIGPAGMGMEGIGFGINKMGGMEGPFGGGMENM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LGGIGMGLGPGGQPIDANHLNKGIGMGNIGPAGMGMEGIGFGINKMGGMEGPFGGGMENM 270 280 290 300 310 320 370 380 390 400 410 420 pF1KE2 GRFGSGMNMGRINEILSNALKRGEIIAKQGGGGGGGSVPGIERMGPGIDRLGGAGMERMG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GRFGSGMNMGRINEILSNALKRGEIIAKQGGGGGGGSVPGIERMGPGIDRLGGAGMERMG 330 340 350 360 370 380 430 440 450 460 470 480 pF1KE2 AGLGHGMDRVGSEIERMGLVMDRMGSVERMGSGIERMGPLGLDHMASSIERMGQTMERIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AGLGHGMDRVGSEIERMGLVMDRMGSVERMGSGIERMGPLGLDHMASSIERMGQTMERIG 390 400 410 420 430 440 490 500 510 520 530 540 pF1KE2 SGVERMGAGMGFGLERMAAPIDRVGQTIERMGSGVERMGPAIERMGLSMERMVPAGMGAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 SGVERMGAGMGFGLERMAAPIDRVGQTIERMGSGVERMGPAIERMGLSMERMVPAGMGAG 450 460 470 480 490 500 550 560 570 580 590 600 pF1KE2 LERMGPVMDRMATGLERMGANNLERMGLERMGANSLERMGLERMGANSLERMGPAMGPAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LERMGPVMDRMATGLERMGANNLERMGLERMGANSLERMGLERMGANSLERMGPAMGPAL 510 520 530 540 550 560 610 620 630 640 650 660 pF1KE2 GAGIERMGLAMGGGGGASFDRAIEMERGNFGGSFAGSFGGAGGHAPGVARKACQIFVRNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GAGIERMGLAMGGGGGASFDRAIEMERGNFGGSFAGSFGGAGGHAPGVARKACQIFVRNL 570 580 590 600 610 620 670 680 690 700 710 720 pF1KE2 PFDFTWKMLKDKFNECGHVLYADIKMENGKSKGCGVVKFESPEVAERACRMMNGMKLSGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PFDFTWKMLKDKFNECGHVLYADIKMENGKSKGCGVVKFESPEVAERACRMMNGMKLSGR 630 640 650 660 670 680 730 pF1KE2 EIDVRIDRNA :::::::::: CCDS12 EIDVRIDRNA 690 >>CCDS32230.1 MYEF2 gene_id:50804|Hs108|chr15 (600 aa) initn: 1879 init1: 1074 opt: 1512 Z-score: 1151.9 bits: 223.5 E(32554): 7.7e-58 Smith-Waterman score: 1788; 46.4% identity (64.5% similar) in 729 aa overlap (19-730:37-600) 10 20 30 40 pF1KE2 MAAGVEAAAEVAATEIKMEEESGAPGVPSGNGAPGPKGEGERPAQNEK : :. : :... : : :... :..:: CCDS32 AEVPGATGGDSPHLQPAEPPGEPRREPHPAEAEKQQPQHSSSSN--GVKMENDESAKEEK 10 20 30 40 50 60 50 60 70 80 90 pF1KE2 R--KEKNI-KRGGNRFEPYANPTK----------RYRAFITNIPFDVKWQSLKDLVKEKV :::. .. .:::.::.. . : :.::.:::.:.:::..:::..::: CCDS32 SDLKEKSTGSKKANRFHPYSKDKNSGAGEKKGPNRNRVFISNIPYDMKWQAIKDLMREKV 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE2 GEVTYVELLMDAEGKSRGCAVVEFKMEESMKKAAEVLNKHSLSGRPLKVKEDPDGEHARR ::::::::. :::::::::.::::: :: .::: :..::..::::::..:::::::.::: CCDS32 GEVTYVELFKDAEGKSRGCGVVEFKDEEFVKKALETMNKYDLSGRPLNIKEDPDGENARR 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE2 AMQKVMATTGGMGMGPGGPGMITIPPSILNNPNIPNEIIHALQAGRLGSTVFVANLDYKV :.:.. .. : . : :....::::::::::: :.: :::::::::.::::::.:: CCDS32 ALQRTGGSFPGGHVPDMGSGLMNLPPSILNNPNIPPEVISNLQAGRLGSTIFVANLDFKV 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE2 GWKKLKEVFSMAGVVVRADILEDKDGKSRGIGTVTFEQSIEAVQAISMFNGQLLFDRPMH ::::::::::.::.: :::: :::::::::.:::::::.:::::::::::::.::::::: CCDS32 GWKKLKEVFSIAGTVKRADIKEDKDGKSRGMGTVTFEQAIEAVQAISMFNGQFLFDRPMH 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE2 VKMDERALPKGDFFPPE-RPQQLPHGLGGIGMGLGPGGQPIDANHLNKGIGMGNIGPAGM ::::....:. .. . . :::.::::::::::::::::.:..:: : :::.::.:: CCDS32 VKMDDKSVPHEEYRSHDGKTPQLPRGLGGIGMGLGPGGQPISASQLNIGGVMGNLGPGGM 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE2 GMEGIGFG-INKMGGMEGPFGG--GMENMGRFGSGMNMGRINEILSNALKRGEIIAKQGG ::.: ::: .:..:: : ::: .:..:: ::. .::..: : :: . ... CCDS32 GMDGPGFGGMNRIGGGIG-FGGLEAMNSMGGFGG---VGRMGE-----LYRGAMTSSMER 370 380 390 400 410 400 410 420 430 440 450 pF1KE2 GGGGGSVPGIERMGPGIDRLGGAGMERMGAGLGHGMDRVGSEIERMGLVMDRMGSVERMG : :.. ::.: :.: .. :.:: . .: :.:: . CCDS32 DFGRGDI--------GINR-----------GFGDSFGRLGSAM--IGGFAGRIGSSN--- 420 430 440 450 460 470 480 490 500 510 pF1KE2 SGIERMGPLGLDHMASSIERMGQTMERIGSGVERMGAGMGFGLERMAAPIDRVGQTIERM ::: .:::. ..::: CCDS32 -----MGP-------------------VGSGI---SGGMG-------------------- 460 520 530 540 550 560 570 pF1KE2 GSGVERMGPAIERMGLSMERMVPAGMGAGLERMGPVMDRMATGLERMGANNLERMGLERM ::. : .::: ::.:: CCDS32 ----------------SMNS-VTGGMGMGLDRM--------------------------- 470 480 580 590 600 610 620 630 pF1KE2 GANSLERMGLERMGANSLERMGPAMGPALGAGIERMGLAMGGGGGASFDRAIEMERGNFG ..:..:::: : :: ..:.:.:.:: .. CCDS32 --------------SSSFDRMGP-------------------GIGAILERSIDMDRGFLS 490 500 640 650 660 670 680 690 pF1KE2 GSFAGSFGGAGGHAPGVARKACQIFVRNLPFDFTWKMLKDKFNECGHVLYADIKMENGKS : . :: : .. :. ::::::::::.::. ::.::..::::..:.:::::::: CCDS32 GPM-GS-----GMRERIGSKGNQIFVRNLPFDLTWQKLKEKFSQCGHVMFAEIKMENGKS 510 520 530 540 550 560 700 710 720 730 pF1KE2 KGCGVVKFESPEVAERACRMMNGMKLSGREIDVRIDRNA ::::.:.:.::: ::.:::.:::.:.::::::::.:::: CCDS32 KGCGTVRFDSPESAEKACRIMNGIKISGREIDVRLDRNA 570 580 590 600 >>CCDS73722.1 MYEF2 gene_id:50804|Hs108|chr15 (576 aa) initn: 1901 init1: 1074 opt: 1506 Z-score: 1147.5 bits: 222.6 E(32554): 1.3e-57 Smith-Waterman score: 1720; 46.3% identity (62.0% similar) in 726 aa overlap (19-730:37-576) 10 20 30 40 pF1KE2 MAAGVEAAAEVAATEIKMEEESGAPGVPSGNGAPGPKGEGERPAQNEK : :. : :... : : :... :..:: CCDS73 AEVPGATGGDSPHLQPAEPPGEPRREPHPAEAEKQQPQHSSSSN--GVKMENDESAKEEK 10 20 30 40 50 60 50 60 70 80 90 pF1KE2 R--KEKNI-KRGGNRFEPYANPTK----------RYRAFITNIPFDVKWQSLKDLVKEKV :::. .. .:::.::.. . : :.::.:::.:.:::..:::..::: CCDS73 SDLKEKSTGSKKANRFHPYSKDKNSGAGEKKGPNRNRVFISNIPYDMKWQAIKDLMREKV 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE2 GEVTYVELLMDAEGKSRGCAVVEFKMEESMKKAAEVLNKHSLSGRPLKVKEDPDGEHARR ::::::::. :::::::::.::::: :: .::: :..::..::::::..:::::::.::: CCDS73 GEVTYVELFKDAEGKSRGCGVVEFKDEEFVKKALETMNKYDLSGRPLNIKEDPDGENARR 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE2 AMQKVMATTGGMGMGPGGPGMITIPPSILNNPNIPNEIIHALQAGRLGSTVFVANLDYKV :.:.. .. : . : :....::::::::::: :.: :::::::::.::::::.:: CCDS73 ALQRTGGSFPGGHVPDMGSGLMNLPPSILNNPNIPPEVISNLQAGRLGSTIFVANLDFKV 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE2 GWKKLKEVFSMAGVVVRADILEDKDGKSRGIGTVTFEQSIEAVQAISMFNGQLLFDRPMH ::::::::::.::.: :::: :::::::::.:::::::.:::::::::::::.::::::: CCDS73 GWKKLKEVFSIAGTVKRADIKEDKDGKSRGMGTVTFEQAIEAVQAISMFNGQFLFDRPMH 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE2 VKMDERALPKGDFFPPE-RPQQLPHGLGGIGMGLGPGGQPIDANHLNKGIGMGNIGPAGM ::::....:. .. . . :::.::::::::::::::::.:..:: : :::.::.:: CCDS73 VKMDDKSVPHEEYRSHDGKTPQLPRGLGGIGMGLGPGGQPISASQLNIGGVMGNLGPGGM 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE2 GMEGIGFGINKMGGMEGPFGGGMENMGRFGSGMNMGRINEILSNALKRGEIIAKQGGGGG ::.: ::: ::: :: ::: : CCDS73 GMDGPGFG-----------------------GMN--RI-----------------GGGIG 370 380 400 410 420 430 440 450 pF1KE2 GGSVPGIERMGPGIDRLGGAGMERMGAGLGHGMDRVGSEIERMGLVMDRMGSVERMGSGI : :.: : . .:: : :. CCDS73 FG---GLEAM----NSMGGFG-------------------------------------GV 390 460 470 480 490 500 510 pF1KE2 ERMGPLGLDHMASSIERMGQTMERIGSGVERMGAGMGFGLERMAAPIDRVGQTIERMGSG ::: : :.::.:: .: : .: . ::: : : :.:.: CCDS73 GRMGELYRGAMTSSMER------DFGRG--DIGINRGFG--------DSFG----RLGGG 400 410 420 430 520 530 540 550 560 570 pF1KE2 VERMGPAIERMGLSMERMVPAGMGAGLERMGPVMDRMATGLERMGANNLERMGLERMGAN :: ::. : .::: ::.:: CCDS73 ---MG--------SMNS-VTGGMGMGLDRM------------------------------ 440 450 580 590 600 610 620 630 pF1KE2 SLERMGLERMGANSLERMGPAMGPALGAGIERMGLAMGGGGGASFDRAIEMERGNFGGSF ..:..:::: : :: ..:.:.:.:: ..: . CCDS73 -----------SSSFDRMGP-------------------GIGAILERSIDMDRGFLSGPM 460 470 480 640 650 660 670 680 690 pF1KE2 AGSFGGAGGHAPGVARKACQIFVRNLPFDFTWKMLKDKFNECGHVLYADIKMENGKSKGC :: : .. :. ::::::::::.::. ::.::..::::..:.::::::::::: CCDS73 -GS-----GMRERIGSKGNQIFVRNLPFDLTWQKLKEKFSQCGHVMFAEIKMENGKSKGC 490 500 510 520 530 540 700 710 720 730 pF1KE2 GVVKFESPEVAERACRMMNGMKLSGREIDVRIDRNA :.:.:.::: ::.:::.:::.:.::::::::.:::: CCDS73 GTVRFDSPESAEKACRIMNGIKISGREIDVRLDRNA 550 560 570 730 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 13:27:56 2016 done: Sun Nov 6 13:27:57 2016 Total Scan time: 3.840 Total Display time: 0.100 Function used was FASTA [36.3.4 Apr, 2011]