FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3762, 567 aa 1>>>pF1KE3762 567 - 567 aa - 567 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.5892+/-0.000847; mu= 1.0972+/- 0.051 mean_var=262.0317+/-52.075, 0's: 0 Z-trim(116.5): 30 B-trim: 0 in 0/51 Lambda= 0.079231 statistics sampled from 17098 (17125) to 17098 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.821), E-opt: 0.2 (0.526), width: 16 Scan time: 4.370 The best scores are: opt bits E(32554) CCDS4777.1 PHF1 gene_id:5252|Hs108|chr6 ( 567) 4045 475.3 8.4e-134 CCDS4778.1 PHF1 gene_id:5252|Hs108|chr6 ( 457) 2543 303.6 3.4e-82 CCDS35116.1 PHF19 gene_id:26147|Hs108|chr9 ( 580) 1409 174.0 4.3e-43 CCDS75889.1 PHF19 gene_id:26147|Hs108|chr9 ( 599) 1409 174.1 4.4e-43 CCDS742.1 MTF2 gene_id:22823|Hs108|chr1 ( 593) 1355 167.9 3.2e-41 CCDS53340.1 MTF2 gene_id:22823|Hs108|chr1 ( 536) 1239 154.6 2.9e-37 CCDS53341.1 MTF2 gene_id:22823|Hs108|chr1 ( 491) 1126 141.6 2.1e-33 CCDS69648.1 PHF19 gene_id:26147|Hs108|chr9 ( 371) 729 96.2 7.7e-20 >>CCDS4777.1 PHF1 gene_id:5252|Hs108|chr6 (567 aa) initn: 4045 init1: 4045 opt: 4045 Z-score: 2515.6 bits: 475.3 E(32554): 8.4e-134 Smith-Waterman score: 4045; 99.8% identity (100.0% similar) in 567 aa overlap (1-567:1-567) 10 20 30 40 50 60 pF1KE3 MAQPPRLSRSGASSLWDPASPAPTSGPRPRLWEGQDVLARWTDGLLYLGTIKKVDSAREV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MAQPPRLSRSGASSLWDPASPAPTSGPRPRLWEGQDVLARWTDGLLYLGTIKKVDSAREV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 CLVQFEDDSQFLVLWKDISPAALPGEELLCCVCRSETVVPGNRLVSCEKCRHAYHQDCHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 CLVQFEDDSQFLVLWKDISPAALPGEELLCCVCRSETVVPGNRLVSCEKCRHAYHQDCHV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 PRAPAPGEGEGTSWVCRQCVFAIATKRGGALKKGPYARAMLGMKLSLPYGLKGLDWDAGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PRAPAPGEGEGTSWVCRQCVFAIATKRGGALKKGPYARAMLGMKLSLPYGLKGLDWDAGH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 LSNRQQSYCYCGGPGEWNLKMLQCRSCLQWFHEACTQCLSKPLLYGDRFYEFECCVCRGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LSNRQQSYCYCGGPGEWNLKMLQCRSCLQWFHEACTQCLSKPLLYGDRFYEFECCVCRGG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 PEKVRRLQLRWVDVAHLVLYHLSVCCKKKYFDFDREILPFTSENWDSLLLGELSDTPKGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PEKVRRLQLRWVDVAHLVLYHLSVCCKKKYFDFDREILPFTSENWDSLLLGELSDTPKGE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 RSSKLLSALNSHKDRFISGREIKKRKCLFGLHARMPPPVEPPTGDGALTSFPSGQGPGGG :::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 RSSRLLSALNSHKDRFISGREIKKRKCLFGLHARMPPPVEPPTGDGALTSFPSGQGPGGG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 VSRPLGKRRRPEPEPLRRRQKGKVEELGPPSAVRNQPEPQEQRERAHLQRALQASVSPPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VSRPLGKRRRPEPEPLRRRQKGKVEELGPPSAVRNQPEPQEQRERAHLQRALQASVSPPS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 PSPNQSYQGSSGYNFRPTDARCLPSSPIRMFASFHPSASTAGTSGDSGPPDRSPLELHIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PSPNQSYQGSSGYNFRPTDARCLPSSPIRMFASFHPSASTAGTSGDSGPPDRSPLELHIG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 FPTDIPKSAPHSMTASSSSVSSPSPGLPRRSAPPSPLCRSLSPGTGGGVRGGVGYLSRGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 FPTDIPKSAPHSMTASSSSVSSPSPGLPRRSAPPSPLCRSLSPGTGGGVRGGVGYLSRGD 490 500 510 520 530 540 550 560 pF1KE3 PVRVLARRVRPDGSVQYLVEWGGGGIF ::::::::::::::::::::::::::: CCDS47 PVRVLARRVRPDGSVQYLVEWGGGGIF 550 560 >>CCDS4778.1 PHF1 gene_id:5252|Hs108|chr6 (457 aa) initn: 2521 init1: 2521 opt: 2543 Z-score: 1589.0 bits: 303.6 E(32554): 3.4e-82 Smith-Waterman score: 2543; 94.9% identity (96.3% similar) in 375 aa overlap (1-374:1-375) 10 20 30 40 50 60 pF1KE3 MAQPPRLSRSGASSLWDPASPAPTSGPRPRLWEGQDVLARWTDGLLYLGTIKKVDSAREV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MAQPPRLSRSGASSLWDPASPAPTSGPRPRLWEGQDVLARWTDGLLYLGTIKKVDSAREV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 CLVQFEDDSQFLVLWKDISPAALPGEELLCCVCRSETVVPGNRLVSCEKCRHAYHQDCHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 CLVQFEDDSQFLVLWKDISPAALPGEELLCCVCRSETVVPGNRLVSCEKCRHAYHQDCHV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 PRAPAPGEGEGTSWVCRQCVFAIATKRGGALKKGPYARAMLGMKLSLPYGLKGLDWDAGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PRAPAPGEGEGTSWVCRQCVFAIATKRGGALKKGPYARAMLGMKLSLPYGLKGLDWDAGH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 LSNRQQSYCYCGGPGEWNLKMLQCRSCLQWFHEACTQCLSKPLLYGDRFYEFECCVCRGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LSNRQQSYCYCGGPGEWNLKMLQCRSCLQWFHEACTQCLSKPLLYGDRFYEFECCVCRGG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 PEKVRRLQLRWVDVAHLVLYHLSVCCKKKYFDFDREILPFTSENWDSLLLGELSDTPKGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PEKVRRLQLRWVDVAHLVLYHLSVCCKKKYFDFDREILPFTSENWDSLLLGELSDTPKGE 250 260 270 280 290 300 310 320 330 340 350 pF1KE3 RSSKLLSALNSHKDRFISGREIKKRKCLFGLHARMPPPVEPPTGDGALT-SFPSGQGPGG :::.::::::::::::::::::::::::::::::::::::::::::::: . : :.: . CCDS47 RSSRLLSALNSHKDRFISGREIKKRKCLFGLHARMPPPVEPPTGDGALTRAGPWGRGLTS 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE3 GVSRPLGKRRRPEPEPLRRRQKGKVEELGPPSAVRNQPEPQEQRERAHLQRALQASVSPP : . : :: : CCDS47 PGEAPEAGARAPEEEAEGESGGAGATLSSAQSARAPGAEGAGSSAEGTAAAPSGCLLPST 370 380 390 400 410 420 >>CCDS35116.1 PHF19 gene_id:26147|Hs108|chr9 (580 aa) initn: 1168 init1: 1073 opt: 1409 Z-score: 887.1 bits: 174.0 E(32554): 4.3e-43 Smith-Waterman score: 1409; 43.6% identity (66.1% similar) in 560 aa overlap (30-563:39-576) 10 20 30 40 50 pF1KE3 MAQPPRLSRSGASSLWDPASPAPTSGPRPRLWEGQDVLARWTDGLLYLGTIKKVDSARE .: ::: :: :::::: ::: ::.:.:... CCDS35 GTRDSYGATSHLPNKGALAKVKNNFKDLMSKLTEGQYVLCRWTDGLYYLGKIKRVSSSKQ 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE3 VCLVQFEDDSQFLVLWKDISPAALPGEELLCCVCRSETVVPGNRLVSCEKCRHAYHQDCH ::: :::.:.. ::::::. :..:::: : .: ..: : :... : :: .:::.:: CCDS35 SCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNICLGKTSGPLNEILICGKCGLGYHQQCH 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE3 VPRAPAPGEGEGTSWVCRQCVFAIATKRGGALKKGPYARAMLGMKLSLPYGLKGLDWDAG .: : . . : : ::.:.::.:...::::::: ::.. ..:. : : . :.::. CCDS35 IPIAGSADQPLLTPWFCRRCIFALAVRKGGALKKGAIARTLQAVKMVLSYQPEELEWDSP 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE3 HLSNRQQSYCYCGGPGEWNLKMLQCRSCLQWFHEACTQCLSKPLLYGDRFYEFECCVCRG : .:.:: :::::::::: :.:::: : :::::::::::..:...::::: : : :: CCDS35 HRTNQQQCYCYCGGPGEWYLRMLQCYRCRQWFHEACTQCLNEPMMFGDRFYLFFCSVCNQ 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE3 GPEKVRRLQLRWVDVAHLVLYHLSVCCKKKYFDFDREILPFTSENWDSLLLGELSDTPKG ::: ..:: ::::::.::.::.:.: :::::::. ::: :....:. : ::.:..:: CCDS35 GPEYIERLPLRWVDVVHLALYNLGVQSKKKYFDFE-EILAFVNHHWELLQLGKLTSTPVT 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE3 ERSSKLLSALNSHKDRFISGREIKKRKCLFGLHARMPPPVEPPTGDGALTSFPSGQGPGG .:. .::.::::.:.::. :.::::.::.: :. :.:: .:: : : : CCDS35 DRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRIRVPP--NPP---GKLL-------PDK 310 320 330 340 350 360 370 380 390 400 410 pF1KE3 GVSRPLGKRRRPEPEPLRRRQKGKVEELGPPSAVRNQPEPQEQRERAH--LQRALQASVS :. : .. : ::.: :.: : : ..: . .:.:.. :. :. .: CCDS35 GL---LPNENSASSE-LRKRGKSKPGLL--PHEFQQQKRRVYRRKRSKFLLEDAIPSSDF 360 370 380 390 400 420 430 440 450 460 pF1KE3 PPSPSPNQSYQGSSGYNFRPTDARCLPS-SPIRMFASFHPSASTAGTSG--------DS- . : : .. .: ..: . . : : : . : : :...:.::: :: CCDS35 TSAWSTN--HHLASIFDFTLDEIQSLKSASSGQTFFSDVDSTDAASTSGSASTSLSYDSR 410 420 430 440 450 460 470 480 490 500 510 pF1KE3 ---GPPDRS-------PLELHIGFPTDIPKSAPHSMTASSSSVSS-PSPGLPRRSAPP-S : :. ::. . . ... : . .: ..:: :. :. .. : CCDS35 WTVGSRKRKLAAKAYMPLRAK-RWAAELDGRCPSDSSAEGASVPERPDEGIDSHTFESIS 470 480 490 500 510 520 520 530 540 550 560 pF1KE3 PLCRSLS--PGTGGGVRGGVGYLSRGDPVRVLARRVRPDGSVQYLVEWGGGGIF ::: .. . :..: :. :. .:::::: :.:.::::::: : CCDS35 EDDSSLSHLKSSITNYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGTTPY 530 540 550 560 570 580 >>CCDS75889.1 PHF19 gene_id:26147|Hs108|chr9 (599 aa) initn: 1168 init1: 1073 opt: 1409 Z-score: 886.9 bits: 174.1 E(32554): 4.4e-43 Smith-Waterman score: 1409; 43.6% identity (66.1% similar) in 560 aa overlap (30-563:58-595) 10 20 30 40 50 pF1KE3 MAQPPRLSRSGASSLWDPASPAPTSGPRPRLWEGQDVLARWTDGLLYLGTIKKVDSARE .: ::: :: :::::: ::: ::.:.:... CCDS75 GTRDSYGATSHLPNKGALAKVKNNFKDLMSKLTEGQYVLCRWTDGLYYLGKIKRVSSSKQ 30 40 50 60 70 80 60 70 80 90 100 110 pF1KE3 VCLVQFEDDSQFLVLWKDISPAALPGEELLCCVCRSETVVPGNRLVSCEKCRHAYHQDCH ::: :::.:.. ::::::. :..:::: : .: ..: : :... : :: .:::.:: CCDS75 SCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNICLGKTSGPLNEILICGKCGLGYHQQCH 90 100 110 120 130 140 120 130 140 150 160 170 pF1KE3 VPRAPAPGEGEGTSWVCRQCVFAIATKRGGALKKGPYARAMLGMKLSLPYGLKGLDWDAG .: : . . : : ::.:.::.:...::::::: ::.. ..:. : : . :.::. CCDS75 IPIAGSADQPLLTPWFCRRCIFALAVRKGGALKKGAIARTLQAVKMVLSYQPEELEWDSP 150 160 170 180 190 200 180 190 200 210 220 230 pF1KE3 HLSNRQQSYCYCGGPGEWNLKMLQCRSCLQWFHEACTQCLSKPLLYGDRFYEFECCVCRG : .:.:: :::::::::: :.:::: : :::::::::::..:...::::: : : :: CCDS75 HRTNQQQCYCYCGGPGEWYLRMLQCYRCRQWFHEACTQCLNEPMMFGDRFYLFFCSVCNQ 210 220 230 240 250 260 240 250 260 270 280 290 pF1KE3 GPEKVRRLQLRWVDVAHLVLYHLSVCCKKKYFDFDREILPFTSENWDSLLLGELSDTPKG ::: ..:: ::::::.::.::.:.: :::::::. ::: :....:. : ::.:..:: CCDS75 GPEYIERLPLRWVDVVHLALYNLGVQSKKKYFDFE-EILAFVNHHWELLQLGKLTSTPVT 270 280 290 300 310 320 300 310 320 330 340 350 pF1KE3 ERSSKLLSALNSHKDRFISGREIKKRKCLFGLHARMPPPVEPPTGDGALTSFPSGQGPGG .:. .::.::::.:.::. :.::::.::.: :. :.:: .:: : : : CCDS75 DRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRIRVPP--NPP---GKLL-------PDK 330 340 350 360 370 360 370 380 390 400 410 pF1KE3 GVSRPLGKRRRPEPEPLRRRQKGKVEELGPPSAVRNQPEPQEQRERAH--LQRALQASVS :. : .. : ::.: :.: : : ..: . .:.:.. :. :. .: CCDS75 GL---LPNENSASSE-LRKRGKSKPGLL--PHEFQQQKRRVYRRKRSKFLLEDAIPSSDF 380 390 400 410 420 420 430 440 450 460 pF1KE3 PPSPSPNQSYQGSSGYNFRPTDARCLPS-SPIRMFASFHPSASTAGTSG--------DS- . : : .. .: ..: . . : : : . : : :...:.::: :: CCDS75 TSAWSTN--HHLASIFDFTLDEIQSLKSASSGQTFFSDVDSTDAASTSGSASTSLSYDSR 430 440 450 460 470 480 470 480 490 500 510 pF1KE3 ---GPPDRS-------PLELHIGFPTDIPKSAPHSMTASSSSVSS-PSPGLPRRSAPP-S : :. ::. . . ... : . .: ..:: :. :. .. : CCDS75 WTVGSRKRKLAAKAYMPLRAK-RWAAELDGRCPSDSSAEGASVPERPDEGIDSHTFESIS 490 500 510 520 530 540 520 530 540 550 560 pF1KE3 PLCRSLS--PGTGGGVRGGVGYLSRGDPVRVLARRVRPDGSVQYLVEWGGGGIF ::: .. . :..: :. :. .:::::: :.:.::::::: : CCDS75 EDDSSLSHLKSSITNYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGTTPY 550 560 570 580 590 >>CCDS742.1 MTF2 gene_id:22823|Hs108|chr1 (593 aa) initn: 1416 init1: 1322 opt: 1355 Z-score: 853.6 bits: 167.9 E(32554): 3.2e-41 Smith-Waterman score: 1426; 41.5% identity (64.9% similar) in 559 aa overlap (27-563:42-589) 10 20 30 40 50 pF1KE3 MAQPPRLSRSGASSLWDPASPAPTSGPRPRLWEGQDVLARWTDGLLYLGTIKKVDS : .. :::::::::.:::.:::::::.. CCDS74 VHKRSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGLFYLGTIKKINI 20 30 40 50 60 70 60 70 80 90 100 110 pF1KE3 AREVCLVQFEDDSQFLVLWKDISPAALPGEELLCCVCRSETVVPGNRLVSCEKCRHAYHQ .. :.. :::.:. ::::::. .: . :..: .:. : :..: :.:: ..::: CCDS74 LKQSCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMVICDKCGQGYHQ 80 90 100 110 120 130 120 130 140 150 160 170 pF1KE3 DCHVPRAPAPGEGEGTSWVCRQCVFAIATKRGGALKKGPYARAMLGMKLSLPYGLKGLDW ::.:. . .:.::::::: .::::::::::: :.:. :: .:::.. :.: CCDS74 LCHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEW 140 150 160 170 180 190 180 190 200 210 220 230 pF1KE3 DAGHLSNRQQSYCYCGGPGEWNLKMLQCRSCLQWFHEACTQCLSKPLLYGDRFYEFECCV :::: .: :: ::::::::.: :::::: .: :::::::.:::.::.:.::::: : : : CCDS74 DAGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFYTFICSV 200 210 220 230 240 250 240 250 260 270 280 290 pF1KE3 CRGGPEKVRRLQLRWVDVAHLVLYHLSVCCKKKYFDFDREILPFTSENWDSLLLGELSDT : .::: ..:: :.:::.::: ::.::: :::::: . :.. . .:::: : :::.:: CCDS74 CSSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHPGELADT 260 270 280 290 300 310 300 310 320 330 340 350 pF1KE3 PKGERSSKLLSALNSHKDRFISGREIKKRKCLFGLHARMPPPVEPPTGDGALTSFPSGQG ::.:: ..: :::..: :.::.::::.: ::::. :.:: ::. ..: . . CCDS74 PKSERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPP--VPPN-----VAFKAEKE 320 330 340 350 360 360 370 380 390 400 410 pF1KE3 PGGGVSRPLGKRRRPEPEPLR--RRQKGKVEELGPPSAVRNQPEPQEQRERAHLQRALQA : : .:. . . : .:. :. .. .:. : ..: : : : .:.. . CCDS74 PEG-TSHEFKIKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGP---YTRKMIQKTAEP 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE3 SVSPPSPSPNQSYQGSSGYNFRPTDARCLPSSPIRMF-ASFHPSASTAGTSGDSGPPD-R .. : : : . . . . :. .: . . :: ..... : : : : CCDS74 LLDKESISENPTLDLPCSIGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGLSDSR 430 440 450 460 470 480 480 490 500 510 520 pF1KE3 SPLELHIGFPTDIPK------SAPH-SMTASSSSVSSPSPGLPRRSAPP--SPLCRSLSP . . ..:. ::. :. .. ...: . . . : . . . .:. CCDS74 KRTRTGRSWPAAIPHLRRRRGRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLAD 490 500 510 520 530 540 530 540 550 560 pF1KE3 ---------GTGGGVRGGVGYLSRGDPVRVLARRVRPDGSVQYLVEWGGGGIF .. . :..: .. :. ::::::: ::.::::::: : CCDS74 QELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS 550 560 570 580 590 >>CCDS53340.1 MTF2 gene_id:22823|Hs108|chr1 (536 aa) initn: 1317 init1: 1223 opt: 1239 Z-score: 782.5 bits: 154.6 E(32554): 2.9e-37 Smith-Waterman score: 1264; 39.9% identity (61.1% similar) in 547 aa overlap (27-563:42-532) 10 20 30 40 50 pF1KE3 MAQPPRLSRSGASSLWDPASPAPTSGPRPRLWEGQDVLARWTDGLLYLGTIKKVDS : .. :::::::::.:::.:::::::.. CCDS53 VHKRSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGLFYLGTIKKINI 20 30 40 50 60 70 60 70 80 90 100 110 pF1KE3 AREVCLVQFEDDSQFLVLWKDISPAALPGEELLCCVCRSETVVPGNRLVSCEKCRHAYHQ .. :.. :::.:. ::::::. .: . :..: .:. : :..: :.:: ..::: CCDS53 LKQSCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMVICDKCGQGYHQ 80 90 100 110 120 130 120 130 140 150 160 170 pF1KE3 DCHVPRAPAPGEGEGTSWVCRQCVFAIATKRGGALKKGPYARAMLGMKLSLPYGLKGLDW ::.:. . .:.::::::: .::::::::::: :.:. :: .:::.. :.: CCDS53 LCHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEW 140 150 160 170 180 190 180 190 200 210 220 230 pF1KE3 DAGHLSNRQQSYCYCGGPGEWNLKMLQCRSCLQWFHEACTQCLSKPLLYGDRFYEFECCV :::: .: :: ::::::::.: :::::: .: :::::::.:::.::.:.::::: : : : CCDS53 DAGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFYTFICSV 200 210 220 230 240 250 240 250 260 270 280 290 pF1KE3 CRGGPEKVRRLQLRWVDVAHLVLYHLSVCCKKKYFDFDREILPFTSENWDSLLLGELSDT : .::: ..:: :.:::.::: ::.::: :::::: . :.. . .:::: : :::.:: CCDS53 CSSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHPGELADT 260 270 280 290 300 310 300 310 320 330 340 pF1KE3 PKGERSSKLLSALNSHKDRFIS-GREIKKRKCLFGLHARMPPP---------VEPPTGDG ::.:: ..: :::..: .: : : : .: : : : : .:: CCDS53 PKSERYEHVLEALNDYKTMEVSNGIEKKGKKKSVG---RPPGPYTRKMIQKTAEPLLDKE 320 330 340 350 360 350 360 370 380 390 400 pF1KE3 ALTSFPSGQGPGGGVSRPLGKRRRPEPEPLRRRQKGKVEELGPPSAVRNQPEPQEQRERA ... :. . : . ..: : . . . ....: : :. ...:.:. CCDS53 SISENPTLDLPCS-IGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGL-SDSRKRT 370 380 390 400 410 420 410 420 430 440 450 460 pF1KE3 HLQRALQASVSPPSPSPNQSYQGSSGYNFRPTDARCLPSSPIRMFASFHPSASTAGTSGD . : : :. :. .: .: :: .. . .. .. : CCDS53 RTGR------SWPAAIPH----------LRRRRGR-LPRRALQ-------TQNSEIVKDD 430 440 450 460 470 480 490 500 510 520 pF1KE3 SGPPDRSPLELHIGFPTDIPKSAPHSMTASSSSVSSPSPGLPRRSAPPSPLCRSLSPGTG : : . ::. . ... . ... ..:..: CCDS53 EGKEDYQFDELNTEILNNLA-DQELQLNHLKNSITS------------------------ 470 480 490 530 540 550 560 pF1KE3 GGVRGGVGYLSRGDPVRVLARRVRPDGSVQYLVEWGGGGIF :..: .. :. ::::::: ::.::::::: : CCDS53 --YFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS 500 510 520 530 >>CCDS53341.1 MTF2 gene_id:22823|Hs108|chr1 (491 aa) initn: 1162 init1: 1068 opt: 1126 Z-score: 713.2 bits: 141.6 E(32554): 2.1e-33 Smith-Waterman score: 1197; 40.0% identity (63.3% similar) in 498 aa overlap (88-563:1-487) 60 70 80 90 100 110 pF1KE3 REVCLVQFEDDSQFLVLWKDISPAALPGEELLCCVCRSETVVPGNRLVSCEKCRHAYHQD ..: .:. : :..: :.:: ..::: CCDS53 MVCTICQEEYSEAPNEMVICDKCGQGYHQL 10 20 30 120 130 140 150 160 170 pF1KE3 CHVPRAPAPGEGEGTSWVCRQCVFAIATKRGGALKKGPYARAMLGMKLSLPYGLKGLDWD ::.:. . .:.::::::: .::::::::::: :.:. :: .:::.. :.:: CCDS53 CHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEWD 40 50 60 70 80 90 180 190 200 210 220 230 pF1KE3 AGHLSNRQQSYCYCGGPGEWNLKMLQCRSCLQWFHEACTQCLSKPLLYGDRFYEFECCVC ::: .: :: ::::::::.: :::::: .: :::::::.:::.::.:.::::: : : :: CCDS53 AGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFYTFICSVC 100 110 120 130 140 150 240 250 260 270 280 290 pF1KE3 RGGPEKVRRLQLRWVDVAHLVLYHLSVCCKKKYFDFDREILPFTSENWDSLLLGELSDTP .::: ..:: :.:::.::: ::.::: :::::: . :.. . .:::: : :::.::: CCDS53 SSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHPGELADTP 160 170 180 190 200 210 300 310 320 330 340 350 pF1KE3 KGERSSKLLSALNSHKDRFISGREIKKRKCLFGLHARMPPPVEPPTGDGALTSFPSGQGP :.:: ..: :::..: :.::.::::.: ::::. :.:: ::. ..: . . : CCDS53 KSERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPP--VPPN-----VAFKAEKEP 220 230 240 250 260 360 370 380 390 400 410 pF1KE3 GGGVSRPLGKRRRPEPEPLR--RRQKGKVEELGPPSAVRNQPEPQEQRERAHLQRALQAS : .:. . . : .:. :. .. .:. : ..: : : : .:.. . CCDS53 EG-TSHEFKIKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGP---YTRKMIQKTAEPL 270 280 290 300 310 420 430 440 450 460 470 pF1KE3 VSPPSPSPNQSYQGSSGYNFRPTDARCLPSSPIRMF-ASFHPSASTAGTSGDSGPPD-RS .. : : : . . . . :. .: . . :: ..... : : : :. CCDS53 LDKESISENPTLDLPCSIGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGLSDSRK 320 330 340 350 360 370 480 490 500 510 520 pF1KE3 PLELHIGFPTDIPK------SAPH-SMTASSSSVSSPSPGLPRRSAPP--SPLCRSLSP- . ..:. ::. :. .. ...: . . . : . . . .:. CCDS53 RTRTGRSWPAAIPHLRRRRGRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLADQ 380 390 400 410 420 430 530 540 550 560 pF1KE3 --------GTGGGVRGGVGYLSRGDPVRVLARRVRPDGSVQYLVEWGGGGIF .. . :..: .. :. ::::::: ::.::::::: : CCDS53 ELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS 440 450 460 470 480 490 >>CCDS69648.1 PHF19 gene_id:26147|Hs108|chr9 (371 aa) initn: 488 init1: 393 opt: 729 Z-score: 469.6 bits: 96.2 E(32554): 7.7e-20 Smith-Waterman score: 729; 38.9% identity (61.1% similar) in 388 aa overlap (201-563:1-367) 180 190 200 210 220 230 pF1KE3 LKGLDWDAGHLSNRQQSYCYCGGPGEWNLKMLQCRSCLQWFHEACTQCLSKPLLYGDRFY :::: : :::::::::::..:...::::: CCDS69 MLQCYRCRQWFHEACTQCLNEPMMFGDRFY 10 20 30 240 250 260 270 280 290 pF1KE3 EFECCVCRGGPEKVRRLQLRWVDVAHLVLYHLSVCCKKKYFDFDREILPFTSENWDSLLL : : :: ::: ..:: ::::::.::.::.:.: :::::::. ::: :....:. : : CCDS69 LFFCSVCNQGPEYIERLPLRWVDVVHLALYNLGVQSKKKYFDFE-EILAFVNHHWELLQL 40 50 60 70 80 300 310 320 330 340 350 pF1KE3 GELSDTPKGERSSKLLSALNSHKDRFISGREIKKRKCLFGLHARMPPPVEPPTGDGALTS :.:..:: .:. .::.::::.:.::. :.::::.::.: :. :.:: .:: : : CCDS69 GKLTSTPVTDRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRIRVPP--NPP---GKLL- 90 100 110 120 130 140 360 370 380 390 400 pF1KE3 FPSGQGPGGGVSRPLGKRRRPEPEPLRRRQKGKVEELGPPSAVRNQPEPQEQRERAH--L : :. : .. : ::.: :.: : : ..: . .:.:.. : CCDS69 ------PDKGL---LPNENSASSE-LRKRGKSKPGLL--PHEFQQQKRRVYRRKRSKFLL 150 160 170 180 190 410 420 430 440 450 460 pF1KE3 QRALQASVSPPSPSPNQSYQGSSGYNFRPTDARCLPS--SPIRMFASFHPS--ASTAGTS . :. .: . : : .. .: ..: . . : : : .:.. . :::.:.. CCDS69 EDAIPSSDFTSAWSTN--HHLASIFDFTLDEIQSLKSASSGQTFFSDVDSTDAASTSGSA 200 210 220 230 240 470 480 490 500 pF1KE3 GDSGPPD--------RSPLELHIGFPTDIPKSA-------PHSMTASSSSVSS-PSPGLP . : : . : . .: . : : . .: ..:: :. :. CCDS69 STSLSYDSRWTVGSRKRKLAAKAYMPLRAKRWAAELDGRCPSDSSAEGASVPERPDEGID 250 260 270 280 290 300 510 520 530 540 550 560 pF1KE3 RRSAPP-SPLCRSLS--PGTGGGVRGGVGYLSRGDPVRVLARRVRPDGSVQYLVEWGGGG .. : ::: .. . :..: :. :. .:::::: :.:.::::::: : CCDS69 SHTFESISEDDSSLSHLKSSITNYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGTT 310 320 330 340 350 360 pF1KE3 IF CCDS69 PY 370 567 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 06:45:56 2016 done: Sun Nov 6 06:45:57 2016 Total Scan time: 4.370 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]