FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1164, 593 aa 1>>>pF1KE1164 593 - 593 aa - 593 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.7948+/-0.000979; mu= 12.7163+/- 0.059 mean_var=127.3367+/-25.545, 0's: 0 Z-trim(109.5): 55 B-trim: 80 in 1/49 Lambda= 0.113657 statistics sampled from 10910 (10954) to 10910 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.699), E-opt: 0.2 (0.336), width: 16 Scan time: 3.610 The best scores are: opt bits E(32554) CCDS742.1 MTF2 gene_id:22823|Hs108|chr1 ( 593) 4077 680.1 2.1e-195 CCDS53341.1 MTF2 gene_id:22823|Hs108|chr1 ( 491) 3392 567.8 1.2e-161 CCDS53340.1 MTF2 gene_id:22823|Hs108|chr1 ( 536) 2379 401.7 1.2e-111 CCDS35116.1 PHF19 gene_id:26147|Hs108|chr9 ( 580) 1673 285.9 9.3e-77 CCDS75889.1 PHF19 gene_id:26147|Hs108|chr9 ( 599) 1673 286.0 9.6e-77 CCDS4777.1 PHF1 gene_id:5252|Hs108|chr6 ( 567) 1355 233.8 4.6e-61 CCDS4778.1 PHF1 gene_id:5252|Hs108|chr6 ( 457) 1336 230.6 3.3e-60 CCDS69648.1 PHF19 gene_id:26147|Hs108|chr9 ( 371) 964 169.5 6.6e-42 CCDS35117.1 PHF19 gene_id:26147|Hs108|chr9 ( 207) 436 82.8 4.8e-16 >>CCDS742.1 MTF2 gene_id:22823|Hs108|chr1 (593 aa) initn: 4077 init1: 4077 opt: 4077 Z-score: 3621.7 bits: 680.1 E(32554): 2.1e-195 Smith-Waterman score: 4077; 100.0% identity (100.0% similar) in 593 aa overlap (1-593:1-593) 10 20 30 40 50 60 pF1KE1 MRDSTGAGNSLVHKRSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 MRDSTGAGNSLVHKRSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 FYLGTIKKINILKQSCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 FYLGTIKKINILKQSCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 ICDKCGQGYHQLCHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 ICDKCGQGYHQLCHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 TLPYSVADLEWDAGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 TLPYSVADLEWDAGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLF 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 GDRFYTFICSVCSSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 GDRFYTFICSVCSSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENW 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 DRLHPGELADTPKSERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPVPPNVAFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 DRLHPGELADTPKSERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPVPPNVAFK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 AEKEPEGTSHEFKIKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 AEKEPEGTSHEFKIKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE1 LLDKESISENPTLDLPCSIGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGLSDSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 LLDKESISENPTLDLPCSIGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGLSDSR 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE1 KRTRTGRSWPAAIPHLRRRRGRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 KRTRTGRSWPAAIPHLRRRRGRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLAD 490 500 510 520 530 540 550 560 570 580 590 pF1KE1 QELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 QELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS 550 560 570 580 590 >>CCDS53341.1 MTF2 gene_id:22823|Hs108|chr1 (491 aa) initn: 3392 init1: 3392 opt: 3392 Z-score: 3015.8 bits: 567.8 E(32554): 1.2e-161 Smith-Waterman score: 3392; 100.0% identity (100.0% similar) in 491 aa overlap (103-593:1-491) 80 90 100 110 120 130 pF1KE1 KQSCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMVICDKCGQGYHQL :::::::::::::::::::::::::::::: CCDS53 MVCTICQEEYSEAPNEMVICDKCGQGYHQL 10 20 30 140 150 160 170 180 190 pF1KE1 CHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEWD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 CHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEWD 40 50 60 70 80 90 200 210 220 230 240 250 pF1KE1 AGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFYTFICSVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 AGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFYTFICSVC 100 110 120 130 140 150 260 270 280 290 300 310 pF1KE1 SSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHPGELADTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHPGELADTP 160 170 180 190 200 210 320 330 340 350 360 370 pF1KE1 KSERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPVPPNVAFKAEKEPEGTSHEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KSERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPVPPNVAFKAEKEPEGTSHEF 220 230 240 250 260 270 380 390 400 410 420 430 pF1KE1 KIKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEPLLDKESISENPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KIKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEPLLDKESISENPT 280 290 300 310 320 330 440 450 460 470 480 490 pF1KE1 LDLPCSIGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGLSDSRKRTRTGRSWPAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 LDLPCSIGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGLSDSRKRTRTGRSWPAA 340 350 360 370 380 390 500 510 520 530 540 550 pF1KE1 IPHLRRRRGRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLADQELQLNHLKNSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 IPHLRRRRGRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLADQELQLNHLKNSI 400 410 420 430 440 450 560 570 580 590 pF1KE1 TSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS ::::::::::::::::::::::::::::::::::::::::: CCDS53 TSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS 460 470 480 490 >>CCDS53340.1 MTF2 gene_id:22823|Hs108|chr1 (536 aa) initn: 2364 init1: 2364 opt: 2379 Z-score: 2117.6 bits: 401.7 E(32554): 1.2e-111 Smith-Waterman score: 3573; 90.4% identity (90.4% similar) in 593 aa overlap (1-593:1-536) 10 20 30 40 50 60 pF1KE1 MRDSTGAGNSLVHKRSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 MRDSTGAGNSLVHKRSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 FYLGTIKKINILKQSCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 FYLGTIKKINILKQSCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 ICDKCGQGYHQLCHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 ICDKCGQGYHQLCHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 TLPYSVADLEWDAGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 TLPYSVADLEWDAGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLF 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 GDRFYTFICSVCSSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GDRFYTFICSVCSSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENW 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 DRLHPGELADTPKSERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPVPPNVAFK :::::::::::::::::::::::::::::: CCDS53 DRLHPGELADTPKSERYEHVLEALNDYKTM------------------------------ 310 320 330 370 380 390 400 410 420 pF1KE1 AEKEPEGTSHEFKIKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEP ::::::::::::::::::::::::::::::::: CCDS53 ---------------------------EVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEP 340 350 360 430 440 450 460 470 480 pF1KE1 LLDKESISENPTLDLPCSIGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGLSDSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 LLDKESISENPTLDLPCSIGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGLSDSR 370 380 390 400 410 420 490 500 510 520 530 540 pF1KE1 KRTRTGRSWPAAIPHLRRRRGRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KRTRTGRSWPAAIPHLRRRRGRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLAD 430 440 450 460 470 480 550 560 570 580 590 pF1KE1 QELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 QELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS 490 500 510 520 530 >>CCDS35116.1 PHF19 gene_id:26147|Hs108|chr9 (580 aa) initn: 1651 init1: 1138 opt: 1673 Z-score: 1491.5 bits: 285.9 E(32554): 9.3e-77 Smith-Waterman score: 1686; 47.7% identity (70.8% similar) in 562 aa overlap (45-591:39-578) 20 30 40 50 60 70 pF1KE1 RSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGLFYLGTIKKINILKQ :. ::: :: ::.:::.::: ::... :: CCDS35 GTRDSYGATSHLPNKGALAKVKNNFKDLMSKLTEGQYVLCRWTDGLYYLGKIKRVSSSKQ 10 20 30 40 50 60 80 90 100 110 120 130 pF1KE1 SCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMVICDKCGQGYHQLCH ::.. :::.:: :::::::: ... . : :.:: . : ::..:: ::: :::: :: CCDS35 SCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNICLGKTSGPLNEILICGKCGLGYHQQCH 70 80 90 100 110 120 140 150 160 170 180 190 pF1KE1 TPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEWDAG : :. :.::.:.:: ....::::::: :..::..:..: :. .::::. CCDS35 IPIAGSADQPLLTPWFCRRCIFALAVRKGGALKKGAIARTLQAVKMVLSYQPEELEWDSP 130 140 150 160 170 180 200 210 220 230 240 250 pF1KE1 HKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFYTFICSVCSS :.:: :::::::::::.:::.:::: .:.:::::::.:::..::.:::::: :.::::.. CCDS35 HRTNQQQCYCYCGGPGEWYLRMLQCYRCRQWFHEACTQCLNEPMMFGDRFYLFFCSVCNQ 190 200 210 220 230 240 260 270 280 290 300 310 pF1KE1 GPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHPGELADTPKS ::::..::::.:::..:: ::::.: :::::: : :.....:..:. :. :.:..:: . CCDS35 GPEYIERLPLRWVDVVHLALYNLGVQSKKKYFDFE-EILAFVNHHWELLQLGKLTSTPVT 250 260 270 280 290 300 320 330 340 350 360 370 pF1KE1 ERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPVPPNVAFKAEKE-PEGTSHEFK .: :.:.:::.::. :. :::::::: .: ::::::: ::. . . :. .: . CCDS35 DRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRIRVPPNPPGKLLPDKGLLPNENSASSE 310 320 330 340 350 360 380 390 400 410 420 430 pF1KE1 IKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEPLLDKESI-SENPT .. : ::: .: .. .:. : : :.. . : : : : : : CCDS35 LRKRGKSKPGLLPHEFQQ------QKRRVYRRK---RSKFLLEDAIPSSDFTSAWSTNHH 370 380 390 400 410 440 450 460 470 480 pF1KE1 L----DLPCSIGRTEGTAHSSNT--SDVDFTGASSAKETTSSSISRHYGLS-DSRKRTRT : :. . .. .: :..: :::: : :.:.. ..:.:.: . :::: . CCDS35 LASIFDFTLDEIQSLKSASSGQTFFSDVDSTDAASTSGSASTSLSYDSRWTVGSRKRKLA 420 430 440 450 460 470 490 500 510 520 530 pF1KE1 GRSWPAAIPHLRRRR------GRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLA .... .: :: .: :: : . : . ::: ... :. ... CCDS35 AKAY---MP-LRAKRWAAELDGRCPSDSSAEGASVPERPDEGIDSHTFE--------SIS 480 490 500 510 520 540 550 560 570 580 590 pF1KE1 DQELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS ... .:.:::.:::.:::::::.::::::.::::::: .:::::::::::.: CCDS35 EDDSSLSHLKSSITNYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGTTPY 530 540 550 560 570 580 >>CCDS75889.1 PHF19 gene_id:26147|Hs108|chr9 (599 aa) initn: 1651 init1: 1138 opt: 1673 Z-score: 1491.3 bits: 286.0 E(32554): 9.6e-77 Smith-Waterman score: 1686; 47.7% identity (70.8% similar) in 562 aa overlap (45-591:58-597) 20 30 40 50 60 70 pF1KE1 RSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGLFYLGTIKKINILKQ :. ::: :: ::.:::.::: ::... :: CCDS75 GTRDSYGATSHLPNKGALAKVKNNFKDLMSKLTEGQYVLCRWTDGLYYLGKIKRVSSSKQ 30 40 50 60 70 80 80 90 100 110 120 130 pF1KE1 SCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMVICDKCGQGYHQLCH ::.. :::.:: :::::::: ... . : :.:: . : ::..:: ::: :::: :: CCDS75 SCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNICLGKTSGPLNEILICGKCGLGYHQQCH 90 100 110 120 130 140 140 150 160 170 180 190 pF1KE1 TPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEWDAG : :. :.::.:.:: ....::::::: :..::..:..: :. .::::. CCDS75 IPIAGSADQPLLTPWFCRRCIFALAVRKGGALKKGAIARTLQAVKMVLSYQPEELEWDSP 150 160 170 180 190 200 200 210 220 230 240 250 pF1KE1 HKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFYTFICSVCSS :.:: :::::::::::.:::.:::: .:.:::::::.:::..::.:::::: :.::::.. CCDS75 HRTNQQQCYCYCGGPGEWYLRMLQCYRCRQWFHEACTQCLNEPMMFGDRFYLFFCSVCNQ 210 220 230 240 250 260 260 270 280 290 300 310 pF1KE1 GPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHPGELADTPKS ::::..::::.:::..:: ::::.: :::::: : :.....:..:. :. :.:..:: . CCDS75 GPEYIERLPLRWVDVVHLALYNLGVQSKKKYFDFE-EILAFVNHHWELLQLGKLTSTPVT 270 280 290 300 310 320 320 330 340 350 360 370 pF1KE1 ERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPVPPNVAFKAEKE-PEGTSHEFK .: :.:.:::.::. :. :::::::: .: ::::::: ::. . . :. .: . CCDS75 DRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRIRVPPNPPGKLLPDKGLLPNENSASSE 330 340 350 360 370 380 380 390 400 410 420 430 pF1KE1 IKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEPLLDKESI-SENPT .. : ::: .: .. .:. : : :.. . : : : : : : CCDS75 LRKRGKSKPGLLPHEFQQ------QKRRVYRRK---RSKFLLEDAIPSSDFTSAWSTNHH 390 400 410 420 430 440 450 460 470 480 pF1KE1 L----DLPCSIGRTEGTAHSSNT--SDVDFTGASSAKETTSSSISRHYGLS-DSRKRTRT : :. . .. .: :..: :::: : :.:.. ..:.:.: . :::: . CCDS75 LASIFDFTLDEIQSLKSASSGQTFFSDVDSTDAASTSGSASTSLSYDSRWTVGSRKRKLA 440 450 460 470 480 490 490 500 510 520 530 pF1KE1 GRSWPAAIPHLRRRR------GRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLA .... .: :: .: :: : . : . ::: ... :. ... CCDS75 AKAY---MP-LRAKRWAAELDGRCPSDSSAEGASVPERPDEGIDSHTFE--------SIS 500 510 520 530 540 540 550 560 570 580 590 pF1KE1 DQELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS ... .:.:::.:::.:::::::.::::::.::::::: .:::::::::::.: CCDS75 EDDSSLSHLKSSITNYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGTTPY 550 560 570 580 590 >>CCDS4777.1 PHF1 gene_id:5252|Hs108|chr6 (567 aa) initn: 1416 init1: 1322 opt: 1355 Z-score: 1209.8 bits: 233.8 E(32554): 4.6e-61 Smith-Waterman score: 1426; 41.5% identity (64.9% similar) in 559 aa overlap (42-589:27-563) 20 30 40 50 60 70 pF1KE1 VHKRSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGLFYLGTIKKINI : .. :::::::::.:::.:::::::.. CCDS47 MAQPPRLSRSGASSLWDPASPAPTSGPRPRLWEGQDVLARWTDGLLYLGTIKKVDS 10 20 30 40 50 80 90 100 110 120 130 pF1KE1 LKQSCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMVICDKCGQGYHQ .. :.. :::.:. ::::::. .: . :..: .:. : :..: :.:: ..::: CCDS47 AREVCLVQFEDDSQFLVLWKDISPAALPGEELLCCVCRSETVVPGNRLVSCEKCRHAYHQ 60 70 80 90 100 110 140 150 160 170 180 190 pF1KE1 LCHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEW ::.:. . .:.::::::: .::::::::::: :.:. :: .:::.. :.: CCDS47 DCHVPRAPAPGEGEGTSWVCRQCVFAIATKRGGALKKGPYARAMLGMKLSLPYGLKGLDW 120 130 140 150 160 170 200 210 220 230 240 250 pF1KE1 DAGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFYTFICSV :::: .: :: ::::::::.: :::::: .: :::::::.:::.::.:.::::: : : : CCDS47 DAGHLSNRQQSYCYCGGPGEWNLKMLQCRSCLQWFHEACTQCLSKPLLYGDRFYEFECCV 180 190 200 210 220 230 260 270 280 290 300 310 pF1KE1 CSSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHPGELADT : .::: ..:: :.:::.::: ::.::: :::::: . :.. . .:::: : :::.:: CCDS47 CRGGPEKVRRLQLRWVDVAHLVLYHLSVCCKKKYFDFDREILPFTSENWDSLLLGELSDT 240 250 260 270 280 290 320 330 340 350 360 pF1KE1 PKSERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPV--PPN-----VAFKAEKE ::.:: ..: :::..: :.::.::::.: ::::. :.:: ::. ..: . . CCDS47 PKGERSSRLLSALNSHKDRFISGREIKKRKCLFGLHARMPPPVEPPTGDGALTSFPSGQG 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE1 PEG-TSHEFKIKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYT---RKMIQKTAEP : : .:. . . : .:. :. .. .:. : ..: : : : .:.. . CCDS47 PGGGVSRPLGKRRRPEPEPL--RRRQKGKVEELGPPSAVRNQPEPQEQRERAHLQRALQA 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE1 LLDKESISENPTLDLPCSIGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGLSDSR .. : : : . . . . :. .: . . :: ..... : : : : CCDS47 SVSPPSPSPNQSYQGSSGYNFRPTDARCLPSSPIRMF-ASFHPSASTAGTSGDSGPPD-R 420 430 440 450 460 470 490 500 510 520 530 540 pF1KE1 KRTRTGRSWPAAIPHLRRRRGRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLAD . . ..:. ::. :. .. ...: . . . : . . . .:. CCDS47 SPLELHIGFPTDIPK------SAPH-SMTASSSSVSSPSPGLPRRSAPP--SPLCRSLSP 480 490 500 510 520 550 560 570 580 590 pF1KE1 QELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS .. . :..: .. :. ::::::: ::.::::::: : CCDS47 ---------GTGGGVRGGVGYLSRGDPVRVLARRVRPDGSVQYLVEWGGGGIF 530 540 550 560 >>CCDS4778.1 PHF1 gene_id:5252|Hs108|chr6 (457 aa) initn: 1322 init1: 1322 opt: 1336 Z-score: 1194.3 bits: 230.6 E(32554): 3.3e-60 Smith-Waterman score: 1336; 47.4% identity (68.2% similar) in 424 aa overlap (42-460:27-446) 20 30 40 50 60 70 pF1KE1 VHKRSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGLFYLGTIKKINI : .. :::::::::.:::.:::::::.. CCDS47 MAQPPRLSRSGASSLWDPASPAPTSGPRPRLWEGQDVLARWTDGLLYLGTIKKVDS 10 20 30 40 50 80 90 100 110 120 130 pF1KE1 LKQSCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMVICDKCGQGYHQ .. :.. :::.:. ::::::. .: . :..: .:. : :..: :.:: ..::: CCDS47 AREVCLVQFEDDSQFLVLWKDISPAALPGEELLCCVCRSETVVPGNRLVSCEKCRHAYHQ 60 70 80 90 100 110 140 150 160 170 180 190 pF1KE1 LCHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEW ::.:. . .:.::::::: .::::::::::: :.:. :: .:::.. :.: CCDS47 DCHVPRAPAPGEGEGTSWVCRQCVFAIATKRGGALKKGPYARAMLGMKLSLPYGLKGLDW 120 130 140 150 160 170 200 210 220 230 240 250 pF1KE1 DAGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFYTFICSV :::: .: :: ::::::::.: :::::: .: :::::::.:::.::.:.::::: : : : CCDS47 DAGHLSNRQQSYCYCGGPGEWNLKMLQCRSCLQWFHEACTQCLSKPLLYGDRFYEFECCV 180 190 200 210 220 230 260 270 280 290 300 310 pF1KE1 CSSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHPGELADT : .::: ..:: :.:::.::: ::.::: :::::: . :.. . .:::: : :::.:: CCDS47 CRGGPEKVRRLQLRWVDVAHLVLYHLSVCCKKKYFDFDREILPFTSENWDSLLLGELSDT 240 250 260 270 280 290 320 330 340 350 360 pF1KE1 PKSERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPV--PPN---VAFKAEKEPE ::.:: ..: :::..: :.::.::::.: ::::. :.:: ::. . .: . CCDS47 PKGERSSRLLSALNSHKDRFISGREIKKRKCLFGLHARMPPPVEPPTGDGALTRAGPWGR 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE1 GTSHEFKIKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEPLLDKES : . . : : ... :.: .. . .: :: . ..:: : CCDS47 GLTSPGEAPEAGARAPEEEAEGESGGAGATLSSAQSARAPGA---EGAGSSAEGTAAAPS 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE1 ISENPTLDLPCSIGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGLSDSRKRTRTG :. :: : ::. .. .:: .: CCDS47 GCLLPSTLLPAPQGPL-GTVDPQTGHPWNFTLVSPQTSLKVPPTR 420 430 440 450 490 500 510 520 530 540 pF1KE1 RSWPAAIPHLRRRRGRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLADQELQLN >>CCDS69648.1 PHF19 gene_id:26147|Hs108|chr9 (371 aa) initn: 942 init1: 429 opt: 964 Z-score: 865.9 bits: 169.5 E(32554): 6.6e-42 Smith-Waterman score: 977; 45.0% identity (68.3% similar) in 391 aa overlap (216-591:1-369) 190 200 210 220 230 240 pF1KE1 VADLEWDAGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFY :::: .:.:::::::.:::..::.:::::: CCDS69 MLQCYRCRQWFHEACTQCLNEPMMFGDRFY 10 20 30 250 260 270 280 290 300 pF1KE1 TFICSVCSSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHP :.::::..::::..::::.:::..:: ::::.: :::::: : :.....:..:. :. CCDS69 LFFCSVCNQGPEYIERLPLRWVDVVHLALYNLGVQSKKKYFDFE-EILAFVNHHWELLQL 40 50 60 70 80 310 320 330 340 350 360 pF1KE1 GELADTPKSERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPVPPNVAFKAEKE- :.:..:: ..: :.:.:::.::. :. :::::::: .: ::::::: ::. . . CCDS69 GKLTSTPVTDRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRIRVPPNPPGKLLPDKGLL 90 100 110 120 130 140 370 380 390 400 410 420 pF1KE1 PEGTSHEFKIKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEPLLDK :. .: ... : ::: .: .. .:. : : :.. . : : : CCDS69 PNENSASSELRKRGKSKPGLLPHEFQQ------QKRRVYRRK---RSKFLLEDAIPSSDF 150 160 170 180 190 200 430 440 450 460 470 pF1KE1 ESI-SENPTL----DLPCSIGRTEGTAHSSNT--SDVDFTGASSAKETTSSSISRHYGLS : : : : :. . .. .: :..: :::: : :.:.. ..:.:.: . CCDS69 TSAWSTNHHLASIFDFTLDEIQSLKSASSGQTFFSDVDSTDAASTSGSASTSLSYDSRWT 210 220 230 240 250 260 480 490 500 510 520 530 pF1KE1 -DSRKRTRTGRSWPAAIPHLRRRR------GRLPRRALQTQNSEIVKDDEGKEDYQFDEL :::: ... : .: :: .: :: : . : . ::: ... :. CCDS69 VGSRKRKLAAK---AYMP-LRAKRWAAELDGRCPSDSSAEGASVPERPDEGIDSHTFE-- 270 280 290 300 310 540 550 560 570 580 590 pF1KE1 NTEILNNLADQELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGA ...... .:.:::.:::.:::::::.::::::.::::::: .:::::::::::. CCDS69 ------SISEDDSSLSHLKSSITNYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGT 320 330 340 350 360 pF1KE1 TAS : CCDS69 TPY 370 >>CCDS35117.1 PHF19 gene_id:26147|Hs108|chr9 (207 aa) initn: 436 init1: 436 opt: 436 Z-score: 401.5 bits: 82.8 E(32554): 4.8e-16 Smith-Waterman score: 436; 50.4% identity (70.9% similar) in 117 aa overlap (45-161:39-155) 20 30 40 50 60 70 pF1KE1 RSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGLFYLGTIKKINILKQ :. ::: :: ::.:::.::: ::... :: CCDS35 GTRDSYGATSHLPNKGALAKVKNNFKDLMSKLTEGQYVLCRWTDGLYYLGKIKRVSSSKQ 10 20 30 40 50 60 80 90 100 110 120 130 pF1KE1 SCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMVICDKCGQGYHQLCH ::.. :::.:: :::::::: ... . : :.:: . : ::..:: ::: :::: :: CCDS35 SCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNICLGKTSGPLNEILICGKCGLGYHQQCH 70 80 90 100 110 120 140 150 160 170 180 190 pF1KE1 TPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEWDAG : :. :.::.:.:: ... CCDS35 IPIAGSADQPLLTPWFCRRCIFALAVRVSLPSSPVPASPASSSGADQRLPSQSLSSKQKG 130 140 150 160 170 180 593 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 19:12:56 2016 done: Sun Nov 6 19:12:57 2016 Total Scan time: 3.610 Total Display time: 0.100 Function used was FASTA [36.3.4 Apr, 2011]