FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6448, 541 aa 1>>>pF1KE6448 541 - 541 aa - 541 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.4625+/-0.000787; mu= 12.7538+/- 0.048 mean_var=233.8446+/-46.540, 0's: 0 Z-trim(117.6): 892 B-trim: 14 in 1/52 Lambda= 0.083871 statistics sampled from 17370 (18341) to 17370 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.827), E-opt: 0.2 (0.563), width: 16 Scan time: 3.360 The best scores are: opt bits E(32554) CCDS1751.1 ZNF513 gene_id:130557|Hs108|chr2 ( 541) 4004 497.1 2.2e-140 CCDS56114.1 ZNF513 gene_id:130557|Hs108|chr2 ( 479) 3587 446.6 3.2e-125 CCDS32915.1 ZNF700 gene_id:90592|Hs108|chr19 ( 742) 574 82.2 2.3e-15 CCDS74289.1 ZNF700 gene_id:90592|Hs108|chr19 ( 745) 574 82.2 2.3e-15 CCDS55406.1 ZNF674 gene_id:641339|Hs108|chrX ( 575) 571 81.7 2.5e-15 CCDS48099.1 ZNF674 gene_id:641339|Hs108|chrX ( 581) 571 81.7 2.6e-15 CCDS13439.1 ZFP64 gene_id:55734|Hs108|chr20 ( 645) 546 78.8 2.2e-14 CCDS5667.1 ZKSCAN5 gene_id:23660|Hs108|chr7 ( 839) 547 79.0 2.4e-14 CCDS77335.1 ZNF473 gene_id:25888|Hs108|chr19 ( 859) 540 78.2 4.4e-14 CCDS33077.1 ZNF473 gene_id:25888|Hs108|chr19 ( 871) 540 78.2 4.4e-14 CCDS46030.1 ZNF257 gene_id:113835|Hs108|chr19 ( 563) 522 75.8 1.5e-13 CCDS61814.1 ZSCAN10 gene_id:84891|Hs108|chr16 ( 643) 519 75.5 2.1e-13 CCDS10493.2 ZSCAN10 gene_id:84891|Hs108|chr16 ( 780) 519 75.6 2.4e-13 CCDS33132.2 ZNF749 gene_id:388567|Hs108|chr19 ( 778) 508 74.3 6.1e-13 CCDS43678.1 ZNF775 gene_id:285971|Hs108|chr7 ( 537) 483 71.0 3.9e-12 CCDS1638.1 ZNF672 gene_id:79894|Hs108|chr1 ( 452) 478 70.3 5.3e-12 CCDS6398.1 GLI4 gene_id:2738|Hs108|chr8 ( 376) 474 69.8 6.7e-12 CCDS5895.1 ZNF282 gene_id:8427|Hs108|chr7 ( 671) 477 70.4 7.4e-12 CCDS32890.2 ZNF358 gene_id:140467|Hs108|chr19 ( 568) 473 69.9 9.4e-12 CCDS54240.1 ZNF208 gene_id:7757|Hs108|chr19 (1280) 476 70.7 1.2e-11 CCDS33116.3 ZNF628 gene_id:89887|Hs108|chr19 (1059) 468 69.6 2.1e-11 CCDS32462.1 ZNF319 gene_id:57567|Hs108|chr16 ( 582) 463 68.7 2.2e-11 CCDS5951.2 ZNF596 gene_id:169270|Hs108|chr8 ( 504) 459 68.1 2.8e-11 CCDS69664.1 ZNF79 gene_id:7633|Hs108|chr9 ( 474) 457 67.8 3.2e-11 CCDS75904.1 ZNF79 gene_id:7633|Hs108|chr9 ( 364) 455 67.4 3.2e-11 CCDS6871.1 ZNF79 gene_id:7633|Hs108|chr9 ( 498) 457 67.8 3.3e-11 CCDS73997.1 ZNF286A gene_id:57335|Hs108|chr17 ( 511) 457 67.9 3.4e-11 CCDS11172.1 ZNF286A gene_id:57335|Hs108|chr17 ( 521) 457 67.9 3.4e-11 CCDS61813.1 ZSCAN10 gene_id:84891|Hs108|chr16 ( 386) 453 67.2 3.9e-11 CCDS58523.1 ZNF286B gene_id:729288|Hs108|chr17 ( 522) 454 67.5 4.4e-11 CCDS12854.1 ZNF83 gene_id:55769|Hs108|chr19 ( 516) 452 67.3 5.1e-11 CCDS12963.1 ZNF552 gene_id:79818|Hs108|chr19 ( 407) 450 66.9 5.2e-11 CCDS13441.1 ZFP64 gene_id:55734|Hs108|chr20 ( 627) 453 67.5 5.3e-11 CCDS13442.1 ZFP64 gene_id:55734|Hs108|chr20 ( 679) 453 67.5 5.6e-11 CCDS13440.1 ZFP64 gene_id:55734|Hs108|chr20 ( 681) 453 67.5 5.6e-11 CCDS2011.1 ZNF514 gene_id:84874|Hs108|chr2 ( 400) 449 66.8 5.6e-11 CCDS45460.1 ZNF771 gene_id:51333|Hs108|chr16 ( 317) 447 66.4 5.8e-11 CCDS32383.1 ZNF500 gene_id:26048|Hs108|chr16 ( 480) 450 67.0 5.8e-11 CCDS10901.1 ZNF19 gene_id:7567|Hs108|chr16 ( 458) 448 66.7 6.7e-11 CCDS34644.1 ZNF680 gene_id:340252|Hs108|chr7 ( 530) 449 66.9 6.7e-11 CCDS42559.1 ZNF527 gene_id:84503|Hs108|chr19 ( 609) 450 67.1 6.7e-11 CCDS5666.1 ZNF394 gene_id:84124|Hs108|chr7 ( 561) 448 66.8 7.6e-11 CCDS12988.1 MZF1 gene_id:7593|Hs108|chr19 ( 734) 450 67.2 7.6e-11 CCDS32991.1 ZNF599 gene_id:148103|Hs108|chr19 ( 588) 448 66.8 7.8e-11 CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 448 66.9 8e-11 CCDS35106.1 ZNF483 gene_id:158399|Hs108|chr9 ( 744) 449 67.1 8.3e-11 CCDS42532.1 ZNF253 gene_id:56242|Hs108|chr19 ( 499) 446 66.5 8.3e-11 CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 448 66.9 8.4e-11 CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 448 66.9 8.5e-11 CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 448 66.9 8.6e-11 >>CCDS1751.1 ZNF513 gene_id:130557|Hs108|chr2 (541 aa) initn: 4004 init1: 4004 opt: 4004 Z-score: 2633.8 bits: 497.1 E(32554): 2.2e-140 Smith-Waterman score: 4004; 100.0% identity (100.0% similar) in 541 aa overlap (1-541:1-541) 10 20 30 40 50 60 pF1KE6 MPRRKQSHPQPVKCEGVKVDTEDSLDEGPGALVLESDLLLGQDLEFEEEEEEEEGDGNSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 MPRRKQSHPQPVKCEGVKVDTEDSLDEGPGALVLESDLLLGQDLEFEEEEEEEEGDGNSD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 QLMGFERDSEGDSLGARPGLPYGLSDDESGGGRALSAESEVEEPARGPGEARGERPGPAC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 QLMGFERDSEGDSLGARPGLPYGLSDDESGGGRALSAESEVEEPARGPGEARGERPGPAC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 QLCGGPTGEGPCCGAGGPGGGPLLPPRLLYSCRLCTFVSHYSSHLKRHMQTHSGEKPFRC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 QLCGGPTGEGPCCGAGGPGGGPLLPPRLLYSCRLCTFVSHYSSHLKRHMQTHSGEKPFRC 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 GRCPYASAQLVNLTRHTRTHTGEKPYRCPHCPFACSSLGNLRRHQRTHAGPPTPPCPTCG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 GRCPYASAQLVNLTRHTRTHTGEKPYRCPHCPFACSSLGNLRRHQRTHAGPPTPPCPTCG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 FRCCTPRPARPPSPTEQEGAVPRRPEDALLLPDLSLHVPPGGASFLPDCGQLRGEGEGLC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 FRCCTPRPARPPSPTEQEGAVPRRPEDALLLPDLSLHVPPGGASFLPDCGQLRGEGEGLC 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 GTGSEPLPELLFPWTCRGCGQELEEGEGSRLGAAMCGRCMRGEAGGGASGGPQGPSDKGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 GTGSEPLPELLFPWTCRGCGQELEEGEGSRLGAAMCGRCMRGEAGGGASGGPQGPSDKGF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 ACSLCPFATHYPNHLARHMKTHSGEKPFRCARCPYASAHLDNLKRHQRVHTGEKPYKCPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 ACSLCPFATHYPNHLARHMKTHSGEKPFRCARCPYASAHLDNLKRHQRVHTGEKPYKCPL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE6 CPYACGNLANLKRHGRIHSGDKPFRCSLCNYSCNQSMNLKRHMLRHTGEKPFRCATCAYT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 CPYACGNLANLKRHGRIHSGDKPFRCSLCNYSCNQSMNLKRHMLRHTGEKPFRCATCAYT 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE6 TGHWDNYKRHQKVHGHGGAGGPGLSASEGWAPPHSPPSVLSSRGPPALGTAGSRAVHTDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 TGHWDNYKRHQKVHGHGGAGGPGLSASEGWAPPHSPPSVLSSRGPPALGTAGSRAVHTDS 490 500 510 520 530 540 pF1KE6 S : CCDS17 S >>CCDS56114.1 ZNF513 gene_id:130557|Hs108|chr2 (479 aa) initn: 3587 init1: 3587 opt: 3587 Z-score: 2361.7 bits: 446.6 E(32554): 3.2e-125 Smith-Waterman score: 3587; 100.0% identity (100.0% similar) in 479 aa overlap (63-541:1-479) 40 50 60 70 80 90 pF1KE6 VLESDLLLGQDLEFEEEEEEEEGDGNSDQLMGFERDSEGDSLGARPGLPYGLSDDESGGG :::::::::::::::::::::::::::::: CCDS56 MGFERDSEGDSLGARPGLPYGLSDDESGGG 10 20 30 100 110 120 130 140 150 pF1KE6 RALSAESEVEEPARGPGEARGERPGPACQLCGGPTGEGPCCGAGGPGGGPLLPPRLLYSC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 RALSAESEVEEPARGPGEARGERPGPACQLCGGPTGEGPCCGAGGPGGGPLLPPRLLYSC 40 50 60 70 80 90 160 170 180 190 200 210 pF1KE6 RLCTFVSHYSSHLKRHMQTHSGEKPFRCGRCPYASAQLVNLTRHTRTHTGEKPYRCPHCP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 RLCTFVSHYSSHLKRHMQTHSGEKPFRCGRCPYASAQLVNLTRHTRTHTGEKPYRCPHCP 100 110 120 130 140 150 220 230 240 250 260 270 pF1KE6 FACSSLGNLRRHQRTHAGPPTPPCPTCGFRCCTPRPARPPSPTEQEGAVPRRPEDALLLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 FACSSLGNLRRHQRTHAGPPTPPCPTCGFRCCTPRPARPPSPTEQEGAVPRRPEDALLLP 160 170 180 190 200 210 280 290 300 310 320 330 pF1KE6 DLSLHVPPGGASFLPDCGQLRGEGEGLCGTGSEPLPELLFPWTCRGCGQELEEGEGSRLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 DLSLHVPPGGASFLPDCGQLRGEGEGLCGTGSEPLPELLFPWTCRGCGQELEEGEGSRLG 220 230 240 250 260 270 340 350 360 370 380 390 pF1KE6 AAMCGRCMRGEAGGGASGGPQGPSDKGFACSLCPFATHYPNHLARHMKTHSGEKPFRCAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 AAMCGRCMRGEAGGGASGGPQGPSDKGFACSLCPFATHYPNHLARHMKTHSGEKPFRCAR 280 290 300 310 320 330 400 410 420 430 440 450 pF1KE6 CPYASAHLDNLKRHQRVHTGEKPYKCPLCPYACGNLANLKRHGRIHSGDKPFRCSLCNYS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 CPYASAHLDNLKRHQRVHTGEKPYKCPLCPYACGNLANLKRHGRIHSGDKPFRCSLCNYS 340 350 360 370 380 390 460 470 480 490 500 510 pF1KE6 CNQSMNLKRHMLRHTGEKPFRCATCAYTTGHWDNYKRHQKVHGHGGAGGPGLSASEGWAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 CNQSMNLKRHMLRHTGEKPFRCATCAYTTGHWDNYKRHQKVHGHGGAGGPGLSASEGWAP 400 410 420 430 440 450 520 530 540 pF1KE6 PHSPPSVLSSRGPPALGTAGSRAVHTDSS ::::::::::::::::::::::::::::: CCDS56 PHSPPSVLSSRGPPALGTAGSRAVHTDSS 460 470 >>CCDS32915.1 ZNF700 gene_id:90592|Hs108|chr19 (742 aa) initn: 407 init1: 407 opt: 574 Z-score: 389.2 bits: 82.2 E(32554): 2.3e-15 Smith-Waterman score: 633; 29.2% identity (53.4% similar) in 373 aa overlap (150-494:306-670) 120 130 140 150 160 170 pF1KE6 CQLCGGPTGEGPCCGAGGPGGGPLLPPRLLYSCRLCTFVSHYSSHLKRHMQTHSGEKPFR :.:. : . :.: :.:: .::::.::.. CCDS32 KPYECSKCDKAFHSSSSYHRHERSHMGEKPYQCKECGKAFAYTSSLRRHERTHSGKKPYE 280 290 300 310 320 330 180 190 200 210 220 230 pF1KE6 CGRCPYASAQLVNLTRHTRTHTGEKPYRCPHCPFACSSLGNLRRHQRTHAGPPTPPCPTC : . . . :... : : ..::.::.: : . : ... :..::.: : : CCDS32 CKQYGEGLSYLISFQTHIRMNSGERPYKCKICGKGFYSAKSFQTHEKTHTGEKRYKCKQC 340 350 360 370 380 390 240 250 260 270 280 pF1KE6 G--FRCCTP-------RPARPPSPTEQEGAVPRRPEDALLLPDLSLH--VPPGGASF-LP : : . . .. : .: : . : . : .: . : . CCDS32 GKAFNLSSSFRYHERIHTGEKPYECKQCGKAFRSASQ------LRVHGGTHTGEKPYECK 400 410 420 430 440 290 300 310 320 330 pF1KE6 DCGQLRGEGEGLCGTGSEPLPELLFPWTCRGCGQ------ELEEGEGSRLGAAM------ .::. : : : :. :. ::. .:. : .. : CCDS32 ECGKAFRSTSHLRVHGRTHTGEK--PYECKECGKAFRYVKHLQIHERTEKHIRMPSGERP 450 460 470 480 490 500 340 350 360 370 380 390 pF1KE6 --CGRCMRG--EAGGGASGGPQGPSDKGFACSLCPFATHYPNHLARHMKTHSGEKPFRCA :. : .: : . . ..: . :. : : . : : : .::.::::..: CCDS32 YKCSICEKGFYSAKSFQTHEKTHTGEKPYECNQCGKAFRCCNSLRYHERTHTGEKPYECK 510 520 530 540 550 560 400 410 420 430 440 450 pF1KE6 RCPYASAHLDNLKRHQRVHTGEKPYKCPLCPYACGNLANLKRHGRIHSGDKPFRCSLCNY .: : ..:. :.:.:::::::.: : : . .::..::: :.:.::..:. :. CCDS32 QCGKAFRSASHLRMHERTHTGEKPYECKQCGKAFSCASNLRKHGRTHTGEKPYECKQCGK 570 580 590 600 610 620 460 470 480 490 500 510 pF1KE6 SCNQSMNLKRHMLRHTGEKPFRCATCAYTTGHWDNYKRHQKVHGHGGAGGPGLSASEGWA . .. ::. : ::::::..: : . ...... :.. : CCDS32 AFRSASNLQMHERTHTGEKPYECKECEKAFCKFSSFQIHERKHRGEKPYECKHCGNGFTS 630 640 650 660 670 680 520 530 540 pF1KE6 PPHSPPSVLSSRGPPALGTAGSRAVHTDSS CCDS32 AKILQIHARTHIGEKHYECKECGKAFNYFSSLHIHARTHMGEKPYECKDCGKAFS 690 700 710 720 730 740 >>CCDS74289.1 ZNF700 gene_id:90592|Hs108|chr19 (745 aa) initn: 407 init1: 407 opt: 574 Z-score: 389.2 bits: 82.2 E(32554): 2.3e-15 Smith-Waterman score: 633; 29.2% identity (53.4% similar) in 373 aa overlap (150-494:309-673) 120 130 140 150 160 170 pF1KE6 CQLCGGPTGEGPCCGAGGPGGGPLLPPRLLYSCRLCTFVSHYSSHLKRHMQTHSGEKPFR :.:. : . :.: :.:: .::::.::.. CCDS74 KPYECSKCDKAFHSSSSYHRHERSHMGEKPYQCKECGKAFAYTSSLRRHERTHSGKKPYE 280 290 300 310 320 330 180 190 200 210 220 230 pF1KE6 CGRCPYASAQLVNLTRHTRTHTGEKPYRCPHCPFACSSLGNLRRHQRTHAGPPTPPCPTC : . . . :... : : ..::.::.: : . : ... :..::.: : : CCDS74 CKQYGEGLSYLISFQTHIRMNSGERPYKCKICGKGFYSAKSFQTHEKTHTGEKRYKCKQC 340 350 360 370 380 390 240 250 260 270 280 pF1KE6 G--FRCCTP-------RPARPPSPTEQEGAVPRRPEDALLLPDLSLH--VPPGGASF-LP : : . . .. : .: : . : . : .: . : . CCDS74 GKAFNLSSSFRYHERIHTGEKPYECKQCGKAFRSASQ------LRVHGGTHTGEKPYECK 400 410 420 430 440 450 290 300 310 320 330 pF1KE6 DCGQLRGEGEGLCGTGSEPLPELLFPWTCRGCGQ------ELEEGEGSRLGAAM------ .::. : : : :. :. ::. .:. : .. : CCDS74 ECGKAFRSTSHLRVHGRTHTGEK--PYECKECGKAFRYVKHLQIHERTEKHIRMPSGERP 460 470 480 490 500 510 340 350 360 370 380 390 pF1KE6 --CGRCMRG--EAGGGASGGPQGPSDKGFACSLCPFATHYPNHLARHMKTHSGEKPFRCA :. : .: : . . ..: . :. : : . : : : .::.::::..: CCDS74 YKCSICEKGFYSAKSFQTHEKTHTGEKPYECNQCGKAFRCCNSLRYHERTHTGEKPYECK 520 530 540 550 560 570 400 410 420 430 440 450 pF1KE6 RCPYASAHLDNLKRHQRVHTGEKPYKCPLCPYACGNLANLKRHGRIHSGDKPFRCSLCNY .: : ..:. :.:.:::::::.: : : . .::..::: :.:.::..:. :. CCDS74 QCGKAFRSASHLRMHERTHTGEKPYECKQCGKAFSCASNLRKHGRTHTGEKPYECKQCGK 580 590 600 610 620 630 460 470 480 490 500 510 pF1KE6 SCNQSMNLKRHMLRHTGEKPFRCATCAYTTGHWDNYKRHQKVHGHGGAGGPGLSASEGWA . .. ::. : ::::::..: : . ...... :.. : CCDS74 AFRSASNLQMHERTHTGEKPYECKECEKAFCKFSSFQIHERKHRGEKPYECKHCGNGFTS 640 650 660 670 680 690 520 530 540 pF1KE6 PPHSPPSVLSSRGPPALGTAGSRAVHTDSS CCDS74 AKILQIHARTHIGEKHYECKECGKAFNYFSSLHIHARTHMGEKPYECKDCGKAFS 700 710 720 730 740 >>CCDS55406.1 ZNF674 gene_id:641339|Hs108|chrX (575 aa) initn: 986 init1: 393 opt: 571 Z-score: 388.5 bits: 81.7 E(32554): 2.5e-15 Smith-Waterman score: 620; 31.9% identity (58.0% similar) in 348 aa overlap (149-494:217-541) 120 130 140 150 160 170 pF1KE6 ACQLCGGPTGEGPCCGAGGPGGGPLLPPRLLYSCRLCTFVSHYSSHLKRHMQTHSGEKPF ::.: : : ...: :..::.::::. CCDS55 ERFFDPNQRGKALHQKQALRKSQRSQTGEKLYKCTECGKVFIQKANLVVHQRTHTGEKPY 190 200 210 220 230 240 180 190 200 210 220 230 pF1KE6 RCGRCPYASAQLVNLTRHTRTHTGEKPYRCPHCPFACSSLGNLRRHQRTHAGPPTPPCPT .: .: : .: .: : :::::::::.: .: . . ..: .:::::.: : CCDS55 ECCECAKAFSQKSTLIAHQRTHTGEKPYECSECGKTFIQKSTLIKHQRTHTGEKPFVCDK 250 260 270 280 290 300 240 250 260 270 280 290 pF1KE6 C--GFRCCTPRPARPPSPTEQEGAVPRRPEDALLLPDLSLHVPPGGASFLPDCGQLRGEG : .:. . . .: . . :. . .: .: :.:.. CCDS55 CPKAFKSSYHLIRHEKTHIRQAFYKGIKCTTSSLIYQ-RIH-----TSEKPQCSE----- 310 320 330 340 350 300 310 320 330 340 350 pF1KE6 EGLCGTGSEPLPELLFPWTCRGCGQELEEGEGSRLGAAMCGRCMRGEAGGGASGGPQGPS : .:. : : : .: . : :. ::. .::.. .. . . CCDS55 ---HGKASDEKPSPTKHW--RTHTKE-NIYECSK-----CGKSFRGKSHLSVHQRIH-TG 360 370 380 390 400 360 370 380 390 400 410 pF1KE6 DKGFACSLCPFATHYPNHLARHMKTHSGEKPFRCARCPYASAHLDNLKRHQRVHTGEKPY .: . ::.: . .::. : .::.::::..: :: : .. ..: :::.::::::: CCDS55 EKPYECSICGKTFSGKSHLSVHHRTHTGEKPYECRRCGKAFGEKSTLIVHQRMHTGEKPY 410 420 430 440 450 460 420 430 440 450 460 470 pF1KE6 KCPLCPYACGNLANLKRHGRIHSGDKPFRCSLCNYSCNQSMNLKRHMLRHTGEKPFRCAT :: : : .. . : .: :::.:..:..:. :. . ... .: .:. ::::::..:. CCDS55 KCNECGKAFSEKSPLIKHQRIHTGERPYECTDCKKAFSRKSTLIKHQRIHTGEKPYKCSE 470 480 490 500 510 520 480 490 500 510 520 530 pF1KE6 CAYTTGHWDNYKRHQKVHGHGGAGGPGLSASEGWAPPHSPPSVLSSRGPPALGTAGSRAV :. . . .. :...: CCDS55 CGKAFSVKSTLIVHHRTHTGEKPYECRDCGKAFSGKSTLIKHQRSHTGDKNL 530 540 550 560 570 >>CCDS48099.1 ZNF674 gene_id:641339|Hs108|chrX (581 aa) initn: 986 init1: 393 opt: 571 Z-score: 388.5 bits: 81.7 E(32554): 2.6e-15 Smith-Waterman score: 620; 31.9% identity (58.0% similar) in 348 aa overlap (149-494:223-547) 120 130 140 150 160 170 pF1KE6 ACQLCGGPTGEGPCCGAGGPGGGPLLPPRLLYSCRLCTFVSHYSSHLKRHMQTHSGEKPF ::.: : : ...: :..::.::::. CCDS48 ERFFDPNQRGKALHQKQALRKSQRSQTGEKLYKCTECGKVFIQKANLVVHQRTHTGEKPY 200 210 220 230 240 250 180 190 200 210 220 230 pF1KE6 RCGRCPYASAQLVNLTRHTRTHTGEKPYRCPHCPFACSSLGNLRRHQRTHAGPPTPPCPT .: .: : .: .: : :::::::::.: .: . . ..: .:::::.: : CCDS48 ECCECAKAFSQKSTLIAHQRTHTGEKPYECSECGKTFIQKSTLIKHQRTHTGEKPFVCDK 260 270 280 290 300 310 240 250 260 270 280 290 pF1KE6 C--GFRCCTPRPARPPSPTEQEGAVPRRPEDALLLPDLSLHVPPGGASFLPDCGQLRGEG : .:. . . .: . . :. . .: .: :.:.. CCDS48 CPKAFKSSYHLIRHEKTHIRQAFYKGIKCTTSSLIYQ-RIH-----TSEKPQCSE----- 320 330 340 350 360 300 310 320 330 340 350 pF1KE6 EGLCGTGSEPLPELLFPWTCRGCGQELEEGEGSRLGAAMCGRCMRGEAGGGASGGPQGPS : .:. : : : .: . : :. ::. .::.. .. . . CCDS48 ---HGKASDEKPSPTKHW--RTHTKE-NIYECSK-----CGKSFRGKSHLSVHQRIH-TG 370 380 390 400 360 370 380 390 400 410 pF1KE6 DKGFACSLCPFATHYPNHLARHMKTHSGEKPFRCARCPYASAHLDNLKRHQRVHTGEKPY .: . ::.: . .::. : .::.::::..: :: : .. ..: :::.::::::: CCDS48 EKPYECSICGKTFSGKSHLSVHHRTHTGEKPYECRRCGKAFGEKSTLIVHQRMHTGEKPY 410 420 430 440 450 460 420 430 440 450 460 470 pF1KE6 KCPLCPYACGNLANLKRHGRIHSGDKPFRCSLCNYSCNQSMNLKRHMLRHTGEKPFRCAT :: : : .. . : .: :::.:..:..:. :. . ... .: .:. ::::::..:. CCDS48 KCNECGKAFSEKSPLIKHQRIHTGERPYECTDCKKAFSRKSTLIKHQRIHTGEKPYKCSE 470 480 490 500 510 520 480 490 500 510 520 530 pF1KE6 CAYTTGHWDNYKRHQKVHGHGGAGGPGLSASEGWAPPHSPPSVLSSRGPPALGTAGSRAV :. . . .. :...: CCDS48 CGKAFSVKSTLIVHHRTHTGEKPYECRDCGKAFSGKSTLIKHQRSHTGDKNL 530 540 550 560 570 580 >>CCDS13439.1 ZFP64 gene_id:55734|Hs108|chr20 (645 aa) initn: 744 init1: 432 opt: 546 Z-score: 371.6 bits: 78.8 E(32554): 2.2e-14 Smith-Waterman score: 628; 31.4% identity (51.9% similar) in 360 aa overlap (142-493:135-463) 120 130 140 150 160 pF1KE6 RGERPGPACQLCGGPTGEGPCCGAGGPGGGPLLPP--RLLYSCRL-CTFVSHYS-SHLKR : :: . : : : : . :. . ..: CCDS13 HGYQTYLPTESNENQTATVISLPAKSRTKKPTTPPAQKRLNCCYPGCQFKTAYGMKDMER 110 120 130 140 150 160 170 180 190 200 210 220 pF1KE6 HMQTHSGEKPFRCGRCPYASAQLVNLTRHTRTHTGEKPYRCPHCPFACSSLGNLRRHQRT :.. :.:.:: .: : .. .: : : ::: :::.: : .: .. ..: .: : CCDS13 HLKIHTGDKPHKCEVCGKCFSRKDKLKTHMRCHTGVKPYKCKTCDYAAADSSSLNKHLRI 170 180 190 200 210 220 230 240 250 260 270 280 pF1KE6 HAGPPTPPCPTCGF--RCCTPRPA--RPPSPTEQEGAVPRRPEDALLLPDLSLHVPPGGA :. : : . : . . : . .: . ::. : : : .: . . CCDS13 HSDERPFKCQICPYASRNSSQLTVHLRSHTASELDDDVPK----ANCLSTESTDTPKAPV 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE6 SFLPDCGQLRGEGEGLCGTGSEPLPELLFPWTCRGCGQELEEGEGSRLGAAMCGRCMRGE ::. :.. .: .: . .: :: . .: . : .: . CCDS13 ITLPS------EAREQMATLGERTFNCCYP----GCHFKTVHGMKD------LDRHLRIH 290 300 310 320 350 360 370 380 390 400 pF1KE6 AGGGASGGPQGPSDKGFACSLCPFATHYPNHLARHMKTHSGEKPFRCARCPYASAHLDNL .: :: : .: ..:. ::. :.. :: .: : ::.. ..: CCDS13 TG-----------DKPHKCEFCDKCFSRKDNLTMHMRCHTSVKPHKCHLCDYAAVDSSSL 330 340 350 360 370 410 420 430 440 450 460 pF1KE6 KRHQRVHTGEKPYKCPLCPYACGNLANLKRHGRIHSGDKPFRCSLCNYSCNQSMNLKRHM :.: :.:. :.:::: ::::: : ..: : : :.:: ::.: ::. . . : .::::: CCDS13 KKHLRIHSDERPYKCQLCPYASRNSSQLTVHLRSHTGDTPFQCWLCSAKFKISSDLKRHM 380 390 400 410 420 430 470 480 490 500 510 520 pF1KE6 LRHTGEKPFRCATCAYTTGHWDNYKRHQKVHGHGGAGGPGLSASEGWAPPHSPPSVLSSR . :.:::::.: : : : : .. CCDS13 IVHSGEKPFKCEFCDVRCTMKANLKSHIRIKHTFKCLHCAFQGRDRADLLEHSRLHQADH 440 450 460 470 480 490 >>CCDS5667.1 ZKSCAN5 gene_id:23660|Hs108|chr7 (839 aa) initn: 649 init1: 362 opt: 547 Z-score: 371.0 bits: 79.0 E(32554): 2.4e-14 Smith-Waterman score: 551; 29.6% identity (51.0% similar) in 361 aa overlap (150-494:346-683) 120 130 140 150 160 170 pF1KE6 CQLCGGPTGEGPCCGAGGPGGGPLLPPRLLYSCRLCTFVSHYSSHLKRHMQTHSGEKPFR . : : .:.. .: . :.:::::. CCDS56 GKSRQNPSQKRDLDAITDISPKQSTHGERGHRCSDCGKFFLQASNFIQHRRIHTGEKPFK 320 330 340 350 360 370 180 190 200 210 220 230 pF1KE6 CGRCPYASAQLVNLTRHTRTHTGEKPYRCPHCPFACSSLGNLRRHQRTHAGPPTPPCPTC ::.: . : :.::.: :.:::::::.: : : ..: .:. .:.: : : CCDS56 CGECGKSYNQRVHLTQHQRVHTGEKPYKCQVCGKAFRVSSHLVQHHSVHSGERPYGCNEC 380 390 400 410 420 430 240 250 260 270 280 pF1KE6 G----------------FRCCTPRPARPPSPTEQEGAVPRRPEDALLLPDLSLHVPPGGA : :: . : . : . . .. . : . :. : .: CCDS56 GKNFGRHSHLIEHLKRHFREKSQRCSDKRSKNTKLSVKKKISEYSE--ADMEL----SGK 440 450 460 470 480 290 300 310 320 330 340 pF1KE6 SFLPDCGQLRGEGEGLCGTGSEPLPELLFPWTCRGCGQELEEGEGSRLGAAMCGRCMRGE . . .:.. ::: :. : : ..: :: : .: CCDS56 T-QRNVSQVQDFGEGCEFQGKLD----------RKQGIPMKEI----LGQPSSKRMNYSE 490 500 510 520 530 350 360 370 380 390 400 pF1KE6 AGGGASGGPQGPSDKGFACSLCPFATHYPNHLARHMKTHSGEKPFRCARCPYASAHLDNL . . . : .. :. : . :: .:.. :.::::::: .: . . .: CCDS56 VPYVHKKSSTG--ERPHKCNECGKSFIQSAHLIQHQRIHTGEKPFRCEECGKSYNQRVHL 540 550 560 570 580 590 410 420 430 440 450 460 pF1KE6 KRHQRVHTGEKPYKCPLCPYACGNLANLKRHGRIHSGDKPFRCSLCNYSCNQSMNLKRHM .::::::::::: :::: : ..: .: .:::..::.:. :. . .. .: :. CCDS56 TQHQRVHTGEKPYTCPLCGKAFRVRSHLVQHQSVHSGERPFKCNECGKGFGRRSHLAGHL 600 610 620 630 640 650 470 480 490 500 510 520 pF1KE6 LRHTGEKPFRCATCAYTTGHWDNYKRHQKVHGHGGAGGPGLSASEGWAPPHSPPSVLSSR :. :: .: :. .. . .:: .: CCDS56 RLHSREKSHQCRECGEIFFQYVSLIEHQVLHMGQKNEKNGICEEAYSWNLTVIEDKKIEL 660 670 680 690 700 710 530 540 pF1KE6 GPPALGTAGSRAVHTDSS CCDS56 QEQPYQCDICGKAFGYSSDLIQHYRTHTAEKPYQCDICRENVGQCSHTKQHQKIYSSTKS 720 730 740 750 760 770 >>CCDS77335.1 ZNF473 gene_id:25888|Hs108|chr19 (859 aa) initn: 1050 init1: 406 opt: 540 Z-score: 366.3 bits: 78.2 E(32554): 4.4e-14 Smith-Waterman score: 583; 29.0% identity (51.2% similar) in 379 aa overlap (150-494:419-796) 120 130 140 150 160 170 pF1KE6 CQLCGGPTGEGPCCGAGGPGGGPLLPPRLLYSCRLCTFVSHYSSHLKRHMQTHSGEKPFR :.: : . : .::..: . :.: .: . CCDS77 EPYKCNERGKSFRHNSTLKIHQRVHSGEKPYKCSECGKAFHRHTHLNEHRRIHTGYRPHK 390 400 410 420 430 440 180 190 200 210 220 230 pF1KE6 CGRCPYASAQLVNLTRHTRTHTGEKPYRCPHCPFACSSLGNLRRHQRTHAGPPTPPCPTC : .: . .. .: :: ::.:::: : .: . :. . : .::. :. : : CCDS77 CQECVRSFSRPSHLMRHQAIHTAEKPYSCAECKETFSDNNRLVQHQKMHTVKTPYECQEC 450 460 470 480 490 500 240 250 260 270 pF1KE6 GFR--------CCTPRPARPPSPTEQEGAV----PRRPEDAL--------------LLPD : : : :: . : . :.. : . : CCDS77 GERFICGSTLKCHESVHAREKQGFFVSGKILDQNPEQKEKCFKCNKCEKTFSCSKYLTQH 510 520 530 540 550 560 280 290 300 310 320 pF1KE6 LSLHVPPGGASFLPD-CGQLRGEGEGLCGTGSEPLPELLFPWTCRG---CGQELEEGEG- .:. : : : ::. :.. : :. : .: . : . .. CCDS77 ERIHTR-GVKPFECDQCGKAFGQSTRLIHHQRIHSRVRLYKWGEQGKAISSASLIKLQSF 570 580 590 600 610 620 330 340 350 360 370 380 pF1KE6 -SRLGAAMCGRCMRGEAGGGASGGPQ--GPSDKGFACSLCPFATHYPNHLARHMKTHSGE .. :..: . . .. . : ... : :: : . :.:..: .::. . CCDS77 HTKEHPFKCNECGKTFSHSAHLSKHQLIHAGENPFKCSKCDRVFTQRNYLVQHERTHARK 630 640 650 660 670 680 390 400 410 420 430 440 pF1KE6 KPFRCARCPYASAHLDNLKRHQRVHTGEKPYKCPLCPYACGNLANLKRHGRIHSGDKPFR ::. : .: . . . :..:::.:.::::: : : : : :.: :: :::.:.::. CCDS77 KPLVCNECGKTFRQSSCLSKHQRIHSGEKPYVCDYCGKAFGLSAELVRHQRIHTGEKPYV 690 700 710 720 730 740 450 460 470 480 490 500 pF1KE6 CSLCNYSCNQSMNLKRHMLRHTGEKPFRCATCAYTTGHWDNYKRHQKVHGHGGAGGPGLS :. :. . .:: :. : ::::::.::. :. . .. : .::..: CCDS77 CQECGKAFTQSSCLSIHRRVHTGEKPYRCGECGKAFAQKANLTQHQRIHTGEKPYSCNVC 750 760 770 780 790 800 510 520 530 540 pF1KE6 ASEGWAPPHSPPSVLSSRGPPALGTAGSRAVHTDSS CCDS77 GKAFVLSAHLNQHLRVHTQETLYQCQRCQKAFRCHSSLSRHQRVHNKQQYCL 810 820 830 840 850 >>CCDS33077.1 ZNF473 gene_id:25888|Hs108|chr19 (871 aa) initn: 1050 init1: 406 opt: 540 Z-score: 366.2 bits: 78.2 E(32554): 4.4e-14 Smith-Waterman score: 583; 29.0% identity (51.2% similar) in 379 aa overlap (150-494:431-808) 120 130 140 150 160 170 pF1KE6 CQLCGGPTGEGPCCGAGGPGGGPLLPPRLLYSCRLCTFVSHYSSHLKRHMQTHSGEKPFR :.: : . : .::..: . :.: .: . CCDS33 EPYKCNERGKSFRHNSTLKIHQRVHSGEKPYKCSECGKAFHRHTHLNEHRRIHTGYRPHK 410 420 430 440 450 460 180 190 200 210 220 230 pF1KE6 CGRCPYASAQLVNLTRHTRTHTGEKPYRCPHCPFACSSLGNLRRHQRTHAGPPTPPCPTC : .: . .. .: :: ::.:::: : .: . :. . : .::. :. : : CCDS33 CQECVRSFSRPSHLMRHQAIHTAEKPYSCAECKETFSDNNRLVQHQKMHTVKTPYECQEC 470 480 490 500 510 520 240 250 260 270 pF1KE6 GFR--------CCTPRPARPPSPTEQEGAV----PRRPEDAL--------------LLPD : : : :: . : . :.. : . : CCDS33 GERFICGSTLKCHESVHAREKQGFFVSGKILDQNPEQKEKCFKCNKCEKTFSCSKYLTQH 530 540 550 560 570 580 280 290 300 310 320 pF1KE6 LSLHVPPGGASFLPD-CGQLRGEGEGLCGTGSEPLPELLFPWTCRG---CGQELEEGEG- .:. : : : ::. :.. : :. : .: . : . .. CCDS33 ERIHTR-GVKPFECDQCGKAFGQSTRLIHHQRIHSRVRLYKWGEQGKAISSASLIKLQSF 590 600 610 620 630 330 340 350 360 370 380 pF1KE6 -SRLGAAMCGRCMRGEAGGGASGGPQ--GPSDKGFACSLCPFATHYPNHLARHMKTHSGE .. :..: . . .. . : ... : :: : . :.:..: .::. . CCDS33 HTKEHPFKCNECGKTFSHSAHLSKHQLIHAGENPFKCSKCDRVFTQRNYLVQHERTHARK 640 650 660 670 680 690 390 400 410 420 430 440 pF1KE6 KPFRCARCPYASAHLDNLKRHQRVHTGEKPYKCPLCPYACGNLANLKRHGRIHSGDKPFR ::. : .: . . . :..:::.:.::::: : : : : :.: :: :::.:.::. CCDS33 KPLVCNECGKTFRQSSCLSKHQRIHSGEKPYVCDYCGKAFGLSAELVRHQRIHTGEKPYV 700 710 720 730 740 750 450 460 470 480 490 500 pF1KE6 CSLCNYSCNQSMNLKRHMLRHTGEKPFRCATCAYTTGHWDNYKRHQKVHGHGGAGGPGLS :. :. . .:: :. : ::::::.::. :. . .. : .::..: CCDS33 CQECGKAFTQSSCLSIHRRVHTGEKPYRCGECGKAFAQKANLTQHQRIHTGEKPYSCNVC 760 770 780 790 800 810 510 520 530 540 pF1KE6 ASEGWAPPHSPPSVLSSRGPPALGTAGSRAVHTDSS CCDS33 GKAFVLSAHLNQHLRVHTQETLYQCQRCQKAFRCHSSLSRHQRVHNKQQYCL 820 830 840 850 860 870 541 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 13:24:16 2016 done: Tue Nov 8 13:24:17 2016 Total Scan time: 3.360 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]