FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1187, 765 aa 1>>>pF1KE1187 765 - 765 aa - 765 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.1607+/-0.00124; mu= 7.5304+/- 0.073 mean_var=237.3020+/-53.422, 0's: 0 Z-trim(109.1): 965 B-trim: 497 in 1/51 Lambda= 0.083258 statistics sampled from 9606 (10687) to 9606 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.675), E-opt: 0.2 (0.328), width: 16 Scan time: 3.700 The best scores are: opt bits E(32554) CCDS3375.1 ZBTB49 gene_id:166793|Hs108|chr4 ( 765) 5229 642.3 8.7e-184 CCDS13151.1 GZF1 gene_id:64412|Hs108|chr20 ( 711) 853 116.6 1.4e-25 CCDS32981.1 ZNF675 gene_id:171392|Hs108|chr19 ( 568) 813 111.7 3.4e-24 CCDS74322.1 ZNF91 gene_id:7644|Hs108|chr19 (1159) 796 110.0 2.2e-23 CCDS42541.1 ZNF91 gene_id:7644|Hs108|chr19 (1191) 796 110.0 2.3e-23 CCDS54214.1 ZNF177 gene_id:7730|Hs108|chr19 ( 481) 774 106.9 7.7e-23 CCDS59367.1 ZNF43 gene_id:7594|Hs108|chr19 ( 803) 777 107.5 8.5e-23 CCDS12413.2 ZNF43 gene_id:7594|Hs108|chr19 ( 809) 777 107.5 8.5e-23 CCDS74321.1 ZNF43 gene_id:7594|Hs108|chr19 ( 818) 777 107.5 8.6e-23 CCDS47357.2 ZFP62 gene_id:643836|Hs108|chr5 ( 867) 776 107.5 9.7e-23 CCDS54955.1 ZFP62 gene_id:643836|Hs108|chr5 ( 900) 776 107.5 1e-22 CCDS46990.1 ZNF732 gene_id:654254|Hs108|chr4 ( 585) 772 106.8 1e-22 CCDS32977.1 ZNF85 gene_id:7639|Hs108|chr19 ( 595) 768 106.3 1.5e-22 CCDS4440.1 ZFP2 gene_id:80108|Hs108|chr5 ( 461) 765 105.8 1.6e-22 CCDS6437.1 ZNF16 gene_id:7564|Hs108|chr8 ( 682) 768 106.4 1.6e-22 CCDS47592.1 ZNF679 gene_id:168417|Hs108|chr7 ( 411) 763 105.5 1.7e-22 CCDS75904.1 ZNF79 gene_id:7633|Hs108|chr9 ( 364) 762 105.4 1.7e-22 CCDS42537.1 ZNF429 gene_id:353088|Hs108|chr19 ( 674) 766 106.1 1.9e-22 CCDS5951.2 ZNF596 gene_id:169270|Hs108|chr8 ( 504) 763 105.6 2e-22 CCDS69664.1 ZNF79 gene_id:7633|Hs108|chr9 ( 474) 762 105.5 2.1e-22 CCDS46172.1 ZNF813 gene_id:126017|Hs108|chr19 ( 617) 764 105.9 2.1e-22 CCDS6871.1 ZNF79 gene_id:7633|Hs108|chr9 ( 498) 762 105.5 2.1e-22 CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 763 105.7 2.3e-22 CCDS33048.1 ZNF235 gene_id:9310|Hs108|chr19 ( 738) 764 105.9 2.4e-22 CCDS7194.1 ZNF248 gene_id:57209|Hs108|chr10 ( 579) 762 105.6 2.4e-22 CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 763 105.8 2.4e-22 CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 763 105.8 2.4e-22 CCDS59368.1 ZNF729 gene_id:100287226|Hs108|chr19 (1252) 768 106.7 2.4e-22 CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 763 105.8 2.4e-22 CCDS43590.1 ZNF479 gene_id:90827|Hs108|chr7 ( 524) 760 105.3 2.6e-22 CCDS3207.1 MYNN gene_id:55892|Hs108|chr3 ( 610) 761 105.5 2.7e-22 CCDS46031.1 ZNF98 gene_id:148198|Hs108|chr19 ( 572) 760 105.3 2.8e-22 CCDS31418.1 ZNF214 gene_id:7761|Hs108|chr11 ( 606) 760 105.4 2.9e-22 CCDS59372.1 ZNF726 gene_id:730087|Hs108|chr19 ( 616) 760 105.4 2.9e-22 CCDS46102.1 ZNF226 gene_id:7769|Hs108|chr19 ( 803) 762 105.7 3e-22 CCDS62707.1 ZNF180 gene_id:7733|Hs108|chr19 ( 665) 760 105.4 3.1e-22 CCDS62708.1 ZNF180 gene_id:7733|Hs108|chr19 ( 667) 760 105.4 3.1e-22 CCDS12634.1 ZNF155 gene_id:7711|Hs108|chr19 ( 538) 758 105.1 3.1e-22 CCDS12639.1 ZNF180 gene_id:7733|Hs108|chr19 ( 692) 760 105.4 3.2e-22 CCDS58668.1 ZNF155 gene_id:7711|Hs108|chr19 ( 549) 758 105.1 3.2e-22 CCDS35075.1 ZNF782 gene_id:158431|Hs108|chr9 ( 699) 759 105.3 3.5e-22 CCDS12943.1 ZNF583 gene_id:147949|Hs108|chr19 ( 569) 755 104.7 4.2e-22 CCDS32978.1 ZNF430 gene_id:80264|Hs108|chr19 ( 570) 755 104.7 4.2e-22 CCDS12497.1 ZNF345 gene_id:25850|Hs108|chr19 ( 488) 753 104.4 4.5e-22 CCDS12414.2 ZNF681 gene_id:148213|Hs108|chr19 ( 645) 755 104.8 4.6e-22 CCDS46027.1 ZNF506 gene_id:440515|Hs108|chr19 ( 412) 751 104.1 4.7e-22 CCDS42531.1 ZNF506 gene_id:440515|Hs108|chr19 ( 444) 751 104.1 4.9e-22 CCDS42532.1 ZNF253 gene_id:56242|Hs108|chr19 ( 499) 751 104.2 5.4e-22 CCDS74346.1 ZNF566 gene_id:84924|Hs108|chr19 ( 314) 746 103.4 5.9e-22 CCDS42539.1 ZNF676 gene_id:163223|Hs108|chr19 ( 588) 751 104.3 6e-22 >>CCDS3375.1 ZBTB49 gene_id:166793|Hs108|chr4 (765 aa) initn: 5229 init1: 5229 opt: 5229 Z-score: 3413.1 bits: 642.3 E(32554): 8.7e-184 Smith-Waterman score: 5229; 99.9% identity (100.0% similar) in 765 aa overlap (1-765:1-765) 10 20 30 40 50 60 pF1KE1 MDPVATHSCHLLQQLHEQRIQGLLCDCMLVVKGVCFKAHKNVLAAFSQYFRSLFQNSSSQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MDPVATHSCHLLQQLHEQRIQGLLCDCMLVVKGVCFKAHKNVLAAFSQYFRSLFQNSSSQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 KNDVFHLDVKNVSGIGQILDFMYTSHLDLNQDNIQVMLDTAQCLQVQNVLSLCHTFLKSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KNDVFHLDVKNVSGIGQILDFMYTSHLDLNQDNIQVMLDTAQCLQVQNVLSLCHTFLKSA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 TVVQPPGMPCNSTLSLQSTLTPDATCVISENYPPHLLQECSADAQQNKTLDESHPHASPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TVVQPPGMPCNSTLSLQSTLTPDATCVISENYPPHLLQECSADAQQNKTLDESHPHASPS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 VNRHHSAGEISKQAPDTSDGSCTELPFKQPNYYYKLRNFYSKQYHKHAAGPSQERVVEQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VNRHHSAGEISKQAPDTSDGSCTELPFKQPNYYYKLRNFYSKQYHKHAAGPSQERVVEQP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 FAFSTSTDLTTVESQPCAVSHSECILESPEHLPSNFLAQPVNDSAPHPESDATCQQPVKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 FAFSTSTDLTTVESQPCAVSHSECILESPEHLPSNFLAQPVNDSAPHPESDATCQQPVKQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 MRLKKAIHLKKLNFLKSQKYAEQVSEPKSDDGLTKRLESASKNTLEKASSQSAEEKESEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MRLKKAIHLKKLNFLKSQKYAEQVSEPKSDDGLTKRLESASKNTLEKASSQSAEEKESEE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 VVSCENFNCISETERPEDPAALEDQSQTLQSQRQYACELCGKPFKHPSNLELHKRSHTGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VVSCENFNCISETERPEDPAALEDQSQTLQSQRQYACELCGKPFKHPSNLELHKRSHTGE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE1 KPFECNICGKHFSQAGNLQTHLRRHSGEKPYICEICGKRFAASGDVQRHIIIHSGEKPHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KPFECNICGKHFSQAGNLQTHLRRHSGEKPYICEICGKRFAASGDVQRHIIIHSGEKPHL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE1 CDICGRGFSNFSNLKEHKKTHTADKVFTCDECGKSFNMQRKLVKHRIRHTGERPYSCSAC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 CDICGRGFSNFSNLKEHKKTHTADKVFTCDECGKSFNMQRKLVKHRIRHTGERPYSCSAC 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE1 GKCFGGSGDLRRHVRAHTGEKPYTCEICNKCFTRSAVLRRHKKMHCKAGDESPDVLEELS :::::::::::::::.:::::::::::::::::::::::::::::::::::::::::::: CCDS33 GKCFGGSGDLRRHVRTHTGEKPYTCEICNKCFTRSAVLRRHKKMHCKAGDESPDVLEELS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE1 QAIETSDLEKSQSSDSFSQDTSVTLMPVSVKLPVHPVENSVAEFDSHSGGSYCKLRSMIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QAIETSDLEKSQSSDSFSQDTSVTLMPVSVKLPVHPVENSVAEFDSHSGGSYCKLRSMIQ 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE1 PHGVSDQEKLSLDPGKLAKPQMQQTQPQAYAYSDVDTPAGGEPLQADGMAMIRSSLAALD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PHGVSDQEKLSLDPGKLAKPQMQQTQPQAYAYSDVDTPAGGEPLQADGMAMIRSSLAALD 670 680 690 700 710 720 730 740 750 760 pF1KE1 NHGGDPLGSRASSTTYRNSEGQFFSSMTLWGLAMKTLQNENELDQ ::::::::::::::::::::::::::::::::::::::::::::: CCDS33 NHGGDPLGSRASSTTYRNSEGQFFSSMTLWGLAMKTLQNENELDQ 730 740 750 760 >>CCDS13151.1 GZF1 gene_id:64412|Hs108|chr20 (711 aa) initn: 666 init1: 666 opt: 853 Z-score: 572.7 bits: 116.6 E(32554): 1.4e-25 Smith-Waterman score: 861; 26.9% identity (57.1% similar) in 725 aa overlap (10-696:16-711) 10 20 30 40 50 pF1KE1 MDPVATHSCHLLQQLHEQRIQGLLCDCMLVV--KGVC--FKAHKNVLAAFSQYF .::...:: :. : ::: . : .:: : ::: :::: :..: CCDS13 MESGAVLLESKSSPFNLLHEMHELRLLGHLCDVTVSVEYQGVRKDFMAHKAVLAATSKFF 10 20 30 40 50 60 60 70 80 90 100 pF1KE1 RSLFQNSSS---QKNDVFHLDVKNVSGIGQILDFMYTSHLDLNQDNIQVMLDTAQCLQVQ . .: : .: ...:. .:. :. ....:.:.::.......: .: ::..:. :. CCDS13 KEVFLNEKSVDGTRTNVYLNEVQ-VADFASFLEFVYTAKVQVEEDRVQRMLEVAEKLKCL 70 80 90 100 110 110 120 130 140 150 pF1KE1 NVLSLCHTFLKSA--TVV-------QPPGMPCNSTLSLQSTLTPDATCVISENYPPHLLQ .. : . :. .:. . . .: ..... .: :. . . .: : . CCDS13 DLSETCFQLKKQMLESVLLELQNFSESQEVEVSSGSQVSAAPAPRASVATDGPHPSGLTD 120 130 140 150 160 170 160 170 180 190 200 pF1KE1 ECSADAQQNKTLDESHPHASPSVNRHHSAGEISKQA-PDTSDGS--------CTELPFKQ . ... .. : . : .. . :. : : .: .:.: :. CCDS13 SLDYPGERASNGMSSDLPPKKSKDKLDKKKEVVKPPYPKIRRASGRLAGRKVFVEIPKKK 180 190 200 210 220 230 210 220 230 240 250 260 pF1KE1 PNYYYKLRNFYSKQYHKHAAGPSQERVVEQPFAFSTSTDLTTVESQPCAVSHSECILESP : .:: . .: : : . : . : : . .: . ::..: . CCDS13 --YTRRLR-----EQQKTAEGDVGDYRCPQ----DQSPDRVGTEME--QVSKNEGCQAGA 240 250 260 270 280 270 280 290 300 310 320 pF1KE1 EHLPSNFLAQPVNDSAPHPESDATCQQPVK-QMRLKKAIHLKKLNFLKSQKYAEQVSEPK : . : : .. . :.. .. . . . . : . .::: .:. . :. CCDS13 ELEELSKKAGPEEEEEEEEEDEEGEKKKSNFKCSICEKAFLYEKSFLKHSKHRHGVATE- 290 300 310 320 330 340 330 340 350 360 370 380 pF1KE1 SDDGLTKRLESASKNTLEKASSQSAEEK--ESEEVVSCENFNCISETERPEDPAALEDQS .. : .. ... .. . .: ... ::. :: : .. .: .: : CCDS13 ----VVYRCDTCGQTFANRCNLKSHQRHVHSSERHFPCE--LCGKKFKRKKDVKRHVLQV 350 360 370 380 390 390 400 410 420 430 440 pF1KE1 QTLQSQRQYACELCGKPFKHPSNLELHKRSHTGEKPFECNICGKHFSQAGNLQTHLRRHS . ..:. : ::: .. . :.::.:.:::..:. :. :: .::: . :.::.: :. CCDS13 HEGGGERHR-CGQCGKGLSSKTALRLHERTHTGDRPYGCTECGARFSQPSALKTHMRIHT 400 410 420 430 440 450 450 460 470 480 490 500 pF1KE1 GEKPYICEICGKRFAASGDVQRHIIIHSGEKPHLCDICGRGFSNFSNLKEHKKTHTADKV ::::..:. :: ::. . . : :.::.: .:. ::..:.. ::.:.. ::..: CCDS13 GEKPFVCDECGARFTQNHMLIYHKRCHTGERPFMCETCGKSFASKEYLKHHNRIHTGSKP 460 470 480 490 500 510 510 520 530 540 550 560 pF1KE1 FTCDECGKSFNMQRKLVKHRIRHTGERPYSCSACGKCFGGSGDLRRHVRAHTGEKPYTCE : :. : ..: .. .: .: ::::::: :. ::: : . :.:: : ::::.:. :. CCDS13 FKCEVCFRTFAQRNSLYQHIKVHTGERPYCCDQCGKQFTQLNALQRHRRIHTGERPFMCN 520 530 540 550 560 570 570 580 590 600 610 620 pF1KE1 ICNKCFTRSAVLRRHKKMHCKAGDESP--DVLEELSQAIETSDLEKSQSSDS--FSQDTS :.. :: ...:::: ..: : ..: . : .. . ...: .:... : :. : CCDS13 ACGRTFTDKSTLRRHTSIHDK---NTPWKSFLVIVDGSPKNDDGHKTEQPDEEYVSSKLS 580 590 600 610 620 630 630 640 650 660 670 pF1KE1 VTLMPVSVKLPVH---PVENSVAEF-DSHSGGSYCKLRSMIQPHGVSDQEKLSLDPGKLA :. . . : :...: . .. :. . :: . . ::.. :. ..:. CCDS13 DKLLSFAENGHFHNLAAVQDTVPTMQENSSADTACKADDSV----VSQDTLLATTISELS 640 650 660 670 680 690 680 690 700 710 720 730 pF1KE1 K--PQMQQTQPQAYAYSDVDTPAGGEPLQADGMAMIRSSLAALDNHGGDPLGSRASSTTY . :: .. : .. :... CCDS13 ELTPQTDSMPTQLHSLSNME 700 710 >>CCDS32981.1 ZNF675 gene_id:171392|Hs108|chr19 (568 aa) initn: 5336 init1: 745 opt: 813 Z-score: 548.0 bits: 111.7 E(32554): 3.4e-24 Smith-Waterman score: 813; 43.6% identity (68.9% similar) in 273 aa overlap (346-616:206-475) 320 330 340 350 360 370 pF1KE1 KSQKYAEQVSEPKSDDGLTKRLESASKNTLEKASSQSAEEKESEEVVSCENFNCISETER ::: .::.. . ... .::.. .: .: CCDS32 ECGRSFCMLSHLTRHERNYTKVNFCKCEECEKAVNQSSKLTKHKRIYTCEKLYKCQECDR 180 190 200 210 220 230 380 390 400 410 420 430 pF1KE1 PEDP-AALEDQSQTLQSQRQYACELCGKPFKHPSNLELHKRSHTGEKPFECNICGKHFSQ . . : . .. .. : :: ::: :.. :.: :: ::::::..:. ::: :.: CCDS32 TFNQFSNLTEYKKDYAREKPYKCEECGKAFNQSSHLTTHKIIHTGEKPYKCEECGKAFNQ 240 250 260 270 280 290 440 450 460 470 480 490 pF1KE1 AGNLQTHLRRHSGEKPYICEICGKRFAASGDVQRHIIIHSGEKPHLCDICGRGFSNFSNL .:: :: . :.::.::::: ::: :. :. . : ::.::::. :. ::..:. :.: CCDS32 FSNLTTHKKIHTGEQPYICEECGKAFTQSSTLTTHKRIHTGEKPYKCEECGKAFNRSSKL 300 310 320 330 340 350 500 510 520 530 540 550 pF1KE1 KEHKKTHTADKVFTCDECGKSFNMQRKLVKHRIRHTGERPYSCSACGKCFGGSGDLRRHV :::. ::... . :.::::.:: . .:..:: :: :.::.:. ::: : :. : : CCDS32 TEHKNIHTGEQPYKCEECGKAFNRSSNLTEHRKIHTEEKPYKCKECGKAFKHSSALTTHK 360 370 380 390 400 410 560 570 580 590 600 610 pF1KE1 RAHTGEKPYTCEICNKCFTRSAVLRRHKKMHCKAGDESPDVLEELSQA-IETSDLEKSQS : ::::::: :: :.: :.::. : .:::.: ..: :: ..: :..: : . .. CCDS32 RIHTGEKPYKCEECGKAFNRSSKLTEHKKLHT---GKKPYKCEECGKAFIQSSKLTEHKK 420 430 440 450 460 470 620 630 640 650 660 670 pF1KE1 SDSFSQDTSVTLMPVSVKLPVHPVENSVAEFDSHSGGSYCKLRSMIQPHGVSDQEKLSLD : CCDS32 IHSGEIPYKCEECGKAFKHSSSLTTHKRIHTGEKPYKCEECGKAFSRSSKLTEHKIIHTG 480 490 500 510 520 530 >>CCDS74322.1 ZNF91 gene_id:7644|Hs108|chr19 (1159 aa) initn: 6227 init1: 774 opt: 796 Z-score: 533.1 bits: 110.0 E(32554): 2.2e-23 Smith-Waterman score: 796; 48.7% identity (72.6% similar) in 234 aa overlap (380-612:863-1093) 350 360 370 380 390 400 pF1KE1 SQSAEEKESEEVVSCENFNCISETERPEDPAALEDQSQTLQSQRQYACELCGKPFKHPSN ..: .... .. : :: ::: :..::. CCDS74 QSSNLTTHKIIHTKEKPSKSEECDKAFIWSSTLTEHKRIHTREKTYKCEECGKAFSQPSH 840 850 860 870 880 890 410 420 430 440 450 460 pF1KE1 LELHKRSHTGEKPFECNICGKHFSQAGNLQTHLRRHSGEKPYICEICGKRFAASGDVQRH : ::: ::::::..:. ::: :::...: :: :.::::: :: ::: : :. . .: CCDS74 LTTHKRMHTGEKPYKCEECGKAFSQSSTLTTHKIIHTGEKPYKCEECGKAFRKSSTLTEH 900 910 920 930 940 950 470 480 490 500 510 520 pF1KE1 IIIHSGEKPHLCDICGRGFSNFSNLKEHKKTHTADKVFTCDECGKSFNMQRKLVKHRIRH :::.::::. :. ::..::. :.: .: . ::..: . :.::::.:: . ::. :.: : CCDS74 KIIHTGEKPYKCEECGKAFSQSSTLTRHTRMHTGEKPYKCEECGKAFNRSSKLTTHKIIH 960 970 980 990 1000 1010 530 540 550 560 570 580 pF1KE1 TGERPYSCSACGKCFGGSGDLRRHVRAHTGEKPYTCEICNKCFTRSAVLRRHKKMHCKAG :::.::.: ::: : .:. : : : :: :::: :: :.: :..:..: :::..: .: CCDS74 TGEKPYKCEECGKAFISSSTLNGHKRIHTREKPYKCEECGKAFSQSSTLTRHKRLH--TG 1020 1030 1040 1050 1060 1070 590 600 610 620 630 640 pF1KE1 DESPDVLEELSQAI-ETSDLEKSQSSDSFSQDTSVTLMPVSVKLPVHPVENSVAEFDSHS :.: : ..:. :.: : : . CCDS74 -EKPYKCGECGKAFKESSALTKHKIIHTGEKPYKCEKCGKAFNQSSILTNHKKIHTITPV 1080 1090 1100 1110 1120 >-- initn: 5910 init1: 708 opt: 723 Z-score: 485.8 bits: 101.2 E(32554): 9.8e-21 Smith-Waterman score: 747; 32.9% identity (56.2% similar) in 480 aa overlap (130-602:183-634) 100 110 120 130 140 150 pF1KE1 TAQCLQVQNVLSLCHTFLKSATVVQPPGMPCNSTLSLQSTLTPDATCVISENYPPHLLQE :..:. .:::: . . .:. :. .: CCDS74 KKCVKSFCIRLHKTQHKCVYITEKSCKCKECEKTFHWSSTLT-NHKEIHTED-KPYKCEE 160 170 180 190 200 210 160 170 180 190 200 210 pF1KE1 CSADAQQNKTLDESHP--HASPSVNRHHSAGEI---SKQAPDTSDGSCTELPFKQPNYYY :. .: .:: .: :. .. . . :. :. . : :.: . CCDS74 CGKAFKQLSTLT-THKIICAKEKIYKCEECGKAFLWSSTLTRHKRIHTGEKPYKCEECGK 220 230 240 250 260 220 230 240 250 260 270 pF1KE1 KLRNFYSKQYHKHA-AGPSQERVVEQPFAFSTSTDLTTVESQPCAVSHSECILESPEHLP . . . ::. .: . . : ::: :. :. . . . .: . CCDS74 AFSHSSTLAKHKRIHTGEKPYKCEECGKAFSRSSTLAKHKRIHTGEKPYKCKECGKAFSN 270 280 290 300 310 320 280 290 300 310 320 330 pF1KE1 SNFLAQPVNDSAPHPESDATCQQPVKQMRLKKAIHLKKLNFLKSQKYAEQVSEPKSDDGL :. :: : . : : ..: : . :: .:.:. : ..: . . . . CCDS74 SSTLA---NHKITHTE-----EKPYKCKECDKA--FKRLSTLTKHKIIHAGEKLYKCEEC 330 340 350 360 370 340 350 360 370 380 390 pF1KE1 TKRLESASKNTLEKASSQSAEEKESEEVVSC-ENFNCISETERPEDPAALEDQSQTLQSQ : .. .:. :..: . . . :: : . :: : .: ... . CCDS74 GKAFNRSSNLTIHKFIHTGEKPYKCEE---CGKAFNWSS---------SLTKHKRFHTRE 380 390 400 410 420 400 410 420 430 440 450 pF1KE1 RQYACELCGKPFKHPSNLELHKRSHTGEKPFECNICGKHFSQAGNLQTHLRRHSGEKPYI . . :. ::: : :.: ::: ::::::..:. ::: : :...: : :.::::: CCDS74 KPFKCKECGKAFIWSSTLTRHKRIHTGEKPYKCEECGKAFRQSSTLTKHKIIHTGEKPYK 430 440 450 460 470 480 460 470 480 490 500 510 pF1KE1 CEICGKRFAASGDVQRHIIIHSGEKPHLCDICGRGFSNFSNLKEHKKTHTADKVFTCDEC : ::: : : ...: :::: :::. : ::..:..::.: :: :.. :.. :.:: CCDS74 FEECGKAFRQSLTLNKHKIIHSREKPYKCKECGKAFKQFSTLTTHKIIHAGKKLYKCEEC 490 500 510 520 530 540 520 530 540 550 560 570 pF1KE1 GKSFNMQRKLVKHRIRHTGERPYSCSACGKCFGGSGDLRRHVRAHTGEKPYTCEICNKCF ::.:: . .: :.: ::::. :.: ::: : :. :::: : ::::::: :: :.: : CCDS74 GKAFNHSSSLSTHKIIHTGEKSYKCEECGKAFLWSSTLRRHKRIHTGEKPYKCEECGKAF 550 560 570 580 590 600 580 590 600 610 620 630 pF1KE1 TRSAVLRRHKKMHCKAGDESPDVLEELSQAIETSDLEKSQSSDSFSQDTSVTLMPVSVKL ..:..: .::..: .: :.: .: ..: CCDS74 SHSSALAKHKRIH--TG-EKPYKCKECGKAFSNSSTLANHKITHTEEKPYKCKECDKTFK 610 620 630 640 650 660 >-- initn: 2446 init1: 630 opt: 640 Z-score: 431.9 bits: 91.3 E(32554): 9.8e-18 Smith-Waterman score: 668; 43.6% identity (67.6% similar) in 225 aa overlap (378-602:637-858) 350 360 370 380 390 400 pF1KE1 ASSQSAEEKESEEVVSCENFNCISETERPEDPAALEDQSQTLQSQRQYACELCGKPFKHP . ..: ... : .. : :. : : ::. CCDS74 FSHSSALAKHKRIHTGEKPYKCKECGKAFSNSSTLANHKITHTEEKPYKCKECDKTFKRL 610 620 630 640 650 660 410 420 430 440 450 460 pF1KE1 SNLELHKRSHTGEKPFECNICGKHFSQAGNLQTHLRRHSGEKPYICEICGKRFAASGDVQ :.: :: :.::: ..:. ::: :....:: : :.::::: :: ::: : :... CCDS74 STLTKHKIIHAGEKLYKCEECGKAFNRSSNLTIHKFIHTGEKPYKCEECGKAFNWSSSLT 670 680 690 700 710 720 470 480 490 500 510 520 pF1KE1 RHIIIHSGEKPHLCDICGRGFSNFSNLKEHKKTHTADKVFTCDECGKSFNMQRKLVKHRI .: ::. ::: : ::..: :.: .::. ::..: . :.::::.:. . :.::. CCDS74 KHKRIHTREKPFKCKECGKAFIWSSTLTRHKRIHTGEKPYKCEECGKAFSRSSTLTKHKT 730 740 750 760 770 780 530 540 550 560 570 580 pF1KE1 RHTGERPYSCSACGKCFGGSGDLRRHVRAHTGEKPYTCEICNKCFTRSAVLRRHKKMHCK ::::.::.:. ::: : :. : .: :.::: : :: :.: :..:. : :: .: : CCDS74 IHTGEKPYKCKECGKAFKHSSALAKHKIIHAGEKLYKCEECGKAFNQSSNLTTHKIIHTK 790 800 810 820 830 840 590 600 610 620 630 640 pF1KE1 AGDESPDVLEELSQAIETSDLEKSQSSDSFSQDTSVTLMPVSVKLPVHPVENSVAEFDSH :.:. :: ..: CCDS74 ---EKPSKSEECDKAFIWSSTLTEHKRIHTREKTYKCEECGKAFSQPSHLTTHKRMHTGE 850 860 870 880 890 900 >>CCDS42541.1 ZNF91 gene_id:7644|Hs108|chr19 (1191 aa) initn: 6227 init1: 774 opt: 796 Z-score: 533.0 bits: 110.0 E(32554): 2.3e-23 Smith-Waterman score: 796; 48.7% identity (72.6% similar) in 234 aa overlap (380-612:895-1125) 350 360 370 380 390 400 pF1KE1 SQSAEEKESEEVVSCENFNCISETERPEDPAALEDQSQTLQSQRQYACELCGKPFKHPSN ..: .... .. : :: ::: :..::. CCDS42 QSSNLTTHKIIHTKEKPSKSEECDKAFIWSSTLTEHKRIHTREKTYKCEECGKAFSQPSH 870 880 890 900 910 920 410 420 430 440 450 460 pF1KE1 LELHKRSHTGEKPFECNICGKHFSQAGNLQTHLRRHSGEKPYICEICGKRFAASGDVQRH : ::: ::::::..:. ::: :::...: :: :.::::: :: ::: : :. . .: CCDS42 LTTHKRMHTGEKPYKCEECGKAFSQSSTLTTHKIIHTGEKPYKCEECGKAFRKSSTLTEH 930 940 950 960 970 980 470 480 490 500 510 520 pF1KE1 IIIHSGEKPHLCDICGRGFSNFSNLKEHKKTHTADKVFTCDECGKSFNMQRKLVKHRIRH :::.::::. :. ::..::. :.: .: . ::..: . :.::::.:: . ::. :.: : CCDS42 KIIHTGEKPYKCEECGKAFSQSSTLTRHTRMHTGEKPYKCEECGKAFNRSSKLTTHKIIH 990 1000 1010 1020 1030 1040 530 540 550 560 570 580 pF1KE1 TGERPYSCSACGKCFGGSGDLRRHVRAHTGEKPYTCEICNKCFTRSAVLRRHKKMHCKAG :::.::.: ::: : .:. : : : :: :::: :: :.: :..:..: :::..: .: CCDS42 TGEKPYKCEECGKAFISSSTLNGHKRIHTREKPYKCEECGKAFSQSSTLTRHKRLH--TG 1050 1060 1070 1080 1090 1100 590 600 610 620 630 640 pF1KE1 DESPDVLEELSQAI-ETSDLEKSQSSDSFSQDTSVTLMPVSVKLPVHPVENSVAEFDSHS :.: : ..:. :.: : : . CCDS42 -EKPYKCGECGKAFKESSALTKHKIIHTGEKPYKCEKCGKAFNQSSILTNHKKIHTITPV 1110 1120 1130 1140 1150 1160 >-- initn: 5910 init1: 708 opt: 723 Z-score: 485.6 bits: 101.2 E(32554): 1e-20 Smith-Waterman score: 747; 32.9% identity (56.2% similar) in 480 aa overlap (130-602:215-666) 100 110 120 130 140 150 pF1KE1 TAQCLQVQNVLSLCHTFLKSATVVQPPGMPCNSTLSLQSTLTPDATCVISENYPPHLLQE :..:. .:::: . . .:. :. .: CCDS42 KKCVKSFCIRLHKTQHKCVYITEKSCKCKECEKTFHWSSTLT-NHKEIHTED-KPYKCEE 190 200 210 220 230 240 160 170 180 190 200 210 pF1KE1 CSADAQQNKTLDESHP--HASPSVNRHHSAGEI---SKQAPDTSDGSCTELPFKQPNYYY :. .: .:: .: :. .. . . :. :. . : :.: . CCDS42 CGKAFKQLSTLT-THKIICAKEKIYKCEECGKAFLWSSTLTRHKRIHTGEKPYKCEECGK 250 260 270 280 290 300 220 230 240 250 260 270 pF1KE1 KLRNFYSKQYHKHA-AGPSQERVVEQPFAFSTSTDLTTVESQPCAVSHSECILESPEHLP . . . ::. .: . . : ::: :. :. . . . .: . CCDS42 AFSHSSTLAKHKRIHTGEKPYKCEECGKAFSRSSTLAKHKRIHTGEKPYKCKECGKAFSN 310 320 330 340 350 360 280 290 300 310 320 330 pF1KE1 SNFLAQPVNDSAPHPESDATCQQPVKQMRLKKAIHLKKLNFLKSQKYAEQVSEPKSDDGL :. :: : . : : ..: : . :: .:.:. : ..: . . . . CCDS42 SSTLA---NHKITHTE-----EKPYKCKECDKA--FKRLSTLTKHKIIHAGEKLYKCEEC 370 380 390 400 410 340 350 360 370 380 390 pF1KE1 TKRLESASKNTLEKASSQSAEEKESEEVVSC-ENFNCISETERPEDPAALEDQSQTLQSQ : .. .:. :..: . . . :: : . :: : .: ... . CCDS42 GKAFNRSSNLTIHKFIHTGEKPYKCEE---CGKAFNWSS---------SLTKHKRFHTRE 420 430 440 450 400 410 420 430 440 450 pF1KE1 RQYACELCGKPFKHPSNLELHKRSHTGEKPFECNICGKHFSQAGNLQTHLRRHSGEKPYI . . :. ::: : :.: ::: ::::::..:. ::: : :...: : :.::::: CCDS42 KPFKCKECGKAFIWSSTLTRHKRIHTGEKPYKCEECGKAFRQSSTLTKHKIIHTGEKPYK 460 470 480 490 500 510 460 470 480 490 500 510 pF1KE1 CEICGKRFAASGDVQRHIIIHSGEKPHLCDICGRGFSNFSNLKEHKKTHTADKVFTCDEC : ::: : : ...: :::: :::. : ::..:..::.: :: :.. :.. :.:: CCDS42 FEECGKAFRQSLTLNKHKIIHSREKPYKCKECGKAFKQFSTLTTHKIIHAGKKLYKCEEC 520 530 540 550 560 570 520 530 540 550 560 570 pF1KE1 GKSFNMQRKLVKHRIRHTGERPYSCSACGKCFGGSGDLRRHVRAHTGEKPYTCEICNKCF ::.:: . .: :.: ::::. :.: ::: : :. :::: : ::::::: :: :.: : CCDS42 GKAFNHSSSLSTHKIIHTGEKSYKCEECGKAFLWSSTLRRHKRIHTGEKPYKCEECGKAF 580 590 600 610 620 630 580 590 600 610 620 630 pF1KE1 TRSAVLRRHKKMHCKAGDESPDVLEELSQAIETSDLEKSQSSDSFSQDTSVTLMPVSVKL ..:..: .::..: .: :.: .: ..: CCDS42 SHSSALAKHKRIH--TG-EKPYKCKECGKAFSNSSTLANHKITHTEEKPYKCKECDKTFK 640 650 660 670 680 690 >-- initn: 2446 init1: 630 opt: 640 Z-score: 431.7 bits: 91.3 E(32554): 1e-17 Smith-Waterman score: 668; 43.6% identity (67.6% similar) in 225 aa overlap (378-602:669-890) 350 360 370 380 390 400 pF1KE1 ASSQSAEEKESEEVVSCENFNCISETERPEDPAALEDQSQTLQSQRQYACELCGKPFKHP . ..: ... : .. : :. : : ::. CCDS42 FSHSSALAKHKRIHTGEKPYKCKECGKAFSNSSTLANHKITHTEEKPYKCKECDKTFKRL 640 650 660 670 680 690 410 420 430 440 450 460 pF1KE1 SNLELHKRSHTGEKPFECNICGKHFSQAGNLQTHLRRHSGEKPYICEICGKRFAASGDVQ :.: :: :.::: ..:. ::: :....:: : :.::::: :: ::: : :... CCDS42 STLTKHKIIHAGEKLYKCEECGKAFNRSSNLTIHKFIHTGEKPYKCEECGKAFNWSSSLT 700 710 720 730 740 750 470 480 490 500 510 520 pF1KE1 RHIIIHSGEKPHLCDICGRGFSNFSNLKEHKKTHTADKVFTCDECGKSFNMQRKLVKHRI .: ::. ::: : ::..: :.: .::. ::..: . :.::::.:. . :.::. CCDS42 KHKRIHTREKPFKCKECGKAFIWSSTLTRHKRIHTGEKPYKCEECGKAFSRSSTLTKHKT 760 770 780 790 800 810 530 540 550 560 570 580 pF1KE1 RHTGERPYSCSACGKCFGGSGDLRRHVRAHTGEKPYTCEICNKCFTRSAVLRRHKKMHCK ::::.::.:. ::: : :. : .: :.::: : :: :.: :..:. : :: .: : CCDS42 IHTGEKPYKCKECGKAFKHSSALAKHKIIHAGEKLYKCEECGKAFNQSSNLTTHKIIHTK 820 830 840 850 860 870 590 600 610 620 630 640 pF1KE1 AGDESPDVLEELSQAIETSDLEKSQSSDSFSQDTSVTLMPVSVKLPVHPVENSVAEFDSH :.:. :: ..: CCDS42 ---EKPSKSEECDKAFIWSSTLTEHKRIHTREKTYKCEECGKAFSQPSHLTTHKRMHTGE 880 890 900 910 920 930 >>CCDS54214.1 ZNF177 gene_id:7730|Hs108|chr19 (481 aa) initn: 2262 init1: 764 opt: 774 Z-score: 523.5 bits: 106.9 E(32554): 7.7e-23 Smith-Waterman score: 774; 46.6% identity (72.9% similar) in 221 aa overlap (365-585:254-474) 340 350 360 370 380 390 pF1KE1 KRLESASKNTLEKASSQSAEEKESEEVVSCENFNCISETERPEDPAALEDQSQTLQSQRQ :...: . . :: .:.. .: ... CCDS54 QIPTGEKGDECSDYGKISPLSVHTKTGSVEEGLECNEHEKTFTDPLSLQNCVRTHSGEMP 230 240 250 260 270 280 400 410 420 430 440 450 pF1KE1 YACELCGKPFKHPSNLELHKRSHTGEKPFECNICGKHFSQAGNLQTHLRRHSGEKPYICE : : ::: : :.:. : ::::::::.::. ::: :::...:..: : :.::::: :. CCDS54 YECSDCGKAFIFQSSLKKHMRSHTGEKPYECDHCGKSFSQSSHLNVHKRTHTGEKPYDCK 290 300 310 320 330 340 460 470 480 490 500 510 pF1KE1 ICGKRFAASGDVQRHIIIHSGEKPHLCDICGRGFSNFSNLKEHKKTHTADKVFTCDECGK ::: :.. ...:.:. :.::::. :. ::..: . :.::.: ..::..: . :..::: CCDS54 ECGKAFTVPSSLQKHVRTHTGEKPYECSDCGKAFIDQSSLKKHTRSHTGEKPYECNQCGK 350 360 370 380 390 400 520 530 540 550 560 570 pF1KE1 SFNMQRKLVKHRIRHTGERPYSCSACGKCFGGSGDLRRHVRAHTGEKPYTCEICNKCFTR ::. :. :. ::::. : :. ::: : .:. :: :::.::::::: : :.: :. CCDS54 SFSTGSYLIVHKRTHTGEKTYECKECGKAFRNSSCLRVHVRTHTGEKPYKCIQCEKAFST 410 420 430 440 450 460 580 590 600 610 620 630 pF1KE1 SAVLRRHKKMHCKAGDESPDVLEELSQAIETSDLEKSQSSDSFSQDTSVTLMPVSVKLPV :. : ::..: CCDS54 STNLIMHKRIHNGQKLHE 470 480 >>CCDS59367.1 ZNF43 gene_id:7594|Hs108|chr19 (803 aa) initn: 4217 init1: 742 opt: 777 Z-score: 522.8 bits: 107.5 E(32554): 8.5e-23 Smith-Waterman score: 789; 32.1% identity (58.9% similar) in 496 aa overlap (130-606:257-740) 100 110 120 130 140 150 pF1KE1 TAQCLQVQNVLSLCHTFLKSATVVQPPGMPCNSTLSLQSTLTPDATCVISENYPPHLLQE :..... .: :: .:.. . .: CCDS59 EECGKVFNWSSRLTTHKKNYTRYKLYKCEECGKAFNKSSILTTHKIIRTGEKF--YKCKE 230 240 250 260 270 280 160 170 180 190 200 210 pF1KE1 CSADAQQNKTLDESHPHASPSVNRHHSAGEISK--QAPDTSDGS----CTELPFKQPNYY :. .:...: : : . :. .. .. : .: . :.: : :. . CCDS59 CAKAFNQSSNLTE-HKKIHPG-EKPYKCEECGKAFNWPSTLTKHKRIHTGEKPYTCEECG 290 300 310 320 330 340 220 230 240 250 260 pF1KE1 YKLRNFYSKQYHK--HAAGPSQERVVEQPFAFSTSTDLTT---VESQPCAVSHSECILES . .: . :: :.: . . .: ::: :..:: .... . :: . CCDS59 KAFNQFSNLTTHKRIHTA-EKFYKCTECGEAFSRSSNLTKHKKIHTEKKPYKCEEC--GK 350 360 370 380 390 270 280 290 300 310 320 pF1KE1 PEHLPSNFLAQPVNDSAPHPESDATCQQPVKQ---MRLKKAIHLKKLNFLKSQKYAEQVS . :.. . .. .. .: . : . . . .. :: . . : . .. . CCDS59 AFKWSSKLTEHKLTHTGEKPYKCEECGKAFNWPSTLTKHNRIHTGEKPY-KCEVCGKAFN 400 410 420 430 440 450 330 340 350 360 370 380 pF1KE1 EPKSDDGLTKRLESASK----NTLEKASSQSAEEKESEEV-VSCENFNCISETERPEDPA . :. ::...: : . :: :.:.. . ... . . ..: . . . CCDS59 QF-SNLTTHKRIHTAEKPYKCEECGKAFSRSSNLTKHKKIHIEKKPYKCEECGKAFKWSS 460 470 480 490 500 510 390 400 410 420 430 440 pF1KE1 ALEDQSQTLQSQRQYACELCGKPFKHPSNLELHKRSHTGEKPFECNICGKHFSQAGNLQT : ... : ... : :: ::: :.: : : ::: ::::::..:. ::: :.:..:: : CCDS59 KLTEHKITHTGEKPYKCEECGKAFNHFSILTKHKRIHTGEKPYKCEECGKAFTQSSNLTT 520 530 540 550 560 570 450 460 470 480 490 500 pF1KE1 HLRRHSGEKPYICEICGKRFAASGDVQRHIIIHSGEKPHLCDICGRGFSNFSNLKEHKKT : . :.::: : :: ::: :. :... : ::.: ::. :. ::..:..::.: .:: CCDS59 HKKIHTGEKFYKCEECGKAFTQSSNLTTHKKIHTGGKPYKCEECGKAFNQFSTLTKHKII 580 590 600 610 620 630 510 520 530 540 550 560 pF1KE1 HTADKVFTCDECGKSFNMQRKLVKHRIRHTGERPYSCSACGKCFGGSGDLRRHVRAHTGE :: .: . :.::::.:. . :.::.: ::::.::.: ::: : :. : : :::: CCDS59 HTEEKPYKCEECGKAFKWSSTLTKHKIIHTGEKPYKCEECGKAFKLSSTLSTHKIIHTGE 640 650 660 670 680 690 570 580 590 600 610 620 pF1KE1 KPYTCEICNKCFTRSAVLRRHKKMHCKAGDESPDVLEELSQAIETSDLEKSQSSDSFSQD ::: :: :.: :.::. : .:::.: .: :.: :: ..:.. : CCDS59 KPYKCEKCGKAFNRSSNLIEHKKIH--TG-EQPYKCEECGKAFNYSSHLNTHKRIHTKEQ 700 710 720 730 740 750 630 640 650 660 670 680 pF1KE1 TSVTLMPVSVKLPVHPVENSVAEFDSHSGGSYCKLRSMIQPHGVSDQEKLSLDPGKLAKP CCDS59 PYKCKECGKAFNQYSNLTTHNKIHTGEKLYKPEDVTVILTTPQTFSNIK 760 770 780 790 800 >>CCDS12413.2 ZNF43 gene_id:7594|Hs108|chr19 (809 aa) initn: 4217 init1: 742 opt: 777 Z-score: 522.7 bits: 107.5 E(32554): 8.5e-23 Smith-Waterman score: 789; 32.1% identity (58.9% similar) in 496 aa overlap (130-606:263-746) 100 110 120 130 140 150 pF1KE1 TAQCLQVQNVLSLCHTFLKSATVVQPPGMPCNSTLSLQSTLTPDATCVISENYPPHLLQE :..... .: :: .:.. . .: CCDS12 EECGKVFNWSSRLTTHKKNYTRYKLYKCEECGKAFNKSSILTTHKIIRTGEKF--YKCKE 240 250 260 270 280 290 160 170 180 190 200 210 pF1KE1 CSADAQQNKTLDESHPHASPSVNRHHSAGEISK--QAPDTSDGS----CTELPFKQPNYY :. .:...: : : . :. .. .. : .: . :.: : :. . CCDS12 CAKAFNQSSNLTE-HKKIHPG-EKPYKCEECGKAFNWPSTLTKHKRIHTGEKPYTCEECG 300 310 320 330 340 220 230 240 250 260 pF1KE1 YKLRNFYSKQYHK--HAAGPSQERVVEQPFAFSTSTDLTT---VESQPCAVSHSECILES . .: . :: :.: . . .: ::: :..:: .... . :: . CCDS12 KAFNQFSNLTTHKRIHTA-EKFYKCTECGEAFSRSSNLTKHKKIHTEKKPYKCEEC--GK 350 360 370 380 390 400 270 280 290 300 310 320 pF1KE1 PEHLPSNFLAQPVNDSAPHPESDATCQQPVKQ---MRLKKAIHLKKLNFLKSQKYAEQVS . :.. . .. .. .: . : . . . .. :: . . : . .. . CCDS12 AFKWSSKLTEHKLTHTGEKPYKCEECGKAFNWPSTLTKHNRIHTGEKPY-KCEVCGKAFN 410 420 430 440 450 460 330 340 350 360 370 380 pF1KE1 EPKSDDGLTKRLESASK----NTLEKASSQSAEEKESEEV-VSCENFNCISETERPEDPA . :. ::...: : . :: :.:.. . ... . . ..: . . . CCDS12 QF-SNLTTHKRIHTAEKPYKCEECGKAFSRSSNLTKHKKIHIEKKPYKCEECGKAFKWSS 470 480 490 500 510 520 390 400 410 420 430 440 pF1KE1 ALEDQSQTLQSQRQYACELCGKPFKHPSNLELHKRSHTGEKPFECNICGKHFSQAGNLQT : ... : ... : :: ::: :.: : : ::: ::::::..:. ::: :.:..:: : CCDS12 KLTEHKITHTGEKPYKCEECGKAFNHFSILTKHKRIHTGEKPYKCEECGKAFTQSSNLTT 530 540 550 560 570 580 450 460 470 480 490 500 pF1KE1 HLRRHSGEKPYICEICGKRFAASGDVQRHIIIHSGEKPHLCDICGRGFSNFSNLKEHKKT : . :.::: : :: ::: :. :... : ::.: ::. :. ::..:..::.: .:: CCDS12 HKKIHTGEKFYKCEECGKAFTQSSNLTTHKKIHTGGKPYKCEECGKAFNQFSTLTKHKII 590 600 610 620 630 640 510 520 530 540 550 560 pF1KE1 HTADKVFTCDECGKSFNMQRKLVKHRIRHTGERPYSCSACGKCFGGSGDLRRHVRAHTGE :: .: . :.::::.:. . :.::.: ::::.::.: ::: : :. : : :::: CCDS12 HTEEKPYKCEECGKAFKWSSTLTKHKIIHTGEKPYKCEECGKAFKLSSTLSTHKIIHTGE 650 660 670 680 690 700 570 580 590 600 610 620 pF1KE1 KPYTCEICNKCFTRSAVLRRHKKMHCKAGDESPDVLEELSQAIETSDLEKSQSSDSFSQD ::: :: :.: :.::. : .:::.: .: :.: :: ..:.. : CCDS12 KPYKCEKCGKAFNRSSNLIEHKKIH--TG-EQPYKCEECGKAFNYSSHLNTHKRIHTKEQ 710 720 730 740 750 760 630 640 650 660 670 680 pF1KE1 TSVTLMPVSVKLPVHPVENSVAEFDSHSGGSYCKLRSMIQPHGVSDQEKLSLDPGKLAKP CCDS12 PYKCKECGKAFNQYSNLTTHNKIHTGEKLYKPEDVTVILTTPQTFSNIK 770 780 790 800 >>CCDS74321.1 ZNF43 gene_id:7594|Hs108|chr19 (818 aa) initn: 4217 init1: 742 opt: 777 Z-score: 522.7 bits: 107.5 E(32554): 8.6e-23 Smith-Waterman score: 789; 32.1% identity (58.9% similar) in 496 aa overlap (130-606:272-755) 100 110 120 130 140 150 pF1KE1 TAQCLQVQNVLSLCHTFLKSATVVQPPGMPCNSTLSLQSTLTPDATCVISENYPPHLLQE :..... .: :: .:.. . .: CCDS74 EECGKVFNWSSRLTTHKKNYTRYKLYKCEECGKAFNKSSILTTHKIIRTGEKF--YKCKE 250 260 270 280 290 160 170 180 190 200 210 pF1KE1 CSADAQQNKTLDESHPHASPSVNRHHSAGEISK--QAPDTSDGS----CTELPFKQPNYY :. .:...: : : . :. .. .. : .: . :.: : :. . CCDS74 CAKAFNQSSNLTE-HKKIHPG-EKPYKCEECGKAFNWPSTLTKHKRIHTGEKPYTCEECG 300 310 320 330 340 350 220 230 240 250 260 pF1KE1 YKLRNFYSKQYHK--HAAGPSQERVVEQPFAFSTSTDLTT---VESQPCAVSHSECILES . .: . :: :.: . . .: ::: :..:: .... . :: . CCDS74 KAFNQFSNLTTHKRIHTA-EKFYKCTECGEAFSRSSNLTKHKKIHTEKKPYKCEEC--GK 360 370 380 390 400 410 270 280 290 300 310 320 pF1KE1 PEHLPSNFLAQPVNDSAPHPESDATCQQPVKQ---MRLKKAIHLKKLNFLKSQKYAEQVS . :.. . .. .. .: . : . . . .. :: . . : . .. . CCDS74 AFKWSSKLTEHKLTHTGEKPYKCEECGKAFNWPSTLTKHNRIHTGEKPY-KCEVCGKAFN 420 430 440 450 460 470 330 340 350 360 370 380 pF1KE1 EPKSDDGLTKRLESASK----NTLEKASSQSAEEKESEEV-VSCENFNCISETERPEDPA . :. ::...: : . :: :.:.. . ... . . ..: . . . CCDS74 QF-SNLTTHKRIHTAEKPYKCEECGKAFSRSSNLTKHKKIHIEKKPYKCEECGKAFKWSS 480 490 500 510 520 530 390 400 410 420 430 440 pF1KE1 ALEDQSQTLQSQRQYACELCGKPFKHPSNLELHKRSHTGEKPFECNICGKHFSQAGNLQT : ... : ... : :: ::: :.: : : ::: ::::::..:. ::: :.:..:: : CCDS74 KLTEHKITHTGEKPYKCEECGKAFNHFSILTKHKRIHTGEKPYKCEECGKAFTQSSNLTT 540 550 560 570 580 590 450 460 470 480 490 500 pF1KE1 HLRRHSGEKPYICEICGKRFAASGDVQRHIIIHSGEKPHLCDICGRGFSNFSNLKEHKKT : . :.::: : :: ::: :. :... : ::.: ::. :. ::..:..::.: .:: CCDS74 HKKIHTGEKFYKCEECGKAFTQSSNLTTHKKIHTGGKPYKCEECGKAFNQFSTLTKHKII 600 610 620 630 640 650 510 520 530 540 550 560 pF1KE1 HTADKVFTCDECGKSFNMQRKLVKHRIRHTGERPYSCSACGKCFGGSGDLRRHVRAHTGE :: .: . :.::::.:. . :.::.: ::::.::.: ::: : :. : : :::: CCDS74 HTEEKPYKCEECGKAFKWSSTLTKHKIIHTGEKPYKCEECGKAFKLSSTLSTHKIIHTGE 660 670 680 690 700 710 570 580 590 600 610 620 pF1KE1 KPYTCEICNKCFTRSAVLRRHKKMHCKAGDESPDVLEELSQAIETSDLEKSQSSDSFSQD ::: :: :.: :.::. : .:::.: .: :.: :: ..:.. : CCDS74 KPYKCEKCGKAFNRSSNLIEHKKIH--TG-EQPYKCEECGKAFNYSSHLNTHKRIHTKEQ 720 730 740 750 760 630 640 650 660 670 680 pF1KE1 TSVTLMPVSVKLPVHPVENSVAEFDSHSGGSYCKLRSMIQPHGVSDQEKLSLDPGKLAKP CCDS74 PYKCKECGKAFNQYSNLTTHNKIHTGEKLYKPEDVTVILTTPQTFSNIK 770 780 790 800 810 >>CCDS47357.2 ZFP62 gene_id:643836|Hs108|chr5 (867 aa) initn: 3776 init1: 727 opt: 776 Z-score: 521.7 bits: 107.5 E(32554): 9.7e-23 Smith-Waterman score: 776; 35.7% identity (66.3% similar) in 350 aa overlap (242-585:38-382) 220 230 240 250 260 270 pF1KE1 YYYKLRNFYSKQYHKHAAGPSQERVVEQPFAFSTSTDLTTVESQPCAVSHSECILESPEH :.: . . ...... . . . . ::.: CCDS47 DTCVWDSKVENQQKKPVENRMKEDKSSIREAISKAKSTANIKTEQEGEASEKSLHLSPQH 10 20 30 40 50 60 280 290 300 310 320 pF1KE1 LPSNFL--AQPVNDSAPHPESDATCQQPVKQMRLKKAIHLKKLNFL-KSQKYAEQVSEPK . . . .: .... . :. . : :.. . . .:.: . :: :: .. . : CCDS47 ITHQTMPIGQRGSEQGKRVENINGTSYPSLQQKTNAVKKLHKCDECGKSFKYNSRLVQHK 70 80 90 100 110 120 330 340 350 360 370 380 pF1KE1 SDDGLTKRLESAS-KNTLEKASSQSAEEK--ESEEVVSCENFNCISETERPEDPAALEDQ :: : . .:....:: .... .:. .::. : . . ..: .. CCDS47 IMHTGEKRYECDDCGGTFRSSSSLRVHKRIHTGEKPYKCEE--C---GKAYMSYSSLINH 130 140 150 160 170 180 390 400 410 420 430 440 pF1KE1 SQTLQSQRQYACELCGKPFKHPSNLELHKRSHTGEKPFECNICGKHFSQAGNLQTHLRRH ..: ..... :. ::: :.. : :. ::: ::::::.::. ::: : ....:..: : : CCDS47 KSTHSGEKNCKCDECGKSFNYSSVLDQHKRIHTGEKPYECGECGKAFRNSSGLRVHKRIH 190 200 210 220 230 240 450 460 470 480 490 500 pF1KE1 SGEKPYICEICGKRFAASGDVQRHIIIHSGEKPHLCDICGRGFSNFSNLKEHKKTHTADK .::::: :.:::: :. :. .. : ::.::::. :: ::..: . .: .::. : .:: CCDS47 TGEKPYECDICGKTFSNSSGLRVHKRIHTGEKPYECDECGKAFITCRTLLNHKSIHFGDK 250 260 270 280 290 300 510 520 530 540 550 560 pF1KE1 VFTCDECGKSFNMQRKLVKHRIRHTGERPYSCSACGKCFGGSGDLRRHVRAHTGEKPYTC . :::: ::::.. :..:.. ::::.:: :. ::: : .:. : : : ::::::: : CCDS47 PYKCDECEKSFNYSSLLIQHKVIHTGEKPYECDECGKAFRNSSGLIVHKRIHTGEKPYKC 310 320 330 340 350 360 570 580 590 600 610 620 pF1KE1 EICNKCFTRSAVLRRHKKMHCKAGDESPDVLEELSQAIETSDLEKSQSSDSFSQDTSVTL ..:.: :. :. : ::..: CCDS47 DVCGKAFSYSSGLAVHKSIHPGKKAHECKECGKSFSYNSLLLQHRTIHTGERPYVCDVCG 370 380 390 400 410 420 >-- initn: 3638 init1: 658 opt: 668 Z-score: 451.6 bits: 94.5 E(32554): 7.8e-19 Smith-Waterman score: 680; 41.2% identity (72.1% similar) in 204 aa overlap (385-587:405-608) 360 370 380 390 400 410 pF1KE1 EKESEEVVSCENFNCISETERPEDPAALEDQSQTLQS-QRQYACELCGKPFKHPSNLELH : .:... .: :.:..::: :.. ..:..: CCDS47 LAVHKSIHPGKKAHECKECGKSFSYNSLLLQHRTIHTGERPYVCDVCGKTFRNNAGLKVH 380 390 400 410 420 430 420 430 440 450 460 470 pF1KE1 KRSHTGEKPFECNICGKHFSQAGNLQTHLRRHSGEKPYICEICGKRFAASGDVQRHIIIH .: ::::::..:..::: . . ..:..: : ::::: : : : : :. ...: :: CCDS47 RRLHTGEKPYKCDVCGKAYISRSSLKNHKGIHLGEKPYKCSYCEKSFNYSSALEQHKRIH 440 450 460 470 480 490 480 490 500 510 520 530 pF1KE1 SGEKPHLCDICGRGFSNFSNLKEHKKTHTADKVFTCDECGKSFNMQRKLVKHRIRHTGER . ::: :: ::..: : :.:: ::. ::... . :.::::.. .:..:. : ::. CCDS47 TREKPFGCDECGKAFRNNSGLKVHKRIHTGERPYKCEECGKAYISLSSLINHKSVHPGEK 500 510 520 530 540 550 540 550 560 570 580 590 pF1KE1 PYSCSACGKCFGGSGDLRRHVRAHTGEKPYTCEICNKCFTRSAVLRRHKKMHCKAGDESP :..:. : : : : : ..: ::::: :..:.: :. ...: .:...: . CCDS47 PFKCDECEKAFITYRTLTNHKKVHLGEKPYKCDVCEKSFNYTSLLSQHRRVHTREKPYEC 560 570 580 590 600 610 600 610 620 630 640 650 pF1KE1 DVLEELSQAIETSDLEKSQSSDSFSQDTSVTLMPVSVKLPVHPVENSVAEFDSHSGGSYC CCDS47 DRCEKVFRNNSSLKVHKRIHTGERPYECDVCGKAYISHSSLINHKSTHPGRTPHTCDECG 620 630 640 650 660 670 >-- initn: 689 init1: 583 opt: 641 Z-score: 434.1 bits: 91.2 E(32554): 7.4e-18 Smith-Waterman score: 661; 40.0% identity (67.8% similar) in 230 aa overlap (367-596:612-838) 340 350 360 370 380 390 pF1KE1 LESASKNTLEKASSQSAEEKESEEVVSCENFNCISETERPEDPAALEDQSQTLQSQRQYA ..: . .. ..:. ... ..: : CCDS47 KPYKCDVCEKSFNYTSLLSQHRRVHTREKPYECDRCEKVFRNNSSLKVHKRIHTGERPYE 590 600 610 620 630 640 400 410 420 430 440 450 pF1KE1 CELCGKPFKHPSNLELHKRSHTGEKPFECNICGKHFSQAGNLQTHLRRHSGEKPYICEIC :..::: . :.: :: .: :. : :. ::: : .. .: .: : : ::::. : : CCDS47 CDVCGKAYISHSSLINHKSTHPGRTPHTCDECGKAFFSSRTLISHKRVHLGEKPFKCVEC 650 660 670 680 690 700 460 470 480 490 500 510 pF1KE1 GKRFAASGDVQRHIIIHSGEKPHLCDICGRGFSNFSNLKEHKKTHTADKVFTCDECGKSF :: :. :. ...: ::.::::..:: ::..: : :.: ::. ::..: . ::::::.. CCDS47 GKSFSYSSLLSQHKRIHTGEKPYVCDRCGKAFRNSSGLTVHKRIHTGEKPYECDECGKAY 710 720 730 740 750 760 520 530 540 550 560 570 pF1KE1 NMQRKLVKHRIRHTGERPYSCSACGKCFGGSGDLRRHVRAHTGEKPYTCEICNKCFTRSA . .:..:. : :..::.: ::: :. . : .: : :::.::: :. :.: :. . CCDS47 ISHSSLINHKSVHQGKQPYNCE-CGKSFNYRSVLDQHKRIHTGKKPYRCNECGKAFNIRS 770 780 790 800 810 820 580 590 600 610 620 630 pF1KE1 VLRRHKKMHCKAGDESPDVLEELSQAIETSDLEKSQSSDSFSQDTSVTLMPVSVKLPVHP : .::. : .:.:: .:. CCDS47 NLTKHKRTH--TGEESLNVIYVGSYSGTSQKRTYEGGNALDGGRMRMPL 830 840 850 860 765 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 19:01:12 2016 done: Mon Nov 7 19:01:12 2016 Total Scan time: 3.700 Total Display time: 0.160 Function used was FASTA [36.3.4 Apr, 2011]