FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5846, 485 aa 1>>>pF1KB5846 485 - 485 aa - 485 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.9247+/-0.00113; mu= 10.6555+/- 0.066 mean_var=198.0170+/-40.124, 0's: 0 Z-trim(108.5): 939 B-trim: 0 in 0/53 Lambda= 0.091143 statistics sampled from 9240 (10268) to 9240 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.671), E-opt: 0.2 (0.315), width: 16 Scan time: 3.320 The best scores are: opt bits E(32554) CCDS4643.1 ZNF165 gene_id:7718|Hs108|chr6 ( 485) 3323 450.3 2.2e-126 CCDS5681.1 ZSCAN21 gene_id:7589|Hs108|chr7 ( 473) 1090 156.6 5.3e-38 CCDS4647.1 ZKSCAN4 gene_id:387032|Hs108|chr6 ( 545) 1003 145.3 1.6e-34 CCDS14649.1 ZNF449 gene_id:203523|Hs108|chrX ( 518) 904 132.2 1.3e-30 CCDS45852.1 ZNF397 gene_id:84307|Hs108|chr18 ( 534) 799 118.4 1.9e-26 CCDS47944.1 ZNF251 gene_id:90987|Hs108|chr8 ( 671) 800 118.7 2e-26 CCDS43619.1 ZNF3 gene_id:7551|Hs108|chr7 ( 446) 785 116.5 6.1e-26 CCDS11067.1 ZFP3 gene_id:124961|Hs108|chr17 ( 502) 785 116.5 6.5e-26 CCDS43429.1 ZNF391 gene_id:346157|Hs108|chr6 ( 358) 781 115.8 7.6e-26 CCDS12501.1 ZNF383 gene_id:163087|Hs108|chr19 ( 475) 779 115.7 1.1e-25 CCDS6398.1 GLI4 gene_id:2738|Hs108|chr8 ( 376) 774 114.9 1.5e-25 CCDS4645.1 ZKSCAN8 gene_id:7745|Hs108|chr6 ( 578) 774 115.2 1.9e-25 CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 774 115.2 2e-25 CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 774 115.2 2.1e-25 CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 774 115.3 2.1e-25 CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 774 115.3 2.2e-25 CCDS58688.1 ZNF211 gene_id:10520|Hs108|chr19 ( 503) 766 114.1 3.7e-25 CCDS46169.1 ZNF665 gene_id:79788|Hs108|chr19 ( 678) 768 114.5 3.7e-25 CCDS58687.1 ZNF211 gene_id:10520|Hs108|chr19 ( 555) 766 114.1 3.9e-25 CCDS12957.1 ZNF211 gene_id:10520|Hs108|chr19 ( 564) 766 114.1 4e-25 CCDS62707.1 ZNF180 gene_id:7733|Hs108|chr19 ( 665) 767 114.3 4e-25 CCDS12956.1 ZNF211 gene_id:10520|Hs108|chr19 ( 577) 766 114.1 4e-25 CCDS62708.1 ZNF180 gene_id:7733|Hs108|chr19 ( 667) 767 114.3 4e-25 CCDS12639.1 ZNF180 gene_id:7733|Hs108|chr19 ( 692) 767 114.4 4.1e-25 CCDS74468.1 ZNF211 gene_id:10520|Hs108|chr19 ( 616) 766 114.2 4.2e-25 CCDS58686.1 ZNF211 gene_id:10520|Hs108|chr19 ( 629) 766 114.2 4.3e-25 CCDS34357.1 ZNF311 gene_id:282890|Hs108|chr6 ( 666) 766 114.2 4.4e-25 CCDS69562.1 ZNF34 gene_id:80778|Hs108|chr8 ( 539) 764 113.8 4.6e-25 CCDS47945.1 ZNF34 gene_id:80778|Hs108|chr8 ( 560) 764 113.8 4.7e-25 CCDS76895.1 ZNF23 gene_id:7571|Hs108|chr16 ( 585) 763 113.7 5.3e-25 CCDS10900.1 ZNF23 gene_id:7571|Hs108|chr16 ( 643) 763 113.8 5.7e-25 CCDS77368.1 ZNF773 gene_id:374928|Hs108|chr19 ( 441) 758 112.9 7e-25 CCDS33134.1 ZNF773 gene_id:374928|Hs108|chr19 ( 442) 758 112.9 7.1e-25 CCDS12414.2 ZNF681 gene_id:148213|Hs108|chr19 ( 645) 760 113.4 7.5e-25 CCDS12440.2 ZNF792 gene_id:126375|Hs108|chr19 ( 632) 759 113.3 8.1e-25 CCDS12959.2 ZNF551 gene_id:90233|Hs108|chr19 ( 670) 759 113.3 8.4e-25 CCDS75904.1 ZNF79 gene_id:7633|Hs108|chr9 ( 364) 754 112.3 9e-25 CCDS10329.2 ZSCAN2 gene_id:54993|Hs108|chr15 ( 614) 757 113.0 9.5e-25 CCDS233.1 ZNF436 gene_id:80818|Hs108|chr1 ( 470) 755 112.6 9.6e-25 CCDS69664.1 ZNF79 gene_id:7633|Hs108|chr9 ( 474) 754 112.4 1.1e-24 CCDS55282.1 ZNF250 gene_id:58500|Hs108|chr8 ( 555) 755 112.7 1.1e-24 CCDS34972.1 ZNF250 gene_id:58500|Hs108|chr8 ( 560) 755 112.7 1.1e-24 CCDS6871.1 ZNF79 gene_id:7633|Hs108|chr9 ( 498) 754 112.5 1.1e-24 CCDS6437.1 ZNF16 gene_id:7564|Hs108|chr8 ( 682) 756 112.9 1.1e-24 CCDS33130.1 ZNF543 gene_id:125919|Hs108|chr19 ( 600) 755 112.7 1.1e-24 CCDS2718.2 ZNF35 gene_id:7584|Hs108|chr3 ( 527) 752 112.2 1.4e-24 CCDS82335.1 ZNF529 gene_id:57711|Hs108|chr19 ( 458) 751 112.0 1.4e-24 CCDS12491.1 ZNF565 gene_id:147929|Hs108|chr19 ( 499) 751 112.1 1.4e-24 CCDS54256.1 ZNF529 gene_id:57711|Hs108|chr19 ( 563) 751 112.1 1.6e-24 CCDS32973.1 ZNF93 gene_id:81931|Hs108|chr19 ( 620) 750 112.1 1.8e-24 >>CCDS4643.1 ZNF165 gene_id:7718|Hs108|chr6 (485 aa) initn: 3323 init1: 3323 opt: 3323 Z-score: 2382.4 bits: 450.3 E(32554): 2.2e-126 Smith-Waterman score: 3323; 99.4% identity (99.6% similar) in 485 aa overlap (1-485:1-485) 10 20 30 40 50 60 pF1KB5 MATEPKKAAAQNSPEDEGLLIVKIGEEEFIHGQDTCLQRSELLKQELCRQLFRQFCYQDS :::::::::::::::::::::::: ::::::::::::::::::::::::::::::::::: CCDS46 MATEPKKAAAQNSPEDEGLLIVKIEEEEFIHGQDTCLQRSELLKQELCRQLFRQFCYQDS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 PGPREALSRLRELCCQWLKPEIHTKEQILELLVLEQFLTILPGDLQAWVHEHYPESGEEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 PGPREALSRLRELCCQWLKPEIHTKEQILELLVLEQFLTILPGDLQAWVHEHYPESGEEA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 VTILEDLERGTDEAVLQVQAHEHGQEIFQKKVSPPGPALNVKLQPVETKAHFDSSEPQLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 VTILEDLERGTDEAVLQVQAHEHGQEIFQKKVSPPGPALNVKLQPVETKAHFDSSEPQLL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 WDCDNESENSRSMPKLEIFEKIESQRIISGRISGYISEASGESQDICKSAGRVKRQWEKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 WDCDNESENSRSMPKLEIFEKIESQRIISGRISGYISEASGESQDICKSAGRVKRQWEKE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 SGESQRLSSAQDEGFGKILTHKNTVRGEIISHDGCERRLNLNSNEFTHQKSCKHGTCDQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 SGESQRLSSAQDEGFGKILTHKNTVRGEIISHDGCERRLNLNSNEFTHQKSCKHGTCDQS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 SKWNSDFINHQIIYAGEKNHQYGKSFKSPKLAKHAAVFSGDKTHQCNECGKAFRHSSKLA ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 FKWNSDFINHQIIYAGEKNHQYGKSFKSPKLAKHAAVFSGDKTHQCNECGKAFRHSSKLA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 RHQRIQTGERCYECNECGKSFAESSDLTRHRRIHTGERPFGCKECGRAFNLNSHLIRHQR :::::.:::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 RHQRIHTGERCYECNECGKSFAESSDLTRHRRIHTGERPFGCKECGRAFNLNSHLIRHQR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 IHTREKPYECSECGKTFRVSSHLIRHFRIHTGEKPYECSECGRAFSQSSNLSQHQRIHMR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 IHTREKPYECSECGKTFRVSSHLIRHFRIHTGEKPYECSECGRAFSQSSNLSQHQRIHMR 430 440 450 460 470 480 pF1KB5 ENLLM ::::: CCDS46 ENLLM >>CCDS5681.1 ZSCAN21 gene_id:7589|Hs108|chr7 (473 aa) initn: 2407 init1: 578 opt: 1090 Z-score: 795.7 bits: 156.6 E(32554): 5.3e-38 Smith-Waterman score: 1140; 41.2% identity (67.8% similar) in 478 aa overlap (14-481:17-469) 10 20 30 40 50 pF1KB5 MATEPKKAAAQNSPEDE-GLLIVKIGEEEFIHGQDTCLQRSELLKQ-ELCRQLFRQF :... : :.::. :.: .... : . :. :: :::: CCDS56 MMTKVLGMAPVLGPRPPQEQVGPLMVKVEEKE---------EKGKYLPSLEMFRQRFRQF 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 CYQDSPGPREALSRLRELCCQWLKPEIHTKEQILELLVLEQFLTILPGDLQAWVHEHYPE :.:.::::::::.:: :::.::.::::::::::::::::::::::: .:::::.:: :: CCDS56 GYHDTPGPREALSQLRVLCCEWLRPEIHTKEQILELLVLEQFLTILPQELQAWVQEHCPE 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 SGEEAVTILEDLERGTDEAVLQVQAHEHGQEIFQKKVSPPGPAL----NVKLQPVETKAH :.:::::.:::::: :: ::.. . :. .:.: : : ... ::.::. . CCDS56 SAEEAVTLLEDLERELDEPGHQVSTPPNEQKPVWEKISSSGTAKESPSSMQPQPLETSHK 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 FDSSEPQLLWDCDNESENSRSMPKLEIFEKIESQRIISGRISGYISEASGESQDICKSAG ..: : . . .:.: ... :.. . ... . . .: ::: : . :: . CCDS56 YESWGPLYIQESGEEQEFAQDPRKVRDCRLSTQHEESADEQKG--SEAEGLKGDIISV-- 180 190 200 210 220 240 250 260 270 280 290 pF1KB5 RVKRQWEKESGESQRLSSAQDEGFGKILTHKNTVRGEIISHDGCERRLNLNSNEFTHQKS . . . : : : .. ...: : . .. .: : .. .. .. CCDS56 -IIANKPEASLERQCVNLENEKGTKPPLQEAGSKKG----------RESVPTKPTPGERR 230 240 250 260 270 300 310 320 330 340 pF1KB5 CKHGTCDQSSKWNSDFINHQIIYAGEKNH---QYGKSFK-SPKLAKHAAVFSGDKTHQCN . : .. . .:.. .:. ..::: . . ::.:. : .:. : . :. ..: CCDS56 YICAECGKAFSNSSNLTKHRRTHTGEKPYVCTKCGKAFSHSSNLTLHYRTHLVDRPYDC- 280 290 300 310 320 330 350 360 370 380 390 400 pF1KB5 ECGKAFRHSSKLARHQRIQTGERCYECNECGKSFAESSDLTRHRRIHTGERPFGCKECGR .::::: .:: : .:::..: : :.:..:::.:. ...: :: ::::::.:. :.:::. CCDS56 KCGKAFGQSSDLLKHQRMHTEEAPYQCKDCGKAFSGKGSLIRHYRIHTGEKPYQCNECGK 340 350 360 370 380 390 410 420 430 440 450 460 pF1KB5 AFNLNSHLIRHQRIHTREKPYECSECGKTFRVSSHLIRHFRIHTGEKPYECSECGRAFSQ .:. .. : :::.:: ::::.:.::::.: ::.. .: ::::::::: : .::..: . CCDS56 SFSQHAGLSSHQRLHTGEKPYKCKECGKAFNHSSNFNKHHRIHTGEKPYWCHHCGKTFCS 400 410 420 430 440 450 470 480 pF1KB5 SSNLSQHQRIHMRENLLM .::::.:::.: : CCDS56 KSNLSKHQRVHTGEGEAP 460 470 >>CCDS4647.1 ZKSCAN4 gene_id:387032|Hs108|chr6 (545 aa) initn: 1188 init1: 809 opt: 1003 Z-score: 733.2 bits: 145.3 E(32554): 1.6e-34 Smith-Waterman score: 1099; 41.9% identity (64.6% similar) in 497 aa overlap (1-483:1-459) 10 20 30 40 50 pF1KB5 MATEPKKAAAQN--SPEDE-GLLIVKIGEEE----FIHGQDTCLQRSELLKQELCRQLFR :: ::.: :: . : ::. ::: ::. .:: . . : : : :: :: CCDS46 MAREPRKNAALDAQSAEDQTGLLTVKVEKEEASALTAEVRAPC---SPARGPERSRQRFR 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 QFCYQDSPGPREALSRLRELCCQWLKPEIHTKEQILELLVLEQFLTILPGDLQAWVHEHY : : .. ::::::::::::: :::.::.:.:::::::::::::::::::.::.::.:.. CCDS46 GFRYPEAAGPREALSRLRELCGQWLQPEMHSKEQILELLVLEQFLTILPGNLQSWVREQH 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 PESGEEAVTILEDLERGTDEAVLQVQAHEHGQEIFQKKV---SPPGPALNVKLQPVETKA ::::::.:..:: ::: :: . :: . ..:::.. :. . . . . ::... CCDS46 PESGEEVVVLLEYLERQLDEPAPQVPVGDQGQELLCCKMALLTQTQGSQSSQCQPMKALF 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 HFDSSEPQLLWDCDNESENSRSMPKLEIFEKIESQRIISGRISGYISEASGESQDICKSA . .: : : : ..: : . . ....:.. :.. . .:. : CCDS46 KHESLGSQPLHD------RVLQVPGLAQGGCCREDAMVASRLTPG-SQGLLKMEDV---A 180 190 200 210 220 240 250 260 270 280 pF1KB5 GRVKRQWEKESGESQRLSSAQDEGFGKILTHKNTVR--GEIISHDGCERRLNLNSN--EF . : . .:.... .:: : .:.. : ::: ... : : .. : CCDS46 LTLTPGWTQL--DSSQVNLYRDE---KQENHSSLVSLGGEIQTKS---RDLPPVKKLPEK 230 240 250 260 270 290 300 310 320 330 340 pF1KB5 THQKSCKHGTCDQSSKWNSDFINHQIIYAGEKNHQYGKSFKSPKLAKHAAVFSGDKTHQC : : : : : . :: .: ..: :. .. : : :.. : : CCDS46 EHGKIC-HLREDIA----------QIPTHAEAGEQEGRLQRKQKNAI------GSRRHYC 280 290 300 310 320 350 360 370 380 390 400 pF1KB5 NECGKAFRHSSKLARHQRIQTGERCYECNECGKSFAESSDLTRHRRIHTGERPFGCKECG .::::.: .:: :..:.::.:::. :::..:::.: :: :. :.:.::::.:. :.::: CCDS46 HECGKSFAQSSGLTKHRRIHTGEKPYECEDCGKTFIGSSALVIHQRVHTGEKPYECEECG 330 340 350 360 370 380 410 420 430 440 450 460 pF1KB5 RAFNLNSHLIRHQRIHTREKPYECSECGKTFRVSSHLIRHFRIHTGEKPYECSECGRAFS ..:. .:.::.::: :: ::::::..::::: : :..: .::::::::.:. ::.:: CCDS46 KVFSHSSNLIKHQRTHTGEKPYECDDCGKTFSQSCSLLEHHKIHTGEKPYQCNMCGKAFR 390 400 410 420 430 440 470 480 pF1KB5 QSSNLSQHQRIHMRENLLM ..:.: .::::: .:. CCDS46 RNSHLLRHQRIHGDKNVQNPEHGESWESQGRTESQWENTEAPVSYKCNECERSFTRNRSL 450 460 470 480 490 500 >>CCDS14649.1 ZNF449 gene_id:203523|Hs108|chrX (518 aa) initn: 2821 init1: 537 opt: 904 Z-score: 663.1 bits: 132.2 E(32554): 1.3e-30 Smith-Waterman score: 936; 37.1% identity (64.7% similar) in 456 aa overlap (46-481:27-460) 20 30 40 50 60 70 pF1KB5 DEGLLIVKIGEEEFIHGQDTCLQRSELLKQELCRQLFRQFCYQDSPGPREALSRLRELCC :. :: :::: :... ::.::...: :::: CCDS14 MAVALGCAIQASLNQGSVFQEYDTDCEVFRQRFRQFQYREAAGPHEAFNKLWELCC 10 20 30 40 50 80 90 100 110 120 130 pF1KB5 QWLKPEIHTKEQILELLVLEQFLTILPGDLQAWVHEHYPESGEEAVTILEDLERGTDEAV :::::....:::::::::::::::::: ....::.:: ::. :..:...:::.: . CCDS14 QWLKPKMRSKEQILELLVLEQFLTILPTEIETWVREHCPENRERVVSLIEDLQRELEIPE 60 70 80 90 100 110 140 150 160 170 180 pF1KB5 LQVQAHEHGQEIFQKKVS---PP-----GPALNV----KLQPVETKAHFDSSEPQLLW-- ::. :. : . . :: .:::.: . :: ... :.: . CCDS14 QQVDMHDMLLEELAPVGTAHIPPTMHLESPALQVMGPAQEAPVAEAWIPQAGPPELNYGA 120 130 140 150 160 170 190 200 210 220 230 pF1KB5 --DCDNESENSRSMPKLEIFEKIESQRIISGRISGYISEA--SGESQDICKSAGRVKRQW .:.: . . .:::.. ..:. : ...: : : ... : .. . CCDS14 TGECQNFLDPGYPLPKLDMNFSLEN------REEPWVKELQDSKEMKQLLDS--KIGFEI 180 190 200 210 220 240 250 260 270 280 290 pF1KB5 EKESGESQRLSSAQDEGFGKILTHK-NTVRGEIISHDGCERRLNLNSNEFTHQKSCKHGT :. :. .. .. . :.: . :...: :...: ..:... : .. . CCDS14 GIENEEDTSKQKKMETMYPFIVTLEGNALQGPILQKD----YVQLENQWETPPEDLQ--- 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB5 CDQSSKWNSDFINHQIIYAGEKNHQYGKSFKSPKLAK-HAAVFSGDKTHQCNECGKAFRH : .. ....: :: .. .... : : : :.: :.: .::: : . CCDS14 TDLAK-----LVDQQNPTLGETPEN--SNLEEPLNPKPHKKKSPGEKPHRCPQCGKCFAR 290 300 310 320 330 360 370 380 390 400 410 pF1KB5 SSKLARHQRIQTGERCYECNECGKSFAESSDLTRHRRIHTGERPFGCKECGRAFNLNSHL .:.:. ::::..::. ..: :::: : .:::: ::.:.::::::. : : . :. ::: CCDS14 KSQLTGHQRIHSGEEPHKCPECGKRFLRSSDLYRHQRLHTGERPYECTVCKKRFTRRSHL 340 350 360 370 380 390 420 430 440 450 460 470 pF1KB5 IRHQRIHTREKPYECSECGKTFRVSSHLIRHFRIHTGEKPYECSECGRAFSQSSNLSQHQ : ::: :..:. :.: ::::.: .: : ::.. ::::::..: .::..::. . :. :: CCDS14 IGHQRTHSEEETYKCLECGKSFCHGSSLKRHLKTHTGEKPHRCHNCGKSFSRLTALTLHQ 400 410 420 430 440 450 480 pF1KB5 RIHMRENLLM : : .: CCDS14 RTHTEERPFKCNYCGKSFRQRPSLVIHLRIHTGEKPYKCTHCSKSFRQRAGLIMHQVTHF 460 470 480 490 500 510 >>CCDS45852.1 ZNF397 gene_id:84307|Hs108|chr18 (534 aa) initn: 1956 init1: 736 opt: 799 Z-score: 588.3 bits: 118.4 E(32554): 1.9e-26 Smith-Waterman score: 1322; 47.5% identity (69.3% similar) in 486 aa overlap (11-481:14-478) 10 20 30 40 50 pF1KB5 MATEPKKAAAQNSPEDEGLLIVKIGEEEFIHGQDTCLQRSELLKQELCRQLFRQFCY :. ::.: :..::. :..: . . : ::: :: ::.::: CCDS45 MAVESGVISTLIPQDPPEQE-LILVKV-EDNFSWDEKFKQNGSTQSCQELFRQQFRKFCY 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 QDSPGPREALSRLRELCCQWLKPEIHTKEQILELLVLEQFLTILPGDLQAWVHEHYPESG :..::::::::::.::: ::: ::.::::::::::::::::.::: .:: ::..: :::: CCDS45 QETPGPREALSRLQELCYQWLMPELHTKEQILELLVLEQFLSILPEELQIWVQQHNPESG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 EEAVTILEDLERGTDEAVLQVQAHEHGQEIFQKKVS---PPGPALNVKLQPVETKAHFDS :::::.:::::: :. :: : .: . : .. . ...:::..:. . : CCDS45 EEAVTLLEDLEREFDDPGQQVPASPQGPAVPWKDLTCLRASQESTDIHLQPLKTQ--LKS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 SEPQLLWDCDNESENSRSMPKLEIFEKIESQRIISGRISGYISEASGESQDICKSAGRVK .: : : :::.. : : :. .:: . . ::: ::. . CCDS45 WKPCLSPKSD--CENSETATKEGISEE-KSQGLPQEPSFRGISE--HESNLV-------- 180 190 200 210 220 240 250 260 270 280 290 pF1KB5 RQWEKESGESQRLSSAQDEG-FGKIL-THKNTVRGEIISHDGCERRLNLNSNEFTHQK-- :.. :. ...: : .. : :.... :.:. . .. .: :: : :... . :: CCDS45 --WKQGSATGEKLRSPSQGGSFSQVIFTNKSLGKRDL--YDEAERCLILTTDSIMCQKVP 230 240 250 260 270 300 310 320 330 340 pF1KB5 ----SCKHGTCDQSSKWNSDFINHQIIYAGEKNH---QYGKSFK-SPKLAKHAAVFSGDK . .: .: : .:.. .:: :..::: . : ::.:. : : . ::.: CCDS45 PEERPYRCDVCGHSFKQHSSLTQHQRIHTGEKPYKCNQCGKAFSLRSYLIIHQRIHSGEK 280 290 300 310 320 330 350 360 370 380 390 400 pF1KB5 THQCNECGKAFRHSSKLARHQRIQTGERCYECNECGKSFAESSDLTRHRRIHTGERPFGC ...:.:::::: .:: : ::..:.:::. .::::::.:..:: : :.::::::.:. : CCDS45 AYECSECGKAFNQSSALIRHRKIHTGEKACKCNECGKAFSQSSYLIIHQRIHTGEKPYEC 340 350 360 370 380 390 410 420 430 440 450 460 pF1KB5 KECGRAFNLNSHLIRHQRIHTREKPYECSECGKTFRVSSHLIRHFRIHTGEKPYECSECG .:::..:. .:.::::::::: :.::::.::::.:: ::.:: : :::.::::::::::: CCDS45 NECGKTFSQSSKLIRHQRIHTGERPYECNECGKAFRQSSELITHQRIHSGEKPYECSECG 400 410 420 430 440 450 470 480 pF1KB5 RAFSQSSNLSQHQRIHMRENLLM .::: :::: .::::: : CCDS45 KAFSLSSNLIRHQRIHSGEEPYQCNECGKTFKRSSALVQHQRIHSGDEAYICNECGKAFR 460 470 480 490 500 510 >>CCDS47944.1 ZNF251 gene_id:90987|Hs108|chr8 (671 aa) initn: 4560 init1: 727 opt: 800 Z-score: 587.9 bits: 118.7 E(32554): 2e-26 Smith-Waterman score: 822; 44.7% identity (73.5% similar) in 275 aa overlap (225-481:212-486) 200 210 220 230 240 pF1KB5 KLEIFEKIESQRIISGRISGYISEASGESQDIC----KSAGRVKRQWEKESGESQ----R ::: : . ..:. ....::. : CCDS47 ECSAFDRNLNLDQNVVRLQRNKTGERVFKCDICSKTFKYNSDLSRHQRSHTGEKPYECGR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 LSSAQDEGFGKILTHKNTVRGEIISHDGCERRLNLNSNEFTH------QKSCKHGTCDQS . : .. . .: :. . .. .. : : . ..:::. : .: : : .. CCDS47 CGRAFTHSSNLVLHHHIHTGNKPFKCDECGKTFGLNSHLRLHRRIHTGEKPFGCGECGKA 250 260 270 280 290 300 310 320 330 340 350 pF1KB5 SKWNSDFINHQIIYAGEKNHQY---GKSF-KSPKLAKHAAVFSGDKTHQCNECGKAFRHS . .: .:.:.::..::: .. :..: .::.:..: . .:.: :.:..::::: .: CCDS47 FSRSSTLIQHRIIHTGEKPYKCNECGRGFSQSPQLTQHQRIHTGEKPHECSHCGKAFSRS 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB5 SKLARHQRIQTGERCYECNECGKSFAESSDLTRHRRIHTGERPFGCKECGRAFNLNSHLI :.: .:.::.:::. ..::.:::.:..::.: :.:.::::.:. :.::::::..:::: CCDS47 SSLIQHERIHTGEKPHKCNQCGKAFSQSSSLFLHHRVHTGEKPYVCNECGRAFGFNSHLT 370 380 390 400 410 420 420 430 440 450 460 470 pF1KB5 RHQRIHTREKPYECSECGKTFRVSSHLIRHFRIHTGEKPYECSECGRAFSQSSNLSQHQR .: :::: :::: :.::::.:: :: :..: :.:::::::.: :::.::::::.:. ::: CCDS47 EHVRIHTGEKPYVCNECGKAFRRSSTLVQHRRVHTGEKPYQCVECGKAFSQSSQLTLHQR 430 440 450 460 470 480 480 pF1KB5 IHMRENLLM .: : CCDS47 VHTGEKPYDCGDCGKAFSRRSTLIQHQKVHSGETRKCRKHGPAFVHGSSLTADGQIPTGE 490 500 510 520 530 540 >>CCDS43619.1 ZNF3 gene_id:7551|Hs108|chr7 (446 aa) initn: 1365 init1: 713 opt: 785 Z-score: 579.3 bits: 116.5 E(32554): 6.1e-26 Smith-Waterman score: 839; 46.2% identity (70.8% similar) in 305 aa overlap (190-482:94-394) 160 170 180 190 200 210 pF1KB5 NVKLQPVETKAHFDSSEPQLLWDCDNESENSRSMPKLEIFEKIESQRIISGRISGYISEA .:. :: : .:. .. ::.. ::.. CCDS43 EWKRLEPAQRDLYRDVMLENYGNVFSLDRETRTENDQEISEDTRSHGVLLGRFQKDISQG 70 80 90 100 110 120 220 230 240 250 260 270 pF1KB5 SGESQDICKSAGRVKRQWEKESGESQRLSSAQDEGFGKI-LTHKNTVRGEII-SHDGCER .. . .. .:: . :: ::. . . ::.. . .: : ::: ... CCDS43 LKFKEAYEREVS-LKRPLGNSPGE--RLNRKMPD-FGQVTVEEKLTPRGERSEKYNDFGN 130 140 150 160 170 280 290 300 310 320 pF1KB5 RLNLNSNEFTHQK---SCKHGTCDQSSK-WN--SDFINHQIIYAGEKNHQY---GKSF-K ...::: ..::. . . ::. :: .: ::.:.:: :..::: .. ::.: . CCDS43 SFTVNSNLISHQRLPVGDRPHKCDECSKSFNRTSDLIQHQRIHTGEKPYECNECGKAFSQ 180 190 200 210 220 230 330 340 350 360 370 380 pF1KB5 SPKLAKHAAVFSGDKTHQCNECGKAFRHSSKLARHQRIQTGERCYECNECGKSFAESSDL : .: .: . .:.: ..:..:::.: :: : :.::.:::. ::::::::.:. :: : CCDS43 SSHLIQHQRIHTGEKPYECSDCGKTFSCSSALILHRRIHTGEKPYECNECGKTFSWSSTL 240 250 260 270 280 290 390 400 410 420 430 440 pF1KB5 TRHRRIHTGERPFGCKECGRAFNLNSHLIRHQRIHTREKPYECSECGKTFRVSSHLIRHF :.:.::::::.:..:.:::.::. .: ::.:::::: ::::::.::::.: :::: .: CCDS43 THHQRIHTGEKPYACNECGKAFSRSSTLIHHQRIHTGEKPYECNECGKAFSQSSHLYQHQ 300 310 320 330 340 350 450 460 470 480 pF1KB5 RIHTGEKPYECSECGRAFSQSSNLSQHQRIHMRENLLM ::::::::::: ::: :. ::.: :::::: :: CCDS43 RIHTGEKPYECMECGGKFTYSSGLIQHQRIHTGENPYECSECGKAFRYSSALVRHQRIHT 360 370 380 390 400 410 CCDS43 GEKPLNGIGMSKSSLRVTTELNIREST 420 430 440 >>CCDS11067.1 ZFP3 gene_id:124961|Hs108|chr17 (502 aa) initn: 4441 init1: 684 opt: 785 Z-score: 578.7 bits: 116.5 E(32554): 6.5e-26 Smith-Waterman score: 810; 37.6% identity (63.9% similar) in 391 aa overlap (130-481:41-418) 100 110 120 130 140 150 pF1KB5 ILPGDLQAWVHEHYPESGEEAVTILEDLERGTDEAVLQVQAHEHGQEIFQKKVSP----- : .: .:. ...: .:.... .:: CCDS11 KEEISEESEPHGSLLEKFPKVVYQGHEFGAGCEEDMLEGHSRESMEEVIEQ-MSPQERDF 20 30 40 50 60 160 170 180 190 200 pF1KB5 PGPALNVKLQPVETKAHFD-------SSEPQLLWDCDNESENSRSMPK-----LEIFEKI :. . : .: : . . : :.:. . .:. .. :::.:. CCDS11 PSGLMIFKKSPSSEKDRENNESERGCSPSPNLVTHQGDTTEGVSAFATSGQNFLEILESN 70 80 90 100 110 120 210 220 230 240 250 pF1KB5 ESQRIISGRISGYISEASGESQDICKSAGRVKRQWEKESGESQRLSSAQD----EGFGKI ..:: . ::. :: :.. : ... . .:. :.. . :: CCDS11 KTQR-----------SSVGEKPHTCKECGKAFNQ-NSHLIQHMRVHSGEKPFECKECGKT 130 140 150 160 170 260 270 280 290 300 pF1KB5 LTHKNTVRGEIISHDG-----CER--RLNLNSNEFTHQKSCKHGT----CDQSSK---WN . ....: .. : : :.. . ..:... :.. . : :.. .: : CCDS11 FGTNSSLRRHLRIHAGEKPFACNECGKAFIQSSHLIHHHRIHTGERPYKCEECGKAFSQN 180 190 200 210 220 230 310 320 330 340 350 360 pF1KB5 SDFINHQIIYAGEKNHQY---GKSFK-SPKLAKHAAVFSGDKTHQCNECGKAFRHSSKLA : .: :: :..::: .. ::.:. : .: .: . . .. :.::::::::.::: : CCDS11 SALILHQRIHTGEKPYECNECGKTFRVSSQLIQHQRIHTEERYHECNECGKAFKHSSGLI 240 250 260 270 280 290 370 380 390 400 410 420 pF1KB5 RHQRIQTGERCYECNECGKSFAESSDLTRHRRIHTGERPFGCKECGRAFNLNSHLIRHQR :::.:.:::. : ::::::.:..::.: ::.:::::..:. :.:::..:. ::..::: : CCDS11 RHQKIHTGEKPYLCNECGKGFGQSSELIRHQRIHTGDKPYECNECGKTFGQNSEIIRHIR 300 310 320 330 340 350 430 440 450 460 470 480 pF1KB5 IHTREKPYECSECGKTFRVSSHLIRHFRIHTGEKPYECSECGRAFSQSSNLSQHQRIHMR ::: :::: :.::::.:: .:.:.:: ::::::::::: :::.:: ..:.: ::::: CCDS11 IHTGEKPYVCKECGKAFRGNSELLRHERIHTGEKPYECFECGKAFRRTSHLIVHQRIHTG 360 370 380 390 400 410 pF1KB5 ENLLM : CCDS11 EKPHQCNECARTFWDNSELLLHQKIHIGEKPYECSECEKTFSQHSQLIIHQRIHTGEKPY 420 430 440 450 460 470 >>CCDS43429.1 ZNF391 gene_id:346157|Hs108|chr6 (358 aa) initn: 1830 init1: 679 opt: 781 Z-score: 577.5 bits: 115.8 E(32554): 7.6e-26 Smith-Waterman score: 781; 47.6% identity (75.8% similar) in 252 aa overlap (240-481:61-302) 210 220 230 240 250 260 pF1KB5 GRISGYISEASGESQDICKSAGRVKRQWEKESGE---SQRLSSAQD--EGFGKILTHKNT ::.: : :.. : .: :. ...::. CCDS43 PAQKKSSFENTVVRKVSVTLKEIFTGEEGPESSEFSLSPNLDAQQKIPKGHGSPISRKNS 40 50 60 70 80 90 270 280 290 300 310 320 pF1KB5 V-RGEIISHDGCERRLNLNSNEFTHQKSCKHGTCDQSSKWNSDFINHQIIYAGEKN---H ...:.: .:: :...: :: . :... ...::.. :. :..::: . CCDS43 KDNSDLIKH----QRL------FSQRKPCKCNECEKAFSYQSDLLVHSRIHGGEKPFECN 100 110 120 130 140 330 340 350 360 370 pF1KB5 QYGKSF-KSPKLAKHAAVFSGDKTHQCNECGKAFRHSSKLARHQRIQTGERCYECNECGK . :::: .: .: .: . .:.: ..:::::::: .:..:. ::::.:::. :::.:::: CCDS43 KCGKSFSRSTHLIEHQRTHTGEKPYECNECGKAFSRSTHLSLHQRIHTGEKPYECSECGK 150 160 170 180 190 200 380 390 400 410 420 430 pF1KB5 SFAESSDLTRHRRIHTGERPFGCKECGRAFNLNSHLIRHQRIHTREKPYECSECGKTFRV .:..:..:..:.: :: :::. :.:::.::. : .:.:::::: :.:::::.:::.: CCDS43 AFSRSTNLSQHQRTHTQERPYKCNECGKAFGDRSTIIQHQRIHTGENPYECSKCGKAFSW 210 220 230 240 250 260 440 450 460 470 480 pF1KB5 SSHLIRHFRIHTGEKPYECSECGRAFSQSSNLSQHQRIHMRENLLM : : .: : ::::.::::::::..::.::.:..::::: : CCDS43 ISSLTEHQRTHTGENPYECSECGKVFSRSSSLTEHQRIHSGEKPHECRVCGKGFSRSSSL 270 280 290 300 310 320 CCDS43 IIHQRTHTGEKPYKCNDCGKAFCQSSTLIRHQHLHTKE 330 340 350 >>CCDS12501.1 ZNF383 gene_id:163087|Hs108|chr19 (475 aa) initn: 4758 init1: 707 opt: 779 Z-score: 574.7 bits: 115.7 E(32554): 1.1e-25 Smith-Waterman score: 783; 44.4% identity (70.6% similar) in 279 aa overlap (227-481:172-447) 200 210 220 230 240 250 pF1KB5 EIFEKIESQRIISGRISGYISEASGESQDICKSAGRVKRQWEKESGESQRL----SSAQD ::. :.. : ... . ::. .: . CCDS12 IFTPEYMPTFIQQTFLTLHQIINNEDRPYECKKCGKAFSQ-NSQFIQHQRIHIGEKSYEC 150 160 170 180 190 200 260 270 280 290 pF1KB5 EGFGKILTHKNTVRGEIISHDG--------CERRLNLNSNEFTHQK--------SCKHGT . ::... . : .. : : : . .. .: ::. ::. CCDS12 KECGKFFSCGSHVTRHLKIHTGEKPFECKECGKAFSCSSYLSQHQRIHTGKKPYECKE-- 210 220 230 240 250 300 310 320 330 340 350 pF1KB5 CDQSSKWNSDFINHQIIYAGEKNHQY---GKSF-KSPKLAKHAAVFSGDKTHQCNECGKA : .. .. :..:.:: :..::: .. ::.: :: .: .:: . .:.: ..:.::::: CCDS12 CGKAFSYCSNLIDHQRIHTGEKPYECKVCGKAFTKSSQLFQHARIHTGEKPYECKECGKA 260 270 280 290 300 310 360 370 380 390 400 410 pF1KB5 FRHSSKLARHQRIQTGERCYECNECGKSFAESSDLTRHRRIHTGERPFGCKECGRAFNLN : .::::..::::.:::. :::.::::.:. .: :: :.::::::.:. :::::.::. . CCDS12 FTQSSKLVQHQRIHTGEKPYECKECGKAFSSGSALTNHQRIHTGEKPYDCKECGKAFTQS 320 330 340 350 360 370 420 430 440 450 460 470 pF1KB5 SHLIRHQRIHTREKPYECSECGKTFRVSSHLIRHFRIHTGEKPYECSECGRAFSQSSNLS :.: .:::::. :::.:: ::::.: .:.:..: :::: ::::::.:::.::.. :::. CCDS12 SQLRQHQRIHAGEKPFECLECGKAFTQNSQLFQHQRIHTDEKPYECNECGKAFNKCSNLT 380 390 400 410 420 430 480 pF1KB5 QHQRIHMRENLLM .: ::: : CCDS12 RHLRIHTGEKPYNCKECGKAFSSGSDLIRHQGIHTNK 440 450 460 470 485 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 16:48:29 2016 done: Mon Nov 7 16:48:30 2016 Total Scan time: 3.320 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]