FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3217, 494 aa 1>>>pF1KE3217 494 - 494 aa - 494 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.6762+/-0.00122; mu= 7.6700+/- 0.071 mean_var=204.7807+/-42.075, 0's: 0 Z-trim(108.8): 943 B-trim: 0 in 0/52 Lambda= 0.089625 statistics sampled from 9412 (10436) to 9412 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.664), E-opt: 0.2 (0.321), width: 16 Scan time: 3.040 The best scores are: opt bits E(32554) CCDS42427.1 ZSCAN30 gene_id:100101467|Hs108|chr18 ( 494) 3360 447.7 1.4e-125 CCDS74207.1 ZSCAN30 gene_id:100101467|Hs108|chr18 ( 307) 2108 285.6 5.3e-77 CCDS5681.1 ZSCAN21 gene_id:7589|Hs108|chr7 ( 473) 1368 190.1 4.6e-48 CCDS12975.1 ZSCAN22 gene_id:342945|Hs108|chr19 ( 491) 1280 178.7 1.2e-44 CCDS56407.1 ZSCAN9 gene_id:7746|Hs108|chr6 ( 445) 1106 156.2 6.9e-38 CCDS43619.1 ZNF3 gene_id:7551|Hs108|chr7 ( 446) 1093 154.5 2.2e-37 CCDS45852.1 ZNF397 gene_id:84307|Hs108|chr18 ( 534) 1054 149.5 8.3e-36 CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 1043 148.2 2.4e-35 CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 1043 148.2 2.6e-35 CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 1043 148.2 2.6e-35 CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 1043 148.2 2.6e-35 CCDS12497.1 ZNF345 gene_id:25850|Hs108|chr19 ( 488) 1036 147.2 3.9e-35 CCDS12501.1 ZNF383 gene_id:163087|Hs108|chr19 ( 475) 1032 146.6 5.5e-35 CCDS12959.2 ZNF551 gene_id:90233|Hs108|chr19 ( 670) 1026 146.0 1.2e-34 CCDS69664.1 ZNF79 gene_id:7633|Hs108|chr9 ( 474) 1022 145.4 1.3e-34 CCDS6871.1 ZNF79 gene_id:7633|Hs108|chr9 ( 498) 1022 145.4 1.4e-34 CCDS75904.1 ZNF79 gene_id:7633|Hs108|chr9 ( 364) 1018 144.7 1.6e-34 CCDS4645.1 ZKSCAN8 gene_id:7745|Hs108|chr6 ( 578) 1016 144.7 2.6e-34 CCDS12504.1 ZNF570 gene_id:148268|Hs108|chr19 ( 536) 1013 144.2 3.3e-34 CCDS74355.1 ZNF570 gene_id:148268|Hs108|chr19 ( 592) 1013 144.3 3.5e-34 CCDS12980.1 ZNF132 gene_id:7691|Hs108|chr19 ( 706) 1013 144.4 4e-34 CCDS6755.1 ZNF189 gene_id:7743|Hs108|chr9 ( 584) 1011 144.0 4.1e-34 CCDS65096.1 ZNF189 gene_id:7743|Hs108|chr9 ( 612) 1011 144.0 4.3e-34 CCDS6754.1 ZNF189 gene_id:7743|Hs108|chr9 ( 626) 1011 144.1 4.4e-34 CCDS42639.1 ZNF154 gene_id:7710|Hs108|chr19 ( 437) 1008 143.5 4.4e-34 CCDS62707.1 ZNF180 gene_id:7733|Hs108|chr19 ( 665) 1011 144.1 4.5e-34 CCDS62708.1 ZNF180 gene_id:7733|Hs108|chr19 ( 667) 1011 144.1 4.5e-34 CCDS46801.1 ZNF619 gene_id:285267|Hs108|chr3 ( 532) 1009 143.7 4.7e-34 CCDS12639.1 ZNF180 gene_id:7733|Hs108|chr19 ( 692) 1011 144.1 4.7e-34 CCDS11067.1 ZFP3 gene_id:124961|Hs108|chr17 ( 502) 1008 143.6 4.9e-34 CCDS46803.1 ZNF619 gene_id:285267|Hs108|chr3 ( 576) 1009 143.8 4.9e-34 CCDS46802.1 ZNF619 gene_id:285267|Hs108|chr3 ( 616) 1009 143.8 5.1e-34 CCDS2715.1 ZKSCAN7 gene_id:55888|Hs108|chr3 ( 754) 1010 144.0 5.4e-34 CCDS12498.1 ZNF420 gene_id:147923|Hs108|chr19 ( 688) 1009 143.8 5.6e-34 CCDS69562.1 ZNF34 gene_id:80778|Hs108|chr8 ( 539) 1006 143.3 6.1e-34 CCDS47945.1 ZNF34 gene_id:80778|Hs108|chr8 ( 560) 1006 143.4 6.3e-34 CCDS82341.1 ZNF569 gene_id:148266|Hs108|chr19 ( 527) 1003 142.9 7.9e-34 CCDS233.1 ZNF436 gene_id:80818|Hs108|chr1 ( 470) 1002 142.8 8e-34 CCDS12503.1 ZNF569 gene_id:148266|Hs108|chr19 ( 686) 1003 143.1 9.5e-34 CCDS76895.1 ZNF23 gene_id:7571|Hs108|chr16 ( 585) 1001 142.7 1e-33 CCDS74346.1 ZNF566 gene_id:84924|Hs108|chr19 ( 314) 996 141.8 1e-33 CCDS82413.1 ZNF544 gene_id:27300|Hs108|chr19 ( 687) 1002 142.9 1e-33 CCDS12973.1 ZNF544 gene_id:27300|Hs108|chr19 ( 715) 1002 142.9 1.1e-33 CCDS10900.1 ZNF23 gene_id:7571|Hs108|chr16 ( 643) 1001 142.8 1.1e-33 CCDS12491.1 ZNF565 gene_id:147929|Hs108|chr19 ( 499) 999 142.4 1.1e-33 CCDS82335.1 ZNF529 gene_id:57711|Hs108|chr19 ( 458) 998 142.2 1.1e-33 CCDS12494.1 ZNF566 gene_id:84924|Hs108|chr19 ( 418) 996 141.9 1.3e-33 CCDS46061.1 ZNF566 gene_id:84924|Hs108|chr19 ( 419) 996 141.9 1.3e-33 CCDS54256.1 ZNF529 gene_id:57711|Hs108|chr19 ( 563) 998 142.3 1.3e-33 CCDS73997.1 ZNF286A gene_id:57335|Hs108|chr17 ( 511) 997 142.2 1.3e-33 >>CCDS42427.1 ZSCAN30 gene_id:100101467|Hs108|chr18 (494 aa) initn: 3360 init1: 3360 opt: 3360 Z-score: 2368.2 bits: 447.7 E(32554): 1.4e-125 Smith-Waterman score: 3360; 99.8% identity (99.8% similar) in 494 aa overlap (1-494:1-494) 10 20 30 40 50 60 pF1KE3 MSGEATVLAYHAPEEQEGLLVVKVEEENYVLDQDFGLQENPWSQEVFRQKFRQFSYSDST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 MSGEATVLAYHAPEEQEGLLVVKVEEENYVLDQDFGLQENPWSQEVFRQKFRQFSYSDST 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 GPREALSRLRELCCQWLRPEVHSKEQILELLMLEQFLAILPEELQAWLREHRPENGEEAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 GPREALSRLRELCCQWLRPEVHSKEQILELLMLEQFLAILPEELQAWLREHRPENGEEAV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 TMLEELEKELEEPRQQDTTHGQEMFWQEMTSTGALKSLSLNSPVQPLENQCKTETQESQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 TMLEELEKELEEPRQQDTTHGQEMFWQEMTSTGALKSLSLNSPVQPLENQCKTETQESQA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 FQERDGRMVAGKVLMAKQEIVECVASAAMISPGKLPGETHSQRIAEEALGGLDNSKKPKG ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: :: CCDS42 FQERDGRMVAGKVLMAKQEIVECVASAAMISPGKLPGETHSQRIAEEALGGLDNSKKQKG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 NAAGNKISQLPSQDRHFSLATFNRRIPTEHSVLESHESEGSFSMNSNDITQQSVDTREKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 NAAGNKISQLPSQDRHFSLATFNRRIPTEHSVLESHESEGSFSMNSNDITQQSVDTREKL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 YECFDCGKAFCQSSKLIRHQRIHTGERPYACKECGKAFSLSSDLVRHQRIHSGEKPYECC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 YECFDCGKAFCQSSKLIRHQRIHTGERPYACKECGKAFSLSSDLVRHQRIHSGEKPYECC 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 ECGKAFRGSSELIRHRRIHTGEKPYECGECGKAFSRSSALIQHKKIHTGDKSYECIACGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 ECGKAFRGSSELIRHRRIHTGEKPYECGECGKAFSRSSALIQHKKIHTGDKSYECIACGK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 AFGRSSILIEHQRIHTGEKPYECNECGKSFNQSSALTQHQRIHTGEKPYECSECRKTFRH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 AFGRSSILIEHQRIHTGEKPYECNECGKSFNQSSALTQHQRIHTGEKPYECSECRKTFRH 430 440 450 460 470 480 490 pF1KE3 RSGLMQHQRTHTRV :::::::::::::: CCDS42 RSGLMQHQRTHTRV 490 >>CCDS74207.1 ZSCAN30 gene_id:100101467|Hs108|chr18 (307 aa) initn: 2108 init1: 2108 opt: 2108 Z-score: 1495.9 bits: 285.6 E(32554): 5.3e-77 Smith-Waterman score: 2108; 99.7% identity (99.7% similar) in 307 aa overlap (188-494:1-307) 160 170 180 190 200 210 pF1KE3 LSLNSPVQPLENQCKTETQESQAFQERDGRMVAGKVLMAKQEIVECVASAAMISPGKLPG :::::::::::::::::::::::::::::: CCDS74 MVAGKVLMAKQEIVECVASAAMISPGKLPG 10 20 30 220 230 240 250 260 270 pF1KE3 ETHSQRIAEEALGGLDNSKKPKGNAAGNKISQLPSQDRHFSLATFNRRIPTEHSVLESHE :::::::::::::::::::: ::::::::::::::::::::::::::::::::::::::: CCDS74 ETHSQRIAEEALGGLDNSKKQKGNAAGNKISQLPSQDRHFSLATFNRRIPTEHSVLESHE 40 50 60 70 80 90 280 290 300 310 320 330 pF1KE3 SEGSFSMNSNDITQQSVDTREKLYECFDCGKAFCQSSKLIRHQRIHTGERPYACKECGKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 SEGSFSMNSNDITQQSVDTREKLYECFDCGKAFCQSSKLIRHQRIHTGERPYACKECGKA 100 110 120 130 140 150 340 350 360 370 380 390 pF1KE3 FSLSSDLVRHQRIHSGEKPYECCECGKAFRGSSELIRHRRIHTGEKPYECGECGKAFSRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 FSLSSDLVRHQRIHSGEKPYECCECGKAFRGSSELIRHRRIHTGEKPYECGECGKAFSRS 160 170 180 190 200 210 400 410 420 430 440 450 pF1KE3 SALIQHKKIHTGDKSYECIACGKAFGRSSILIEHQRIHTGEKPYECNECGKSFNQSSALT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 SALIQHKKIHTGDKSYECIACGKAFGRSSILIEHQRIHTGEKPYECNECGKSFNQSSALT 220 230 240 250 260 270 460 470 480 490 pF1KE3 QHQRIHTGEKPYECSECRKTFRHRSGLMQHQRTHTRV ::::::::::::::::::::::::::::::::::::: CCDS74 QHQRIHTGEKPYECSECRKTFRHRSGLMQHQRTHTRV 280 290 300 >>CCDS5681.1 ZSCAN21 gene_id:7589|Hs108|chr7 (473 aa) initn: 1218 init1: 643 opt: 1368 Z-score: 976.4 bits: 190.1 E(32554): 4.6e-48 Smith-Waterman score: 1407; 45.9% identity (71.3% similar) in 492 aa overlap (3-492:7-467) 10 20 30 40 50 pF1KE3 MSGEATVLAYHAPEEQEGLLVVKVEEENYVLDQDFGLQENPWSQEVFRQKFRQFSY : : ::. . :.:: : :.:::::. .. : . : : :.:::.::::.: CCDS56 MMTKVLGMAPVLGPRPPQEQVGPLMVKVEEK-----EEKG-KYLP-SLEMFRQRFRQFGY 10 20 30 40 50 60 70 80 90 100 110 pF1KE3 SDSTGPREALSRLRELCCQWLRPEVHSKEQILELLMLEQFLAILPEELQAWLREHRPENG :. :::::::.:: :::.:::::.:.::::::::.:::::.:::.:::::..:: ::.. CCDS56 HDTPGPREALSQLRVLCCEWLRPEIHTKEQILELLVLEQFLTILPQELQAWVQEHCPESA 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE3 EEAVTMLEELEKELEEPRQQDTT--HGQEMFWQEMTSTGALKSLSLNSPVQPLENQCKTE :::::.::.::.::.:: .: .: . :. :....:.:. : . ::::.. : : CCDS56 EEAVTLLEDLERELDEPGHQVSTPPNEQKPVWEKISSSGTAKESPSSMQPQPLETSHKYE 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE3 TQESQAFQERDGRMVAGKVLMAKQEIVECVASAAMISPGKLPGETHSQRIAEEALGGLDN . .:: .:. . . ... .: : :. .. :.: : .. CCDS56 SWGPLYIQE-SGE--EQEFAQDPRKVRDCRLS------------TQHEESADEQKG--SE 180 190 200 210 240 250 260 270 280 290 pF1KE3 SKKPKGNAAGNKISQLPSQDRHFSLATFNRRIPTEHSVLESHESEGSFSMNSNDITQQSV .. ::. . :.. : . . . .... . :. . :. ..: :. .. CCDS56 AEGLKGDIISVIIANKPEASLERQCVNLENEKGTKPPLQEAGSKKGRESVPTKPTPG--- 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE3 DTREKLYECFDCGKAFCQSSKLIRHQRIHTGERPYACKECGKAFSLSSDLVRHQRIHSGE :. : : .::::: .::.: .:.: ::::.::.: .:::::: ::.:. : : : . CCDS56 ---ERRYICAECGKAFSNSSNLTKHRRTHTGEKPYVCTKCGKAFSHSSNLTLHYRTHLVD 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE3 KPYECCECGKAFRGSSELIRHRRIHTGEKPYECGECGKAFSRSSALIQHKKIHTGDKSYE .::.: .::::: ::.:..:.:.:: : ::.: .:::::: ...::.: .::::.: :. CCDS56 RPYDC-KCGKAFGQSSDLLKHQRMHTEEAPYQCKDCGKAFSGKGSLIRHYRIHTGEKPYQ 340 350 360 370 380 420 430 440 450 460 470 pF1KE3 CIACGKAFGRSSILIEHQRIHTGEKPYECNECGKSFNQSSALTQHQRIHTGEKPYECSEC : :::.:.. . : :::.:::::::.:.::::.::.:: ...:.::::::::: : .: CCDS56 CNECGKSFSQHAGLSSHQRLHTGEKPYKCKECGKAFNHSSNFNKHHRIHTGEKPYWCHHC 390 400 410 420 430 440 480 490 pF1KE3 RKTFRHRSGLMQHQRTHTRV ::: .:.: .:::.:: CCDS56 GKTFCSKSNLSKHQRVHTGEGEAP 450 460 470 >>CCDS12975.1 ZSCAN22 gene_id:342945|Hs108|chr19 (491 aa) initn: 2057 init1: 886 opt: 1280 Z-score: 914.7 bits: 178.7 E(32554): 1.2e-44 Smith-Waterman score: 1289; 42.7% identity (69.6% similar) in 494 aa overlap (13-494:12-489) 10 20 30 40 50 pF1KE3 MSGEATVLAYHAPEEQEGLLVVKVEEENYV-LDQD-FGLQENPWSQEVFRQKFRQFSYSD : :....: ::::::. . :.: . ... .:. : .::.: : . CCDS12 MAIPKHSLSPVPWEEDSFLQVKVEEEEEASLSQGGESSHDHIAHSEAARLRFRHFRYEE 10 20 30 40 50 60 70 80 90 100 110 pF1KE3 STGPREALSRLRELCCQWLRPEVHSKEQILELLMLEQFLAILPEELQAWLREHRPENGEE ..::.:::..:: ::::::.::.::::::::::.:::::. :: :.:::. . :..::: CCDS12 ASGPHEALAHLRALCCQWLQPEAHSKEQILELLVLEQFLGALPPEIQAWVGAQSPKSGEE 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE3 AVTMLEELEKELE----EPRQQDTTHG-QEMFWQEMTSTGALKSLSLNSPVQP-LENQCK :....:.: . :. .: . : . .. : ... ..: . . : . . : CCDS12 AAVLVEDLTQVLDKRGWDPGAEPTEASCKQSDLGESEPSNVTETLMGGVSLGPAFVKAC- 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE3 TETQESQAFQERDGRMVAGKVLMAKQEIVECVASAAMISPGK-LPGETHSQRIAEEALGG : .. .::.: ..:.. . ... . .: : .: . :: : :. CCDS12 ----EPEGSSERSG--LSGEIWT--KSVTQQIHFKKTSGPYKDVPTD---QRGRES--GA 180 190 200 210 220 240 250 260 270 280 pF1KE3 LDNSKKPKGNAAGNKISQLPSQDRHFSLATFNRRIPTEHSVLES---HESEGSFSMNSND ::.. : .... . ::.:. . ... . : .: .: .: . :. : CCDS12 SRNSSSAWPNLTSQE--KPPSEDKFDLVDAYGTEPPYTYSGKRSSKCRECRKMFQSASAL 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE3 ITQQSVDTREKLYECFDCGKAFCQSSKLIRHQRIHTGERPYACKECGKAFSLSSDLVRHQ ..:.. .:. : : .::::: .:..: .:: .::: .:. ::::::::: . :..:: CCDS12 EAHQKTHSRKTPYACSECGKAFSRSTHLAQHQVVHTGAKPHECKECGKAFSRVTHLTQHQ 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE3 RIHSGEKPYECCECGKAFRGSSELIRHRRIHTGEKPYECGECGKAFSRSSALIQHKKIHT :::.:::::.: ::::.: :..: .:.:.::::.:::: ::::::.:. : ::..::: CCDS12 RIHTGEKPYKCGECGKTFSRSTHLTQHQRVHTGERPYECDACGKAFSQSTHLTQHQRIHT 350 360 370 380 390 400 410 420 430 440 450 460 pF1KE3 GDKSYECIACGKAFGRSSILIEHQRIHTGEKPYECNECGKSFNQSSALTQHQRIHTGEKP :.: :.: :::.::. : ::.: :::.:::::.:. : :.: :::.: .:::::::::: CCDS12 GEKPYKCDACGRAFSDCSALIRHLRIHSGEKPYQCKVCPKAFAQSSSLIEHQRIHTGEKP 410 420 430 440 450 460 470 480 490 pF1KE3 YECSECRKTFRHRSGLMQHQRTHTRV :.::.: :.: . :.:: : : : : CCDS12 YKCSDCGKAFSRSSALMVHLRIHITVLQ 470 480 490 >>CCDS56407.1 ZSCAN9 gene_id:7746|Hs108|chr6 (445 aa) initn: 929 init1: 929 opt: 1106 Z-score: 793.7 bits: 156.2 E(32554): 6.9e-38 Smith-Waterman score: 1144; 41.5% identity (69.2% similar) in 467 aa overlap (2-464:5-440) 10 20 30 40 50 pF1KE3 MSGEATVLAYHAPEEQEGLLVVKVEEENYVLDQDFGLQE-NPWSQEVFRQKFRQFSY : :. :. ..:: : ::..::: .... :. :.. :: ..:.::..:::. : CCDS56 MNTNSKEVLSLGVQVPEAWEELLTMKVEAKSHLQWQESRLKRSNPLAREIFRRHFRQLCY 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE3 SDSTGPREALSRLRELCCQWLRPEVHSKEQILELLMLEQFLAILPEELQAWLREHRPENG ... ::::::.::.::: :::::.: .:::::.::.:::::.:::.:::.:.::: ::.: CCDS56 QETPGPREALTRLQELCYQWLRPHVSTKEQILDLLVLEQFLSILPKELQGWVREHCPESG 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE3 EEAVTMLEELEKELEEPRQQDTTHG--QEMFWQEMTSTGALKSLSLNSPVQPLENQCKTE :::: .::.::.::.::... ..: ::.. .::. . :.:.: :: : : . CCDS56 EEAVILLEDLERELDEPQHEMVAHRHRQEVLCKEMVPLAEQTPLTLQS--QPKEPQLTCD 130 140 150 160 170 180 190 200 210 220 230 pF1KE3 T-QESQAFQERDGRMVAGKVLMAKQEIVECVASAAMISPGKLPGETHSQRIAEEALGGLD . :. ... : : . ... : .: ..: . :. .. : : CCDS56 SAQKCHSIGETD------LIRSLRRRAVLIPLGAHLFSTDTF---LFSKPVVIPQLKGGG 180 190 200 210 220 240 250 260 270 280 290 pF1KE3 NSKKPKGNAAGNKISQLPSQDRHFSLATFNRRIPTEHSVLESHESEGSFSMNSNDITQQS .. . .. ..... ..::.. : . : ...: : . :. .. ...:: CCDS56 ETWPNNRGVLRDEVTK--TEDRELVL---RKDCP---KIVEPHGKM--FNEQTWEVSQQ- 230 240 250 260 270 300 310 320 330 340 350 pF1KE3 VDTREKLYECFDCGKAFCQSSKLIRHQRIHTGERPYACKECGKAFSLSSDLVRHQRIHSG : . :.. ..... :. :: . : ::::.:. :: :.::::::.: CCDS56 -DPSH--------GEVGEHKDRIERQWGNLLGEGQHKCDECGKSFTQSSGLIRHQRIHTG 280 290 300 310 320 360 370 380 390 400 410 pF1KE3 EKPYECCECGKAFRGSSELIRHRRIHTGEKPYECGECGKAFSRSSALIQHKKIHTGDKSY :.:::: :::::: :: :. :: ::. .: :.: ::::.::.:..::::..:: :.: : CCDS56 ERPYECNECGKAFSRSSGLFNHRGIHNIQKRYHCKECGKVFSQSAGLIQHQRIHKGEKPY 330 340 350 360 370 380 420 430 440 450 460 470 pF1KE3 ECIACGKAFGRSSILIEHQRIHTGEKPYECNECGKSFNQSSALTQHQRIHTGEKPYECSE .: :.:...: :.:::::: ::::.:..: :::::::. : .::.::: CCDS56 QCSQCSKSYSRRSFLIEHQRSHTGERPHQCIECGKSFNRHCNLIRHQKIHTVAELV 390 400 410 420 430 440 480 490 pF1KE3 CRKTFRHRSGLMQHQRTHTRV >>CCDS43619.1 ZNF3 gene_id:7551|Hs108|chr7 (446 aa) initn: 1057 init1: 1057 opt: 1093 Z-score: 784.6 bits: 154.5 E(32554): 2.2e-37 Smith-Waterman score: 1093; 54.5% identity (76.8% similar) in 297 aa overlap (198-492:100-391) 170 180 190 200 210 220 pF1KE3 ENQCKTETQESQAFQERDGRMVAGKVLMAKQEIVECVASAAMISPGKLPGETHSQRIAEE ::: : . : ... :.. . . .: CCDS43 PAQRDLYRDVMLENYGNVFSLDRETRTENDQEISEDTRSHGVLL-GRFQKDISQGLKFKE 70 80 90 100 110 120 230 240 250 260 270 280 pF1KE3 ALGGLDNSKKPKGNAAGNKIS-QLPSQDRHFSLATFNRRIPTEHSVLESHESEG-SFSMN : . :.: ::. :.... ..:. :. .: .... . :.... : ::..: CCDS43 AYEREVSLKRPLGNSPGERLNRKMPD----FGQVTVEEKLTPRGERSEKYNDFGNSFTVN 130 140 150 160 170 180 290 300 310 320 330 340 pF1KE3 SNDITQQSVDTREKLYECFDCGKAFCQSSKLIRHQRIHTGERPYACKECGKAFSLSSDLV :: :..: . . .. ..: .:.:.: ..: ::.::::::::.:: :.::::::: :: :. CCDS43 SNLISHQRLPVGDRPHKCDECSKSFNRTSDLIQHQRIHTGEKPYECNECGKAFSQSSHLI 190 200 210 220 230 240 350 360 370 380 390 400 pF1KE3 RHQRIHSGEKPYECCECGKAFRGSSELIRHRRIHTGEKPYECGECGKAFSRSSALIQHKK .:::::.::::::: .:::.: :: :: :::::::::::::.::::.:: ::.: .:.. CCDS43 QHQRIHTGEKPYECSDCGKTFSCSSALILHRRIHTGEKPYECNECGKTFSWSSTLTHHQR 250 260 270 280 290 300 410 420 430 440 450 460 pF1KE3 IHTGDKSYECIACGKAFGRSSILIEHQRIHTGEKPYECNECGKSFNQSSALTQHQRIHTG ::::.: : : :::::.::: ::.::::::::::::::::::.:.::: : :::::::: CCDS43 IHTGEKPYACNECGKAFSRSSTLIHHQRIHTGEKPYECNECGKAFSQSSHLYQHQRIHTG 310 320 330 340 350 360 470 480 490 pF1KE3 EKPYECSECRKTFRHRSGLMQHQRTHTRV :::::: :: : . :::.:::: :: CCDS43 EKPYECMECGGKFTYSSGLIQHQRIHTGENPYECSECGKAFRYSSALVRHQRIHTGEKPL 370 380 390 400 410 420 >>CCDS45852.1 ZNF397 gene_id:84307|Hs108|chr18 (534 aa) initn: 3198 init1: 1048 opt: 1054 Z-score: 756.4 bits: 149.5 E(32554): 8.3e-36 Smith-Waterman score: 1549; 50.6% identity (73.1% similar) in 490 aa overlap (6-492:9-476) 10 20 30 40 50 pF1KE3 MSGEATVLAYHAPEEQEGLLVVKVEEENYVLDQDFGLQENPWS-QEVFRQKFRQFSY ..: . : ::: :..::::. :. :. : . . : ::.:::.::.: : CCDS45 MAVESGVISTLIPQDPPEQE-LILVKVED-NFSWDEKFKQNGSTQSCQELFRQQFRKFCY 10 20 30 40 50 60 70 80 90 100 110 pF1KE3 SDSTGPREALSRLRELCCQWLRPEVHSKEQILELLMLEQFLAILPEELQAWLREHRPENG ... :::::::::.::: ::: ::.:.::::::::.:::::.::::::: :...: ::.: CCDS45 QETPGPREALSRLQELCYQWLMPELHTKEQILELLVLEQFLSILPEELQIWVQQHNPESG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE3 EEAVTMLEELEKELEEPRQQ--DTTHGQEMFWQEMTSTGALKSLSLNSPVQPLENQCKTE :::::.::.::.:...: :: . .: . :...: : . : . .:::..: :. CCDS45 EEAVTLLEDLEREFDDPGQQVPASPQGPAVPWKDLTCLRASQE-STDIHLQPLKTQLKSW 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE3 TQESQAFQERDGRMVAGKVLMAKQEIVECVASAAMISPGKLPGETHSQRIAEEALGGLDN . .. .. .: : ..... : : :: : . :.:. .: CCDS45 KPCLSPKSDCENSETATKEGISEEK-----------SQG-LPQEPSFRGISEHE----SN 180 190 200 210 220 240 250 260 270 280 290 pF1KE3 SKKPKGNAAGNKISQLPSQDRHFSLATFNRRIPTEHSVLESHESEGSFSMNSNDITQQSV .:.:.:.:. . ::: :: . :. . .... . :.: . .....: :.: CCDS45 LVWKQGSATGEKLRS-PSQGGSFSQVIFTNKSLGKRDLYD--EAERCLILTTDSIMCQKV 230 240 250 260 270 300 310 320 330 340 350 pF1KE3 DTREKLYECFDCGKAFCQSSKLIRHQRIHTGERPYACKECGKAFSLSSDLVRHQRIHSGE .:. :.: ::..: : :.: .::::::::.:: :..::::::: : :. :::::::: CCDS45 PPEERPYRCDVCGHSFKQHSSLTQHQRIHTGEKPYKCNQCGKAFSLRSYLIIHQRIHSGE 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE3 KPYECCECGKAFRGSSELIRHRRIHTGEKPYECGECGKAFSRSSALIQHKKIHTGDKSYE : ::: :::::: :: :::::.:::::: .:.:::::::.:: :: :..::::.: :: CCDS45 KAYECSECGKAFNQSSALIRHRKIHTGEKACKCNECGKAFSQSSYLIIHQRIHTGEKPYE 340 350 360 370 380 390 420 430 440 450 460 470 pF1KE3 CIACGKAFGRSSILIEHQRIHTGEKPYECNECGKSFNQSSALTQHQRIHTGEKPYECSEC : :::.:..:: ::.::::::::.:::::::::.: ::: : :::::.:::::::::: CCDS45 CNECGKTFSQSSKLIRHQRIHTGERPYECNECGKAFRQSSELITHQRIHSGEKPYECSEC 400 410 420 430 440 450 480 490 pF1KE3 RKTFRHRSGLMQHQRTHTRV :.: :.:..::: :. CCDS45 GKAFSLSSNLIRHQRIHSGEEPYQCNECGKTFKRSSALVQHQRIHSGDEAYICNECGKAF 460 470 480 490 500 510 >>CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 (616 aa) initn: 1998 init1: 1036 opt: 1043 Z-score: 747.9 bits: 148.2 E(32554): 2.4e-35 Smith-Waterman score: 1047; 47.5% identity (68.6% similar) in 360 aa overlap (146-492:118-475) 120 130 140 150 160 170 pF1KE3 GEEAVTMLEELEKELEEPRQQDTTHGQEMFWQEMTSTGALKSLSLNSPVQPLENQCKT-E ::. .. : ::. . : ::. . .. . CCDS74 EGHWEWSCESLESLAVPVAFTPVKTPVLEQWQR-NGFGENISLNPDLPHQPMTPERQSPH 90 100 110 120 130 140 180 190 200 210 220 pF1KE3 TQESQAFQERDGRMVAGKVLMAKQEIVECVASAAMISPGKLPGETHSQRIAE------EA : ... .:. : :. . :.. .: . .: .. : : . .: : CCDS74 TWGTRGKREKPDLNVLQKTCV-KEKPYKCQECGKAFSHSSALIEHHRTHTGERPYECHEC 150 160 170 180 190 200 230 240 250 260 270 280 pF1KE3 LGGLDNSK---KPKGNAAGNKISQLPSQDRHFS-LATF--NRRIPTEHSVLESHESEGSF : :. ::. : . .:.: . . : :. .: . ..: : .. : : :: CCDS74 LKGFRNSSALTKHQRIHTGEKPYKCTQCGRTFNQIAPLIQHQRTHTGEKPYECSECGKSF 210 220 230 240 250 260 290 300 310 320 330 340 pF1KE3 SMNSNDITQQSVDTREKLYECFDCGKAFCQSSKLIRHQRIHTGERPYACKECGKAFSLSS :. :. .. . : :: ::: .::::: :: .: .: ::::::.:: : ::::::: :: CCDS74 SFRSSFSQHERTHTGEKPYECSECGKAFRQSIHLTQHLRIHTGEKPYQCGECGKAFSHSS 270 280 290 300 310 320 350 360 370 380 390 400 pF1KE3 DLVRHQRIHSGEKPYECCECGKAFRGSSELIRHRRIHTGEKPYECGECGKAFSRSSALIQ .:..:::::.::::::: :::::: . ::.:.: :::::::::::::::::.:. : . CCDS74 SLTKHQRIHTGEKPYECHECGKAFTQITPLIQHQRTHTGEKPYECGECGKAFSQSTLLTE 330 340 350 360 370 380 410 420 430 440 450 460 pF1KE3 HKKIHTGDKSYECIACGKAFGRSSILIEHQRIHTGEKPYECNECGKSFNQSSALTQHQRI :..::::.: : : :::.:..:: : .:.: :::::::::..:::.: ::. ::::::: CCDS74 HRRIHTGEKPYGCNECGKTFSHSSSLSQHERTHTGEKPYECSQCGKAFRQSTHLTQHQRI 390 400 410 420 430 440 470 480 490 pF1KE3 HTGEKPYECSECRKTFRHRSGLMQHQRTHTRV :::::::::..: :.: : :.: .::: :: CCDS74 HTGEKPYECNDCGKAFSHSSSLTKHQRIHTGEKPYECNQCGRAFSQLAPLIQHQRIHTGE 450 460 470 480 490 500 >-- initn: 697 init1: 697 opt: 697 Z-score: 506.1 bits: 103.4 E(32554): 7.2e-22 Smith-Waterman score: 697; 65.7% identity (84.3% similar) in 140 aa overlap (353-492:476-615) 330 340 350 360 370 380 pF1KE3 HTGERPYACKECGKAFSLSSDLVRHQRIHSGEKPYECCECGKAFRGSSELIRHRRIHTGE ::::::: .::.:: . ::.:.:::::: CCDS74 HTGEKPYECNDCGKAFSHSSSLTKHQRIHTGEKPYECNQCGRAFSQLAPLIQHQRIHTGE 450 460 470 480 490 500 390 400 410 420 430 440 pF1KE3 KPYECGECGKAFSRSSALIQHKKIHTGDKSYECIACGKAFGRSSILIEHQRIHTGEKPYE :::::..::.:::.:: ::.:..::: .: : : :::.:..:: : .:.: :::::::: CCDS74 KPYECNQCGRAFSQSSLLIEHQRIHTKEKPYGCNECGKSFSHSSSLSQHERTHTGEKPYE 510 520 530 540 550 560 450 460 470 480 490 pF1KE3 CNECGKSFNQSSALTQHQRIHTGEKPYECSECRKTFRHRSGLMQHQRTHTRV :..::::: ::. ::::.::::::::: : .: :.: : :.: .:::::: CCDS74 CHDCGKSFRQSTHLTQHRRIHTGEKPYACRDCGKAFTHSSSLTKHQRTHTG 570 580 590 600 610 >>CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 (658 aa) initn: 1998 init1: 1036 opt: 1043 Z-score: 747.6 bits: 148.2 E(32554): 2.6e-35 Smith-Waterman score: 1047; 47.5% identity (68.6% similar) in 360 aa overlap (146-492:160-517) 120 130 140 150 160 170 pF1KE3 GEEAVTMLEELEKELEEPRQQDTTHGQEMFWQEMTSTGALKSLSLNSPVQPLENQCKT-E ::. .. : ::. . : ::. . .. . CCDS74 EGHWEWSCESLESLAVPVAFTPVKTPVLEQWQR-NGFGENISLNPDLPHQPMTPERQSPH 130 140 150 160 170 180 180 190 200 210 220 pF1KE3 TQESQAFQERDGRMVAGKVLMAKQEIVECVASAAMISPGKLPGETHSQRIAE------EA : ... .:. : :. . :.. .: . .: .. : : . .: : CCDS74 TWGTRGKREKPDLNVLQKTCV-KEKPYKCQECGKAFSHSSALIEHHRTHTGERPYECHEC 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE3 LGGLDNSK---KPKGNAAGNKISQLPSQDRHFS-LATF--NRRIPTEHSVLESHESEGSF : :. ::. : . .:.: . . : :. .: . ..: : .. : : :: CCDS74 LKGFRNSSALTKHQRIHTGEKPYKCTQCGRTFNQIAPLIQHQRTHTGEKPYECSECGKSF 250 260 270 280 290 300 290 300 310 320 330 340 pF1KE3 SMNSNDITQQSVDTREKLYECFDCGKAFCQSSKLIRHQRIHTGERPYACKECGKAFSLSS :. :. .. . : :: ::: .::::: :: .: .: ::::::.:: : ::::::: :: CCDS74 SFRSSFSQHERTHTGEKPYECSECGKAFRQSIHLTQHLRIHTGEKPYQCGECGKAFSHSS 310 320 330 340 350 360 350 360 370 380 390 400 pF1KE3 DLVRHQRIHSGEKPYECCECGKAFRGSSELIRHRRIHTGEKPYECGECGKAFSRSSALIQ .:..:::::.::::::: :::::: . ::.:.: :::::::::::::::::.:. : . CCDS74 SLTKHQRIHTGEKPYECHECGKAFTQITPLIQHQRTHTGEKPYECGECGKAFSQSTLLTE 370 380 390 400 410 420 410 420 430 440 450 460 pF1KE3 HKKIHTGDKSYECIACGKAFGRSSILIEHQRIHTGEKPYECNECGKSFNQSSALTQHQRI :..::::.: : : :::.:..:: : .:.: :::::::::..:::.: ::. ::::::: CCDS74 HRRIHTGEKPYGCNECGKTFSHSSSLSQHERTHTGEKPYECSQCGKAFRQSTHLTQHQRI 430 440 450 460 470 480 470 480 490 pF1KE3 HTGEKPYECSECRKTFRHRSGLMQHQRTHTRV :::::::::..: :.: : :.: .::: :: CCDS74 HTGEKPYECNDCGKAFSHSSSLTKHQRIHTGEKPYECNQCGRAFSQLAPLIQHQRIHTGE 490 500 510 520 530 540 >-- initn: 697 init1: 697 opt: 697 Z-score: 505.8 bits: 103.5 E(32554): 7.5e-22 Smith-Waterman score: 697; 65.7% identity (84.3% similar) in 140 aa overlap (353-492:518-657) 330 340 350 360 370 380 pF1KE3 HTGERPYACKECGKAFSLSSDLVRHQRIHSGEKPYECCECGKAFRGSSELIRHRRIHTGE ::::::: .::.:: . ::.:.:::::: CCDS74 HTGEKPYECNDCGKAFSHSSSLTKHQRIHTGEKPYECNQCGRAFSQLAPLIQHQRIHTGE 490 500 510 520 530 540 390 400 410 420 430 440 pF1KE3 KPYECGECGKAFSRSSALIQHKKIHTGDKSYECIACGKAFGRSSILIEHQRIHTGEKPYE :::::..::.:::.:: ::.:..::: .: : : :::.:..:: : .:.: :::::::: CCDS74 KPYECNQCGRAFSQSSLLIEHQRIHTKEKPYGCNECGKSFSHSSSLSQHERTHTGEKPYE 550 560 570 580 590 600 450 460 470 480 490 pF1KE3 CNECGKSFNQSSALTQHQRIHTGEKPYECSECRKTFRHRSGLMQHQRTHTRV :..::::: ::. ::::.::::::::: : .: :.: : :.: .:::::: CCDS74 CHDCGKSFRQSTHLTQHRRIHTGEKPYACRDCGKAFTHSSSLTKHQRTHTG 610 620 630 640 650 >>CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 (670 aa) initn: 1998 init1: 1036 opt: 1043 Z-score: 747.5 bits: 148.2 E(32554): 2.6e-35 Smith-Waterman score: 1047; 47.5% identity (68.6% similar) in 360 aa overlap (146-492:172-529) 120 130 140 150 160 170 pF1KE3 GEEAVTMLEELEKELEEPRQQDTTHGQEMFWQEMTSTGALKSLSLNSPVQPLENQCKT-E ::. .. : ::. . : ::. . .. . CCDS12 EGHWEWSCESLESLAVPVAFTPVKTPVLEQWQR-NGFGENISLNPDLPHQPMTPERQSPH 150 160 170 180 190 200 180 190 200 210 220 pF1KE3 TQESQAFQERDGRMVAGKVLMAKQEIVECVASAAMISPGKLPGETHSQRIAE------EA : ... .:. : :. . :.. .: . .: .. : : . .: : CCDS12 TWGTRGKREKPDLNVLQKTCV-KEKPYKCQECGKAFSHSSALIEHHRTHTGERPYECHEC 210 220 230 240 250 230 240 250 260 270 280 pF1KE3 LGGLDNSK---KPKGNAAGNKISQLPSQDRHFS-LATF--NRRIPTEHSVLESHESEGSF : :. ::. : . .:.: . . : :. .: . ..: : .. : : :: CCDS12 LKGFRNSSALTKHQRIHTGEKPYKCTQCGRTFNQIAPLIQHQRTHTGEKPYECSECGKSF 260 270 280 290 300 310 290 300 310 320 330 340 pF1KE3 SMNSNDITQQSVDTREKLYECFDCGKAFCQSSKLIRHQRIHTGERPYACKECGKAFSLSS :. :. .. . : :: ::: .::::: :: .: .: ::::::.:: : ::::::: :: CCDS12 SFRSSFSQHERTHTGEKPYECSECGKAFRQSIHLTQHLRIHTGEKPYQCGECGKAFSHSS 320 330 340 350 360 370 350 360 370 380 390 400 pF1KE3 DLVRHQRIHSGEKPYECCECGKAFRGSSELIRHRRIHTGEKPYECGECGKAFSRSSALIQ .:..:::::.::::::: :::::: . ::.:.: :::::::::::::::::.:. : . CCDS12 SLTKHQRIHTGEKPYECHECGKAFTQITPLIQHQRTHTGEKPYECGECGKAFSQSTLLTE 380 390 400 410 420 430 410 420 430 440 450 460 pF1KE3 HKKIHTGDKSYECIACGKAFGRSSILIEHQRIHTGEKPYECNECGKSFNQSSALTQHQRI :..::::.: : : :::.:..:: : .:.: :::::::::..:::.: ::. ::::::: CCDS12 HRRIHTGEKPYGCNECGKTFSHSSSLSQHERTHTGEKPYECSQCGKAFRQSTHLTQHQRI 440 450 460 470 480 490 470 480 490 pF1KE3 HTGEKPYECSECRKTFRHRSGLMQHQRTHTRV :::::::::..: :.: : :.: .::: :: CCDS12 HTGEKPYECNDCGKAFSHSSSLTKHQRIHTGEKPYECNQCGRAFSQLAPLIQHQRIHTGE 500 510 520 530 540 550 >-- initn: 697 init1: 697 opt: 697 Z-score: 505.7 bits: 103.5 E(32554): 7.6e-22 Smith-Waterman score: 697; 65.7% identity (84.3% similar) in 140 aa overlap (353-492:530-669) 330 340 350 360 370 380 pF1KE3 HTGERPYACKECGKAFSLSSDLVRHQRIHSGEKPYECCECGKAFRGSSELIRHRRIHTGE ::::::: .::.:: . ::.:.:::::: CCDS12 HTGEKPYECNDCGKAFSHSSSLTKHQRIHTGEKPYECNQCGRAFSQLAPLIQHQRIHTGE 500 510 520 530 540 550 390 400 410 420 430 440 pF1KE3 KPYECGECGKAFSRSSALIQHKKIHTGDKSYECIACGKAFGRSSILIEHQRIHTGEKPYE :::::..::.:::.:: ::.:..::: .: : : :::.:..:: : .:.: :::::::: CCDS12 KPYECNQCGRAFSQSSLLIEHQRIHTKEKPYGCNECGKSFSHSSSLSQHERTHTGEKPYE 560 570 580 590 600 610 450 460 470 480 490 pF1KE3 CNECGKSFNQSSALTQHQRIHTGEKPYECSECRKTFRHRSGLMQHQRTHTRV :..::::: ::. ::::.::::::::: : .: :.: : :.: .:::::: CCDS12 CHDCGKSFRQSTHLTQHRRIHTGEKPYACRDCGKAFTHSSSLTKHQRTHTG 620 630 640 650 660 670 494 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 05:55:31 2016 done: Sun Nov 6 05:55:32 2016 Total Scan time: 3.040 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]