FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3219, 495 aa 1>>>pF1KE3219 495 - 495 aa - 495 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.0989+/-0.00103; mu= 1.7579+/- 0.061 mean_var=243.5800+/-48.972, 0's: 0 Z-trim(113.4): 922 B-trim: 0 in 0/52 Lambda= 0.082178 statistics sampled from 13020 (14036) to 13020 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.763), E-opt: 0.2 (0.431), width: 16 Scan time: 3.670 The best scores are: opt bits E(32554) CCDS46203.1 ZSCAN5B gene_id:342933|Hs108|chr19 ( 495) 3458 423.0 3.6e-118 CCDS82403.1 ZSCAN5A gene_id:79149|Hs108|chr19 ( 495) 2716 335.0 1.1e-91 CCDS12941.1 ZSCAN5A gene_id:79149|Hs108|chr19 ( 496) 2699 333.0 4.5e-91 CCDS14648.1 ZNF75D gene_id:7626|Hs108|chrX ( 510) 709 97.1 4.8e-20 CCDS5671.2 ZSCAN25 gene_id:221785|Hs108|chr7 ( 544) 669 92.4 1.3e-18 CCDS42427.1 ZSCAN30 gene_id:100101467|Hs108|chr18 ( 494) 654 90.6 4.3e-18 CCDS35075.1 ZNF782 gene_id:158431|Hs108|chr9 ( 699) 597 84.0 6e-16 CCDS32383.1 ZNF500 gene_id:26048|Hs108|chr16 ( 480) 574 81.1 3e-15 CCDS14649.1 ZNF449 gene_id:203523|Hs108|chrX ( 518) 564 79.9 7.2e-15 CCDS31418.1 ZNF214 gene_id:7761|Hs108|chr11 ( 606) 565 80.1 7.5e-15 CCDS12947.1 ZNF71 gene_id:58491|Hs108|chr19 ( 489) 562 79.7 8.2e-15 CCDS12946.1 ZFP28 gene_id:140612|Hs108|chr19 ( 868) 565 80.2 9.8e-15 CCDS42504.1 ZNF709 gene_id:163051|Hs108|chr19 ( 641) 561 79.7 1.1e-14 CCDS42634.1 ZNF787 gene_id:126208|Hs108|chr19 ( 382) 554 78.6 1.3e-14 CCDS10494.2 ZNF205 gene_id:7755|Hs108|chr16 ( 554) 557 79.1 1.4e-14 CCDS35235.1 ZNF182 gene_id:7569|Hs108|chrX ( 620) 556 79.0 1.6e-14 CCDS35236.1 ZNF182 gene_id:7569|Hs108|chrX ( 639) 556 79.1 1.6e-14 CCDS62706.1 ZNF229 gene_id:7772|Hs108|chr19 ( 819) 557 79.3 1.8e-14 CCDS42574.1 ZNF229 gene_id:7772|Hs108|chr19 ( 825) 557 79.3 1.8e-14 CCDS77240.1 ZNF433 gene_id:163059|Hs108|chr19 ( 638) 554 78.8 1.9e-14 CCDS45983.1 ZNF433 gene_id:163059|Hs108|chr19 ( 673) 554 78.8 2e-14 CCDS33048.1 ZNF235 gene_id:9310|Hs108|chr19 ( 738) 554 78.9 2.1e-14 CCDS35074.1 ZNF510 gene_id:22869|Hs108|chr9 ( 683) 552 78.6 2.4e-14 CCDS4617.1 ZNF322 gene_id:79692|Hs108|chr6 ( 402) 546 77.7 2.6e-14 CCDS12634.1 ZNF155 gene_id:7711|Hs108|chr19 ( 538) 548 78.0 2.8e-14 CCDS58668.1 ZNF155 gene_id:7711|Hs108|chr19 ( 549) 548 78.1 2.8e-14 CCDS33122.1 ZNF470 gene_id:388566|Hs108|chr19 ( 717) 550 78.4 2.9e-14 CCDS12491.1 ZNF565 gene_id:147929|Hs108|chr19 ( 499) 546 77.8 3.1e-14 CCDS12504.1 ZNF570 gene_id:148268|Hs108|chr19 ( 536) 546 77.8 3.3e-14 CCDS54939.1 ZNF300 gene_id:91975|Hs108|chr5 ( 568) 546 77.8 3.4e-14 CCDS12962.2 ZNF776 gene_id:284309|Hs108|chr19 ( 518) 545 77.7 3.5e-14 CCDS74355.1 ZNF570 gene_id:148268|Hs108|chr19 ( 592) 546 77.8 3.5e-14 CCDS33047.1 ZNF233 gene_id:353355|Hs108|chr19 ( 670) 547 78.0 3.6e-14 CCDS4311.2 ZNF300 gene_id:91975|Hs108|chr5 ( 604) 546 77.9 3.6e-14 CCDS54940.1 ZNF300 gene_id:91975|Hs108|chr5 ( 620) 546 77.9 3.6e-14 CCDS56408.1 ZKSCAN3 gene_id:80317|Hs108|chr6 ( 390) 541 77.1 3.9e-14 CCDS76957.1 ZNF18 gene_id:7566|Hs108|chr17 ( 548) 544 77.6 3.9e-14 CCDS32568.1 ZNF18 gene_id:7566|Hs108|chr17 ( 549) 544 77.6 3.9e-14 CCDS46162.1 ZNF836 gene_id:162962|Hs108|chr19 ( 936) 547 78.1 4.6e-14 CCDS10686.1 ZNF689 gene_id:115509|Hs108|chr16 ( 500) 541 77.2 4.7e-14 CCDS66920.1 ZSCAN32 gene_id:54925|Hs108|chr16 ( 408) 539 76.9 4.7e-14 CCDS41502.1 ZNF239 gene_id:8187|Hs108|chr10 ( 458) 540 77.0 4.7e-14 CCDS4650.1 ZKSCAN3 gene_id:80317|Hs108|chr6 ( 538) 541 77.2 4.9e-14 CCDS2715.1 ZKSCAN7 gene_id:55888|Hs108|chr3 ( 754) 544 77.7 5e-14 CCDS75904.1 ZNF79 gene_id:7633|Hs108|chr9 ( 364) 537 76.6 5.1e-14 CCDS32890.2 ZNF358 gene_id:140467|Hs108|chr19 ( 568) 541 77.2 5.1e-14 CCDS10503.1 ZSCAN32 gene_id:54925|Hs108|chr16 ( 485) 539 76.9 5.4e-14 CCDS12495.1 ZNF567 gene_id:163081|Hs108|chr19 ( 616) 541 77.3 5.5e-14 CCDS42183.1 ZFP90 gene_id:146198|Hs108|chr16 ( 636) 541 77.3 5.6e-14 CCDS74349.1 ZNF567 gene_id:163081|Hs108|chr19 ( 647) 541 77.3 5.7e-14 >>CCDS46203.1 ZSCAN5B gene_id:342933|Hs108|chr19 (495 aa) initn: 3458 init1: 3458 opt: 3458 Z-score: 2234.9 bits: 423.0 E(32554): 3.6e-118 Smith-Waterman score: 3458; 99.8% identity (100.0% similar) in 495 aa overlap (1-495:1-495) 10 20 30 40 50 60 pF1KE3 MAANWTLSWGQGGPCNSPGSDTPRSVASPETQLGNHDRNPETWHMNFRMFSCPEESDPIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 MAANWTLSWGQGGPCNSPGSDTPRSVASPETQLGNHDRNPETWHMNFRMFSCPEESDPIQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 ALRKLTELCHLWLRPDLHTKEQILDMLVMEQFMISMPQELQVLVKVNGVQSCKDLEDLLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 ALRKLTELCHLWLRPDLHTKEQILDMLVMEQFMISMPQELQVLVKVNGVQSCKDLEDLLR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 NNRRPKKWSIVNLLGKEYLMLNSDVEMAEAPASVRDDPRDVSSQWASSVNQMHPGTGQAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 NNRRPKKWSIVNLLGKEYLMLNSDVEMAEAPASVRDDPRDVSSQWASSVNQMHPGTGQAR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 REQQILPRVAALSRRQGEDFLLHKSIDITGDPNSPRPKQTLEKDLKENREENPGLSSPEP :::::::::::::::::::::::::::.:::::::::::::::::::::::::::::::: CCDS46 REQQILPRVAALSRRQGEDFLLHKSIDVTGDPNSPRPKQTLEKDLKENREENPGLSSPEP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 QLPKSPNLVRAKEGKEPQKRASVENVDADTPSACVVEREALTHSGNRGDALNLSSPKRSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 QLPKSPNLVRAKEGKEPQKRASVENVDADTPSACVVEREALTHSGNRGDALNLSSPKRSK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 PDASSISQEEPQGEATPVGNRESPGQAEINPVHSPGPAGPVSHPDGQEAKALPPFACDVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 PDASSISQEEPQGEATPVGNRESPGQAEINPVHSPGPAGPVSHPDGQEAKALPPFACDVC 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 NKSFKYFSQLSIHRRSHTGDRPFQCDLCRKRFLQPSDLRVHQRVHTGERPYMCDVCQKRF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 NKSFKYFSQLSIHRRSHTGDRPFQCDLCRKRFLQPSDLRVHQRVHTGERPYMCDVCQKRF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 AHESTLQGHKRIHTGERPFKCKYCSKVFSHKGNLNVHQRTHSGEKPYKCPTCQKAFRQLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 AHESTLQGHKRIHTGERPFKCKYCSKVFSHKGNLNVHQRTHSGEKPYKCPTCQKAFRQLG 430 440 450 460 470 480 490 pF1KE3 TFKRHLKTHRETTSQ ::::::::::::::: CCDS46 TFKRHLKTHRETTSQ 490 >>CCDS82403.1 ZSCAN5A gene_id:79149|Hs108|chr19 (495 aa) initn: 2716 init1: 2716 opt: 2716 Z-score: 1759.5 bits: 335.0 E(32554): 1.1e-91 Smith-Waterman score: 2716; 79.2% identity (89.7% similar) in 495 aa overlap (1-495:1-495) 10 20 30 40 50 60 pF1KE3 MAANWTLSWGQGGPCNSPGSDTPRSVASPETQLGNHDRNPETWHMNFRMFSCPEESDPIQ :::: : ::. : :: :: . :::.:: :::::::: .:: :.::::::::.:::::: CCDS82 MAANCTSSWSLGESCNRPGLELPRSMASSETQLGNHDVDPEISHVNFRMFSCPKESDPIQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 ALRKLTELCHLWLRPDLHTKEQILDMLVMEQFMISMPQELQVLVKVNGVQSCKDLEDLLR :::::::::::::::::::::::::::::::::::::::::::: .:::::::::::::: CCDS82 ALRKLTELCHLWLRPDLHTKEQILDMLVMEQFMISMPQELQVLVMMNGVQSCKDLEDLLR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 NNRRPKKWSIVNLLGKEYLMLNSDVEMAEAPASVRDDPRDVSSQWASSVNQMHPGTGQAR :::::::::.:.. ::::.. .::.::::::.::::: .::::: :::::::.:: :::. CCDS82 NNRRPKKWSVVTFHGKEYIVQDSDIEMAEAPSSVRDDLKDVSSQRASSVNQMRPGEGQAH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 REQQILPRVAALSRRQGEDFLLHKSIDITGDPNSPRPKQTLEKDLKENREENPGLSSPEP :: :::::: :::::::::::::::::.::::.: ::::::::::::::::::::.:::: CCDS82 RELQILPRVPALSRRQGEDFLLHKSIDVTGDPKSLRPKQTLEKDLKENREENPGLTSPEP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 QLPKSPNLVRAKEGKEPQKRASVENVDADTPSACVVEREALTHSGNRGDALNLSSPKRSK :::::::::::::::.: : :::::::::::::::::::: ::::::::::::::::::: CCDS82 QLPKSPNLVRAKEGKDPPKIASVENVDADTPSACVVEREASTHSGNRGDALNLSSPKRSK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 PDASSISQEEPQGEATPVGNRESPGQAEINPVHSPGPAGPVSHPDGQEAKALPPFACDVC ::::::::::::::::::::::::::: .: .::::::.::::::::::::::::::::: CCDS82 PDASSISQEEPQGEATPVGNRESPGQAGMNSIHSPGPASPVSHPDGQEAKALPPFACDVC 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 NKSFKYFSQLSIHRRSHTGDRPFQCDLCRKRFLQPSDLRVHQRVHTGERPYMCDVCQKRF .: : :.: ::.:::::.: :::.:: :::.: .:. :::.::::::: ::::::.: CCDS82 EKRFTCNSKLVIHKRSHTGERLFQCNLCGKRFMQLISLQFHQRTHTGERPYTCDVCQKQF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 AHESTLQGHKRIHTGERPFKCKYCSKVFSHKGNLNVHQRTHSGEKPYKCPTCQKAFRQLG ...: :. ::: ::::.::.:: :.:::...:.:. ::: ::::::::: : .:: .: CCDS82 TQKSYLKCHKRSHTGEKPFECKDCKKVFTYRGSLKEHQRIHSGEKPYKCSKCPRAFSRLK 430 440 450 460 470 480 490 pF1KE3 TFKRHLKTHRETTSQ ..:: ::: :.::: CCDS82 LLRRHQKTHPEATSQ 490 >>CCDS12941.1 ZSCAN5A gene_id:79149|Hs108|chr19 (496 aa) initn: 2697 init1: 1387 opt: 2699 Z-score: 1748.6 bits: 333.0 E(32554): 4.5e-91 Smith-Waterman score: 2699; 78.8% identity (89.5% similar) in 496 aa overlap (1-495:1-496) 10 20 30 40 50 60 pF1KE3 MAANWTLSWGQGGPCNSPGSDTPRSVASPETQLGNHDRNPETWHMNFRMFSCPEESDPIQ :::: : ::. : :: :: . :::.:: :::::::: .:: :.::::::::.:::::: CCDS12 MAANCTSSWSLGESCNRPGLELPRSMASSETQLGNHDVDPEISHVNFRMFSCPKESDPIQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 ALRKLTELCHLWLRPDLHTKEQILDMLVMEQFMISMPQELQVLVKVNGVQSCKDLEDLLR :::::::::::::::::::::::::::::::::::::::::::: .:::::::::::::: CCDS12 ALRKLTELCHLWLRPDLHTKEQILDMLVMEQFMISMPQELQVLVMMNGVQSCKDLEDLLR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 NNRRPKKWSIVNLLGKEYLMLNSDVEMAEAPASVRDDPRDVSSQWASSVNQMHPGTGQAR :::::::::.:.. ::::.. .::.::::::.::::: .::::: :::::::.:: :::. CCDS12 NNRRPKKWSVVTFHGKEYIVQDSDIEMAEAPSSVRDDLKDVSSQRASSVNQMRPGEGQAH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 REQQILPRVAALSRRQGEDFLLHKSIDITGDPNSPRPKQTLEKDLKENREENPGLSSPEP :: :::::: :::::::::::::::::.::::.: ::::::::::::::::::::.:::: CCDS12 RELQILPRVPALSRRQGEDFLLHKSIDVTGDPKSLRPKQTLEKDLKENREENPGLTSPEP 190 200 210 220 230 240 250 260 270 280 290 pF1KE3 QLPKSP-NLVRAKEGKEPQKRASVENVDADTPSACVVEREALTHSGNRGDALNLSSPKRS :::::: .::::::::.: : :::::::::::::::::::: :::::::::::::::::: CCDS12 QLPKSPTDLVRAKEGKDPPKIASVENVDADTPSACVVEREASTHSGNRGDALNLSSPKRS 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE3 KPDASSISQEEPQGEATPVGNRESPGQAEINPVHSPGPAGPVSHPDGQEAKALPPFACDV :::::::::::::::::::::::::::: .: .::::::.:::::::::::::::::::: CCDS12 KPDASSISQEEPQGEATPVGNRESPGQAGMNSIHSPGPASPVSHPDGQEAKALPPFACDV 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE3 CNKSFKYFSQLSIHRRSHTGDRPFQCDLCRKRFLQPSDLRVHQRVHTGERPYMCDVCQKR :.: : :.: ::.:::::.: :::.:: :::.: .:. :::.::::::: ::::::. CCDS12 CEKRFTCNSKLVIHKRSHTGERLFQCNLCGKRFMQLISLQFHQRTHTGERPYTCDVCQKQ 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE3 FAHESTLQGHKRIHTGERPFKCKYCSKVFSHKGNLNVHQRTHSGEKPYKCPTCQKAFRQL :...: :. ::: ::::.::.:: :.:::...:.:. ::: ::::::::: : .:: .: CCDS12 FTQKSYLKCHKRSHTGEKPFECKDCKKVFTYRGSLKEHQRIHSGEKPYKCSKCPRAFSRL 430 440 450 460 470 480 480 490 pF1KE3 GTFKRHLKTHRETTSQ ..:: ::: :.::: CCDS12 KLLRRHQKTHPEATSQ 490 >>CCDS14648.1 ZNF75D gene_id:7626|Hs108|chrX (510 aa) initn: 700 init1: 512 opt: 709 Z-score: 473.4 bits: 97.1 E(32554): 4.8e-20 Smith-Waterman score: 709; 30.3% identity (55.1% similar) in 492 aa overlap (17-490:22-500) 10 20 30 40 50 pF1KE3 MAANWTLSWGQGGPCNSPGSDTPRSVASPETQLGNHDRNPETWHMNFRMFSCPEE . :: : : . . .. .::. .: : : CCDS14 MAMRELNADSCSSPQMGAMWETSGSVKENSSQSKKYSTKIENLGPESACRHFWSFRYHEA 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE3 SDPIQALRKLTELCHLWLRPDLHTKEQILDMLVMEQFMISMPQELQVLVKVNGVQSCKD- . :.... .: .::: ::::..:.:::::.:::.:::. .:.: : :. . :. :. CCDS14 TGPLETISQLQKLCHQWLRPEIHSKEQILEMLVLEQFLSILPKETQNWVQKHHPQNVKQA 70 80 90 100 110 120 120 130 140 150 160 pF1KE3 ---LEDLLRNNRRPKKWSIVNLLGKEYLMLNSDVEMAEAPA----SVRDDPRDVSSQ--W .: : :. :. .. :::: ..:.. : ::. .. .: : .. : CCDS14 LVLVEFLQREPDGTKNEVTAHELGKEAVLLGGT---AVAPGFKWKPAEPQPMGVFQKEYW 130 140 150 160 170 170 180 190 200 210 220 pF1KE3 AS-SVNQMHPGTGQARREQQILPRVAALSRRQGEDFLLHKSID---ITGDPNSPRPKQTL . : : . : . .. : . : :. .: . .: : ... :. . : CCDS14 NTYRVLQEQLGWNTHKETQPVYER--AVHDQQMLALSEQKRIKHWKMASKLILPESLSLL 180 190 200 210 220 230 230 240 250 260 270 pF1KE3 E-KDLKEN-REENPGLSSPEPQLPKSPNLVRAKEGKEPQKRASVENVDADTPSACVVERE .:. ::. : .: . . . : ... : : . : CCDS14 TFEDVAVYFSEEEWQLLNPLEKTLYNDVMQDIYETVISLGLKLKNDTGNDHPIS--VSTS 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE3 ALTHSGNRGDALNLSSPKRSKPDASSISQEEPQGEATPVG--NRESPGQAEINPVHSPGP . :: . .:. : : .....:.: :.. : .: : . . .:. CCDS14 EIQTSGCE-----VSKKTRMKIAQKTMGRENP-GDTHSVQKWHRAFPRKKRKKPATCKQE 300 310 320 330 340 340 350 360 370 380 390 pF1KE3 AGPVSHPDGQEAKALPPFACDVCNKSFKYFSQLSIHRRSHTGDRPFQCDLCRKRFLQPSD . :. . :: :. :.:::. :.: :.: :::..:..:. : .:: :: CCDS14 LPKLMDLHGKGPTGEKPFKCQECGKSFRVSSDLIKHHRIHTGEKPYKCQQCDRRFRWSSD 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE3 LRVHQRVHTGERPYMCDVCQKRFAHESTLQGHKRIHTGERPFKCKYCSKVFSHKGNLNVH : : .: : .:: :. : : :.:...:. :.::::::.:::: :.: : ....: : CCDS14 LNKHFMTHQGIKPYRCSWCGKSFSHNTNLHTHQRIHTGEKPFKCDECGKRFIQNSHLIKH 410 420 430 440 450 460 460 470 480 490 pF1KE3 QRTHSGEKPYKCPTCQKAFRQLGTFKRHLKTHRETTSQ ::::.::.:: : :.. : . ... :: : :: CCDS14 QRTHTGEQPYTCSLCKRNFSRRSSLLRHQKLHRRREACLVSPN 470 480 490 500 510 >>CCDS5671.2 ZSCAN25 gene_id:221785|Hs108|chr7 (544 aa) initn: 1013 init1: 304 opt: 669 Z-score: 447.4 bits: 92.4 E(32554): 1.3e-18 Smith-Waterman score: 734; 32.0% identity (57.4% similar) in 491 aa overlap (34-489:32-508) 10 20 30 40 50 60 pF1KE3 NWTLSWGQGGPCNSPGSDTPRSVASPETQLGNHDRNPETWHMNFRMFSCPEESDPIQALR : .: .:::... ::.: : . : .::: CCDS56 LKEHPEMAEAPQQQLGIPVVKLEKELPWGRGREDPSPETFRLRFRQFRYQEAAGPQEALR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 KLTELCHLWLRPDLHTKEQILDMLVMEQFMISMPQELQVLVKVNGVQSCKDLEDLLRN-N .: :::. ::::.::::::::..::.:::. .:.:. . .. .: .: : : .... . CCDS56 ELQELCRRWLRPELHTKEQILELLVLEQFLTILPREFYAWIREHGPESGKALAAMVEDLT 70 80 90 100 110 120 130 140 150 160 170 pF1KE3 RRPKKWSIVNLLGKEYLMLNSDVEMAEAPASVRDDPRDVSSQWA----SSVNQMHPGT-- .: . . : . .. . : :. .. : .:. .:. .:. ::: CCDS56 ERALEAKAVPCHRQGEQEETALCRGAWEPG-IQLGPVEVKPEWGMPPGEGVQGPDPGTEE 130 140 150 160 170 180 180 190 200 210 220 pF1KE3 ------GQARR--EQQILPRVAA---LSRRQGEDFLLHKSIDITGDPN-SPRPKQTLEKD :. : ..: :: . : : . .: . .. .:. . .: ..: CCDS56 QLSQDPGDETRAFQEQALPVLQAGPGLPAVNPRDQEMAAGFFTAGSQGLGPFKDMALAFP 190 200 210 220 230 240 230 240 250 260 270 pF1KE3 LKENREENPGLSS-----PEPQLPK-SPNL-VRAKEGKEPQKRASVENVDADTPSACV-V .: :. .:. . ::: . ::. . ::.: ::. : .: : . CCDS56 EEEWRHVTPAQIDCFGEYVEPQDCRVSPGGGSKEKEAKPPQE---------DLKGALVAL 250 260 270 280 290 280 290 300 310 320 330 pF1KE3 EREALTHSGNRGDALN-LSSPKRSKPDASSISQEEPQGEATPVGNRESPGQAEINPVHSP : . ... .: .:. . . . : .:. . :: : :. .. . .. .: . : CCDS56 TSERFGEASLQGPGLGRVCEQEPGGPAGSAPGLPPPQHGAIPLPDEVKTHSSFWKPFQCP 300 310 320 330 340 350 340 350 360 370 380 pF1KE3 --GP-----AGPVSHPDGQEAKALPPFACDVCNKSFKYFSQLSIHRRSHTGDRPFQCDLC : .. : : .: :. ..: :.:.: : :.:.: : ::. :. : CCDS56 ECGKGFSRSSNLVRHQRTHEEKS---YGCVECGKGFTLREYLMKHQRTHLGKRPYVCSEC 360 370 380 390 400 390 400 410 420 430 440 pF1KE3 RKRFLQPSDLRVHQRVHTGERPYMCDVCQKRFAHESTLQGHKRIHTGERPFKCKYCSKVF : : : :.:::: ::::.:: : : : :.... :: :.: ::::.:. :. :.: : CCDS56 WKTFSQRHHLEVHQRSHTGEKPYKCGDCWKSFSRRQHLQVHRRTHTGEKPYTCE-CGKSF 410 420 430 440 450 460 450 460 470 480 490 pF1KE3 SHKGNLNVHQRTHSGEKPYKCPTCQKAFRQLGTFKRHLKTHRETTSQ :...:: ::.:.:.::::: : .: : : . . :: . : CCDS56 SRNANLAVHRRAHTGEKPYGCQVCGKRFSKGERLVRHQRIHTGEKPYHCPACGRSFNQRS 470 480 490 500 510 520 CCDS56 ILNRHQKTQHRQEPLVQ 530 540 >>CCDS42427.1 ZSCAN30 gene_id:100101467|Hs108|chr18 (494 aa) initn: 895 init1: 432 opt: 654 Z-score: 438.3 bits: 90.6 E(32554): 4.3e-18 Smith-Waterman score: 658; 29.9% identity (56.6% similar) in 488 aa overlap (39-489:40-491) 10 20 30 40 50 60 pF1KE3 WGQGGPCNSPGSDTPRSVASPETQLGNHDRNP---ETWHMNFRMFSCPEESDPIQALRKL :: :.....::.:: . . : .:: .: CCDS42 YHAPEEQEGLLVVKVEEENYVLDQDFGLQENPWSQEVFRQKFRQFSYSDSTGPREALSRL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 TELCHLWLRPDLHTKEQILDMLVMEQFMISMPQELQVLVKV----NGVQSCKDLEDLLRN ::: ::::..:.:::::..:..:::. .:.:::. .. :: .. ::.: .. CCDS42 RELCCQWLRPEVHSKEQILELLMLEQFLAILPEELQAWLREHRPENGEEAVTMLEELEKE 70 80 90 100 110 120 130 140 150 160 pF1KE3 NRRPKK----------WSIVNLLGK-EYLMLNSDV---------EMAEAPASVRDDPRDV ..:.. :. .. : . : ::: : : :. : . : : : CCDS42 LEEPRQQDTTHGQEMFWQEMTSTGALKSLSLNSPVQPLENQCKTETQESQAFQERDGRMV 130 140 150 160 170 180 170 180 190 200 210 pF1KE3 SSQW----------ASSVNQMHPGTGQARREQQILPRVAALSRRQGEDFLLHKSIDITGD ... ..:. .. :: .. ..: :.: . : : ... . .:. CCDS42 AGKVLMAKQEIVECVASAAMISPGKLPGETHSQ---RIAEEAL-GGLDNSKKQKGNAAGN 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE3 PNSPRPKQTLEKDLKENREENPGLSSPEPQLPKSPNLVRAKEGKEPQKRASVENVDADTP : :.: ... .:.. . ..: ... :..: . :... : CCDS42 KISQLPSQ----------DRHFSLATFNRRIPTEHSVL---ESHESEGSFSMNSNDITQQ 250 260 270 280 290 280 290 300 310 320 330 pF1KE3 SACVVEREALTHSGNRGDALNLSSPKRSKPDASSISQEEPQGEATPVGNRESPGQAEINP : : :: : . . : :. :: . : ... . : . .: :.: CCDS42 S--VDTREKLYECFDCGKAFCQSS--------KLIRHQRIHTGERPYACKEC-GKA---- 300 310 320 330 340 350 360 370 380 390 pF1KE3 VHSPGPAGPVSHPDGQEAKALPPFACDVCNKSFKYFSQLSIHRRSHTGDRPFQCDLCRKR . : : . .. :. : :.:.:. :.: ::: :::..:..: : : CCDS42 --FSLSSDLVRHQRIHSGE--KPYECCECGKAFRGSSELIRHRRIHTGEKPYECGECGKA 340 350 360 370 380 390 400 410 420 430 440 450 pF1KE3 FLQPSDLRVHQRVHTGERPYMCDVCQKRFAHESTLQGHKRIHTGERPFKCKYCSKVFSHK : . : : :...:::.. : : .: : :.. : : :.::::::.:..:. :.: :... CCDS42 FSRSSALIQHKKIHTGDKSYECIACGKAFGRSSILIEHQRIHTGEKPYECNECGKSFNQS 400 410 420 430 440 450 460 470 480 490 pF1KE3 GNLNVHQRTHSGEKPYKCPTCQKAFRQLGTFKRHLKTHRETTSQ . :. ::: :.:::::.: :.:.::. . . .: .:: CCDS42 SALTQHQRIHTGEKPYECSECRKTFRHRSGLMQHQRTHTRV 460 470 480 490 >>CCDS35075.1 ZNF782 gene_id:158431|Hs108|chr9 (699 aa) initn: 1014 init1: 597 opt: 597 Z-score: 399.8 bits: 84.0 E(32554): 6e-16 Smith-Waterman score: 597; 55.1% identity (81.6% similar) in 136 aa overlap (354-489:477-612) 330 340 350 360 370 380 pF1KE3 PGQAEINPVHSPGPAGPVSHPDGQEAKALPPFACDVCNKSFKYFSQLSIHRRSHTGDRPF :: :. :.:::...: : :::.:::.::. CCDS35 EKPFECHECGKSFNYKSILIVHQRTHTGEKPFECNECGKSFSHMSGLRNHRRTHTGERPY 450 460 470 480 490 500 390 400 410 420 430 440 pF1KE3 QCDLCRKRFLQPSDLRVHQRVHTGERPYMCDVCQKRFAHESTLQGHKRIHTGERPFKCKY .:: : : : : :: :.:.::::.:: :. : : :...: :.::.::::::.:.::.. CCDS35 KCDECGKAFKLKSGLRKHHRTHTGEKPYKCNQCGKAFGQKSQLRGHHRIHTGEKPYKCNH 510 520 530 540 550 560 450 460 470 480 490 pF1KE3 CSKVFSHKGNLNVHQRTHSGEKPYKCPTCQKAFRQLGTFKRHLKTHRETTSQ :...::.:.:: ::.:::.:::::.: : :.::: .... : .:: CCDS35 CGEAFSQKSNLRVHHRTHTGEKPYQCEECGKTFRQKSNLRGHQRTHTGEKPYECNECGKA 570 580 590 600 610 620 CCDS35 FSEKSVLRKHQRTHTGEKPYNCNQCGEAFSQKSNLRVHQRTHTGEKPYKCDKCGRTFSQK 630 640 650 660 670 680 >>CCDS32383.1 ZNF500 gene_id:26048|Hs108|chr16 (480 aa) initn: 821 init1: 532 opt: 574 Z-score: 387.2 bits: 81.1 E(32554): 3e-15 Smith-Waterman score: 781; 33.7% identity (60.3% similar) in 469 aa overlap (30-489:36-459) 10 20 30 40 50 pF1KE3 MAANWTLSWGQGGPCNSPGSDTPRSVASPETQLGNHDRNPETWHMNFRMFSCPEESDPI : .. ..: .:::... ::.: : . : CCDS32 GLQPLPTLEQDLEQEEILIVKVEEDFCLEEEPSVETEDPSPETFRQLFRLFCYQEVAGPR 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE3 QALRKLTELCHLWLRPDLHTKEQILDMLVMEQFMISMPQELQVLVKVNGVQSCKDLEDLL .:: .: ::: ::::.:.::::::..::.:::. .: :.:. :. . .: .. :. CCDS32 EALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPESGEEAVVLV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE3 RN-NRRPKKWSIVNLLGKEYLMLNSDVEMAEAPASVRDDPRDVSSQWASSVNQMHPGT-- .. .:.:.: :.: : :: :. : ...:. . . .: CCDS32 EGLQRKPRKH---RQRGSELL---SDDEV----------PLGIGGQFLKHQAEAQPEDLS 130 140 150 160 180 190 200 210 220 230 pF1KE3 --GQARREQQILPRVAALSRRQGEDFLLHKSIDITGDPNSPRPKQTLEKDLKENREENPG .:: .: : : ::.: . :: : : .:: . : .: CCDS32 LEEEARFSSQQPP--AQLSHRPQRGPLLWPE---RGPP-APRHQ--------EMASASPF 170 180 190 200 210 240 250 260 270 280 290 pF1KE3 LSSPEPQLPKS-PNLVRAKEGKEPQKRASVENVDADTPSACVVEREALTHSGNRGDALNL ::. :.: . ... :.::. .. .. :.: .: :. . . : CCDS32 LSA-WSQVPVNLEDVAVYLSGEEPR---CMDPAQRDAP----LENEGPGIQLEDGGDGRE 220 230 240 250 260 300 310 320 330 340 350 pF1KE3 SSPKRSKPDASSISQEEPQGEATPV-GNRESPGQAEINPVHSPGPAGPVSHPDGQEAK-- ..: : . . . . :: . :. :.: .: .. . : . : :: : :..:. CCDS32 DAPLRM--EWYRVLSARCQGPGHPLPGQRPAPVRGLVRPDQPRG--GP---PPGRRASHG 270 280 290 300 310 320 360 370 380 390 400 410 pF1KE3 ALPPFACDVCNKSFKYFSQLSIHRRSHTGDRPFQCDLCRKRFLQPSDLRVHQRVHTGERP : :..: :.:.:. :.:. :.:.:::.::..: .: : : . :.. .::::::::.: CCDS32 ADKPYTCPECGKGFSKTSHLTKHQRTHTGERPYKCLVCGKGFSDRSNFSTHQRVHTGEKP 330 340 350 360 370 380 420 430 440 450 460 470 pF1KE3 YMCDVCQKRFAHESTLQGHKRIHTGERPFKCKYCSKVFSHKGNLNVHQRTHSGEKPYKCP : : : :::.. :.: :.: :.::::. : :.: :........:.:::.::::: :: CCDS32 YPCPECGKRFSQSSSLVIHRRTHSGERPYACTQCGKRFNNSSHFSAHRRTHTGEKPYTCP 390 400 410 420 430 440 480 490 pF1KE3 TCQKAFRQLGTFKRHLKTHRETTSQ .: ..::. ...: .:: CCDS32 ACGRGFRRGTDLHKHQRTHMGAGSLPTLQPVAPGGPGAKA 450 460 470 480 >>CCDS14649.1 ZNF449 gene_id:203523|Hs108|chrX (518 aa) initn: 1165 init1: 481 opt: 564 Z-score: 380.4 bits: 79.9 E(32554): 7.2e-15 Smith-Waterman score: 737; 32.3% identity (58.4% similar) in 474 aa overlap (36-491:22-459) 10 20 30 40 50 60 pF1KE3 TLSWGQGGPCNSPGSDTPRSVASPETQLGNHDRNPETWHMNFRMFSCPEESDPIQALRKL .: . :.... ::.:. : . : .:. :: CCDS14 MAVALGCAIQASLNQGSVFQEYDTDCEVFRQRFRQFQYREAAGPHEAFNKL 10 20 30 40 50 70 80 90 100 110 120 pF1KE3 TELCHLWLRPDLHTKEQILDMLVMEQFMISMPQELQVLVKV----NGVQSCKDLEDLLRN ::: ::.: ...:::::..::.:::. .: :... :. : . . .::: :. CCDS14 WELCCQWLKPKMRSKEQILELLVLEQFLTILPTEIETWVREHCPENRERVVSLIEDLQRE 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE3 NRRPKKWSIVNLLGKEYLMLNSDVEMAEAPASVR-DDPRDVSSQWASSVNQMHPGTGQAR . :.. .. . : : . : :. : ... ..: . . . : : ...: CCDS14 LEIPEQQVDMHDMLLEEL---APVGTAHIPPTMHLESP----ALQVMGPAQEAP-VAEAW 120 130 140 150 160 190 200 210 220 230 240 pF1KE3 REQQILPRVAALSRRQGEDFLLHKSIDITGDPNSPRPKQTLEKDLKENREENPGLSSPEP : :.. . . ..:: ::. : :: .. .: ::::: : .. : CCDS14 IPQAGPPELNYGATGECQNFL---------DPGYPLPKLDMNFSL-ENREE-PWVK--EL 170 180 190 200 210 250 260 270 280 290 pF1KE3 QLPKS-PNLVRAKEGKE-----PQKRASVENVDADTPSACVVEREALTHSGNRGDALNLS : : .:. .: : : . .. ..... : ..: .:: . : ..: CCDS14 QDSKEMKQLLDSKIGFEIGIENEEDTSKQKKMETMYPFIVTLEGNALQGPILQKDYVQLE 220 230 240 250 260 270 300 310 320 330 340 pF1KE3 SPKRSKPD------ASSISQEEPQ-GEATPVGNRESPGQAEINPVHSPGPAGPVSHPDGQ . .. :. :. ..:..: ::. .: : : .:: .: . CCDS14 NQWETPPEDLQTDLAKLVDQQNPTLGETPENSNLEEP----LNP-----------KPHKK 280 290 300 310 350 360 370 380 390 400 pF1KE3 EAKALPPFACDVCNKSFKYFSQLSIHRRSHTGDRPFQCDLCRKRFLQPSDLRVHQRVHTG .. . : : :.: : :::. :.: :.:..: .: : ::::. ::: :::.::: CCDS14 KSPGEKPHRCPQCGKCFARKSQLTGHQRIHSGEEPHKCPECGKRFLRSSDLYRHQRLHTG 320 330 340 350 360 370 410 420 430 440 450 460 pF1KE3 ERPYMCDVCQKRFAHESTLQGHKRIHTGERPFKCKYCSKVFSHKGNLNVHQRTHSGEKPY :::: : ::.:::...: : ::.: :. :. .:: :.: : : ..:. : .::.::::. CCDS14 ERPYECTVCKKRFTRRSHLIGHQRTHSEEETYKCLECGKSFCHGSSLKRHLKTHTGEKPH 380 390 400 410 420 430 470 480 490 pF1KE3 KCPTCQKAFRQLGTFKRHLKTHRETTSQ .: .: :.: .: .. : .:: : CCDS14 RCHNCGKSFSRLTALTLHQRTHTEERPFKCNYCGKSFRQRPSLVIHLRIHTGEKPYKCTH 440 450 460 470 480 490 >>CCDS31418.1 ZNF214 gene_id:7761|Hs108|chr11 (606 aa) initn: 3055 init1: 565 opt: 565 Z-score: 380.1 bits: 80.1 E(32554): 7.5e-15 Smith-Waterman score: 565; 51.5% identity (77.2% similar) in 136 aa overlap (354-489:357-492) 330 340 350 360 370 380 pF1KE3 PGQAEINPVHSPGPAGPVSHPDGQEAKALPPFACDVCNKSFKYFSQLSIHRRSHTGDRPF :: :. :.:::. : : .:.: :::..:. CCDS31 EEKFYKIECDKDLSRNSLLHIHQRLHIGEKPFKCNQCGKSFNRSSVLHVHQRVHTGEKPY 330 340 350 360 370 380 390 400 410 420 430 440 pF1KE3 QCDLCRKRFLQPSDLRVHQRVHTGERPYMCDVCQKRFAHESTLQGHKRIHTGERPFKCKY .:: : : : : :.::.:: :::::. : :. : : :...:.:: :.:.::::.:.:: CCDS31 KCDECGKGFSQSSNLRIHQLVHTGEKSYKCEDCGKGFTQRSNLQIHQRVHTGEKPYKCDD 390 400 410 420 430 440 450 460 470 480 490 pF1KE3 CSKVFSHKGNLNVHQRTHSGEKPYKCPTCQKAFRQLGTFKRHLKTHRETTSQ :.: :::...: .:::.:.::::: :: : :.: . . .. : ..: CCDS31 CGKDFSHSSDLRIHQRVHTGEKPYTCPECGKGFSKSSKLHTHQRVHTGEKPYKCEECGKG 450 460 470 480 490 500 CCDS31 FSQRSHLLIHQRVHTGEKPYKCHDCGKGFSHSSNLHIHQRVHTGEKPYQCAKCGKGFSHS 510 520 530 540 550 560 495 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 16:54:16 2016 done: Mon Nov 7 16:54:17 2016 Total Scan time: 3.670 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]