FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7847, 545 aa 1>>>pF1KB7847 545 - 545 aa - 545 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.1115+/-0.00129; mu= 16.8615+/- 0.077 mean_var=227.0247+/-43.902, 0's: 0 Z-trim(110.2): 927 B-trim: 146 in 1/50 Lambda= 0.085121 statistics sampled from 10384 (11408) to 10384 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.699), E-opt: 0.2 (0.35), width: 16 Scan time: 3.690 The best scores are: opt bits E(32554) CCDS4647.1 ZKSCAN4 gene_id:387032|Hs108|chr6 ( 545) 3771 476.8 2.8e-134 CCDS4650.1 ZKSCAN3 gene_id:80317|Hs108|chr6 ( 538) 3098 394.2 2.1e-109 CCDS56408.1 ZKSCAN3 gene_id:80317|Hs108|chr6 ( 390) 2304 296.4 4e-80 CCDS4645.1 ZKSCAN8 gene_id:7745|Hs108|chr6 ( 578) 1543 203.3 6.7e-52 CCDS5666.1 ZNF394 gene_id:84124|Hs108|chr7 ( 561) 1061 144.0 4.3e-34 CCDS12975.1 ZSCAN22 gene_id:342945|Hs108|chr19 ( 491) 1036 140.9 3.4e-33 CCDS4643.1 ZNF165 gene_id:7718|Hs108|chr6 ( 485) 1017 138.5 1.7e-32 CCDS32383.1 ZNF500 gene_id:26048|Hs108|chr16 ( 480) 1008 137.4 3.6e-32 CCDS78119.1 ZSCAN26 gene_id:7741|Hs108|chr6 ( 478) 1003 136.8 5.6e-32 CCDS10495.1 ZNF213 gene_id:7760|Hs108|chr16 ( 459) 971 132.8 8.3e-31 CCDS233.1 ZNF436 gene_id:80818|Hs108|chr1 ( 470) 966 132.3 1.3e-30 CCDS11179.2 ZNF287 gene_id:57336|Hs108|chr17 ( 761) 955 131.2 4.2e-30 CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 947 130.1 7.5e-30 CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 947 130.2 7.7e-30 CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 947 130.2 7.8e-30 CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 947 130.2 7.9e-30 CCDS83401.1 ZNF883 gene_id:169834|Hs108|chr9 ( 379) 938 128.7 1.2e-29 CCDS58688.1 ZNF211 gene_id:10520|Hs108|chr19 ( 503) 937 128.7 1.6e-29 CCDS58687.1 ZNF211 gene_id:10520|Hs108|chr19 ( 555) 937 128.8 1.7e-29 CCDS12957.1 ZNF211 gene_id:10520|Hs108|chr19 ( 564) 937 128.8 1.7e-29 CCDS12947.1 ZNF71 gene_id:58491|Hs108|chr19 ( 489) 936 128.6 1.7e-29 CCDS12956.1 ZNF211 gene_id:10520|Hs108|chr19 ( 577) 937 128.8 1.7e-29 CCDS74468.1 ZNF211 gene_id:10520|Hs108|chr19 ( 616) 937 128.9 1.7e-29 CCDS58686.1 ZNF211 gene_id:10520|Hs108|chr19 ( 629) 937 128.9 1.8e-29 CCDS62707.1 ZNF180 gene_id:7733|Hs108|chr19 ( 665) 929 127.9 3.6e-29 CCDS62708.1 ZNF180 gene_id:7733|Hs108|chr19 ( 667) 929 128.0 3.6e-29 CCDS12639.1 ZNF180 gene_id:7733|Hs108|chr19 ( 692) 929 128.0 3.7e-29 CCDS6755.1 ZNF189 gene_id:7743|Hs108|chr9 ( 584) 923 127.1 5.6e-29 CCDS35075.1 ZNF782 gene_id:158431|Hs108|chr9 ( 699) 924 127.4 5.6e-29 CCDS65096.1 ZNF189 gene_id:7743|Hs108|chr9 ( 612) 923 127.2 5.7e-29 CCDS6754.1 ZNF189 gene_id:7743|Hs108|chr9 ( 626) 923 127.2 5.8e-29 CCDS6437.1 ZNF16 gene_id:7564|Hs108|chr8 ( 682) 920 126.9 7.8e-29 CCDS75846.1 ZNF658 gene_id:26149|Hs108|chr9 (1059) 922 127.4 8.3e-29 CCDS11067.1 ZFP3 gene_id:124961|Hs108|chr17 ( 502) 917 126.3 8.6e-29 CCDS46211.1 ZNF419 gene_id:79744|Hs108|chr19 ( 464) 916 126.1 9e-29 CCDS12414.2 ZNF681 gene_id:148213|Hs108|chr19 ( 645) 918 126.6 9e-29 CCDS42637.1 ZNF419 gene_id:79744|Hs108|chr19 ( 478) 916 126.1 9.1e-29 CCDS12861.1 ZNF677 gene_id:342926|Hs108|chr19 ( 584) 917 126.4 9.3e-29 CCDS54328.1 ZNF419 gene_id:79744|Hs108|chr19 ( 497) 916 126.2 9.3e-29 CCDS54327.1 ZNF419 gene_id:79744|Hs108|chr19 ( 498) 916 126.2 9.3e-29 CCDS54326.1 ZNF419 gene_id:79744|Hs108|chr19 ( 510) 916 126.2 9.5e-29 CCDS54325.1 ZNF419 gene_id:79744|Hs108|chr19 ( 511) 916 126.2 9.5e-29 CCDS35106.1 ZNF483 gene_id:158399|Hs108|chr9 ( 744) 917 126.6 1.1e-28 CCDS12497.1 ZNF345 gene_id:25850|Hs108|chr19 ( 488) 911 125.5 1.4e-28 CCDS64999.1 ZNF7 gene_id:7553|Hs108|chr8 ( 590) 912 125.8 1.4e-28 CCDS47352.1 ZNF879 gene_id:345462|Hs108|chr5 ( 563) 911 125.6 1.5e-28 CCDS6435.1 ZNF7 gene_id:7553|Hs108|chr8 ( 686) 912 125.9 1.6e-28 CCDS64996.1 ZNF7 gene_id:7553|Hs108|chr8 ( 697) 912 125.9 1.6e-28 CCDS33090.1 ZNF616 gene_id:90317|Hs108|chr19 ( 781) 911 125.8 1.8e-28 CCDS82413.1 ZNF544 gene_id:27300|Hs108|chr19 ( 687) 910 125.6 1.8e-28 >>CCDS4647.1 ZKSCAN4 gene_id:387032|Hs108|chr6 (545 aa) initn: 3771 init1: 3771 opt: 3771 Z-score: 2524.2 bits: 476.8 E(32554): 2.8e-134 Smith-Waterman score: 3771; 100.0% identity (100.0% similar) in 545 aa overlap (1-545:1-545) 10 20 30 40 50 60 pF1KB7 MAREPRKNAALDAQSAEDQTGLLTVKVEKEEASALTAEVRAPCSPARGPERSRQRFRGFR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 MAREPRKNAALDAQSAEDQTGLLTVKVEKEEASALTAEVRAPCSPARGPERSRQRFRGFR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 YPEAAGPREALSRLRELCGQWLQPEMHSKEQILELLVLEQFLTILPGNLQSWVREQHPES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 YPEAAGPREALSRLRELCGQWLQPEMHSKEQILELLVLEQFLTILPGNLQSWVREQHPES 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 GEEVVVLLEYLERQLDEPAPQVPVGDQGQELLCCKMALLTQTQGSQSSQCQPMKALFKHE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 GEEVVVLLEYLERQLDEPAPQVPVGDQGQELLCCKMALLTQTQGSQSSQCQPMKALFKHE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 SLGSQPLHDRVLQVPGLAQGGCCREDAMVASRLTPGSQGLLKMEDVALTLTPGWTQLDSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 SLGSQPLHDRVLQVPGLAQGGCCREDAMVASRLTPGSQGLLKMEDVALTLTPGWTQLDSS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 QVNLYRDEKQENHSSLVSLGGEIQTKSRDLPPVKKLPEKEHGKICHLREDIAQIPTHAEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 QVNLYRDEKQENHSSLVSLGGEIQTKSRDLPPVKKLPEKEHGKICHLREDIAQIPTHAEA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 GEQEGRLQRKQKNAIGSRRHYCHECGKSFAQSSGLTKHRRIHTGEKPYECEDCGKTFIGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 GEQEGRLQRKQKNAIGSRRHYCHECGKSFAQSSGLTKHRRIHTGEKPYECEDCGKTFIGS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 SALVIHQRVHTGEKPYECEECGKVFSHSSNLIKHQRTHTGEKPYECDDCGKTFSQSCSLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 SALVIHQRVHTGEKPYECEECGKVFSHSSNLIKHQRTHTGEKPYECDDCGKTFSQSCSLL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB7 EHHKIHTGEKPYQCNMCGKAFRRNSHLLRHQRIHGDKNVQNPEHGESWESQGRTESQWEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 EHHKIHTGEKPYQCNMCGKAFRRNSHLLRHQRIHGDKNVQNPEHGESWESQGRTESQWEN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB7 TEAPVSYKCNECERSFTRNRSLIEHQKIHTGEKPYQCDTCGKGFTRTSYLVQHQRSHVGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 TEAPVSYKCNECERSFTRNRSLIEHQKIHTGEKPYQCDTCGKGFTRTSYLVQHQRSHVGK 490 500 510 520 530 540 pF1KB7 KTLSQ ::::: CCDS46 KTLSQ >>CCDS4650.1 ZKSCAN3 gene_id:80317|Hs108|chr6 (538 aa) initn: 1613 init1: 1613 opt: 3098 Z-score: 2077.6 bits: 394.2 E(32554): 2.1e-109 Smith-Waterman score: 3098; 84.1% identity (91.6% similar) in 547 aa overlap (1-545:1-538) 10 20 30 40 50 60 pF1KB7 MAREPRKNAALDAQSAEDQTGLLTVKVEKEEASALTAEVRAPCSPARGPERSRQRFRGFR :::: ...::::::.::: ::..:::.:::. : :: : : ::.:::::: CCDS46 MARELSESTALDAQSTEDQMELLVIKVEEEEAGF-------PSSPDLGSEGSRERFRGFR 10 20 30 40 50 70 80 90 100 110 120 pF1KB7 YPEAAGPREALSRLRELCGQWLQPEMHSKEQILELLVLEQFLTILPGNLQSWVREQHPES :::::::::::::::::: ::::::::::::::::::::::::::::::::::::::::: CCDS46 YPEAAGPREALSRLRELCRQWLQPEMHSKEQILELLVLEQFLTILPGNLQSWVREQHPES 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB7 GEEVVVLLEYLERQLDEPAPQVPVGDQGQELLCCKMALLTQTQGSQSSQCQPMKALFKHE :::::::::::::::::::::: ::::::::::::::: . :::::: : ::::.::: CCDS46 GEEVVVLLEYLERQLDEPAPQVSGVDQGQELLCCKMALLTPAPGSQSSQFQLMKALLKHE 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB7 SLGSQPLHDRVLQVPGLAQGGCCREDAMVASRLTPGSQGLLKMEDVALTLTPGWTQLDSS :.:::::.::::::: ::.::::::: .::::::: ::::::.::::::::: ::: ::: CCDS46 SVGSQPLQDRVLQVPVLAHGGCCREDKVVASRLTPESQGLLKVEDVALTLTPEWTQQDSS 180 190 200 210 220 230 250 260 270 280 290 pF1KB7 QVNLYRDEKQENHSSLVSLGGEIQTKSRDLPPVKKLPEKEHGKI-CHLREDIAQIPTHAE : :: ::::::::.:::::: : :::::::::...::::::::: :::::::::::: :: CCDS46 QGNLCRDEKQENHGSLVSLGDEKQTKSRDLPPAEELPEKEHGKISCHLREDIAQIPTCAE 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB7 AGEQEGRLQRKQKNAIGSRRHYCHECGKSFAQSSGLTKHRRIHTGEKPYECEDCGKTFIG ::::::::::::::: :.::: ::::::::::::::.:::::::::::::::.:::.::: CCDS46 AGEQEGRLQRKQKNATGGRRHICHECGKSFAQSSGLSKHRRIHTGEKPYECEECGKAFIG 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB7 SSALVIHQRVHTGEKPYECEECGKVFSHSSNLIKHQRTHTGEKPYECDDCGKTFSQSCSL ::::::::::::::::::::::::.:::::.::::::::::::::::::::::::::::: CCDS46 SSALVIHQRVHTGEKPYECEECGKAFSHSSDLIKHQRTHTGEKPYECDDCGKTFSQSCSL 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB7 LEHHKIHTGEKPYQCNMCGKAFRRNSHLLRHQRIH-GDKNVQNPEHGESWESQGRTESQW ::::.::::::::::.::::::::.:::::::::: ::::::.::.::.:.: : ::: CCDS46 LEHHRIHTGEKPYQCSMCGKAFRRSSHLLRHQRIHTGDKNVQEPEQGEAWKS--RMESQL 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB7 ENTEAPVSYKCNECERSFTRNRSLIEHQKIHTGEKPYQCDTCGKGFTRTSYLVQHQRSHV ::.:.:.::::::::::::.: .::::::::::::::::..::::::: ::::::::::: CCDS46 ENVETPMSYKCNECERSFTQNTGLIEHQKIHTGEKPYQCNACGKGFTRISYLVQHQRSHV 480 490 500 510 520 530 540 pF1KB7 GKKTLSQ ::. ::: CCDS46 GKNILSQ >>CCDS56408.1 ZKSCAN3 gene_id:80317|Hs108|chr6 (390 aa) initn: 1342 init1: 1154 opt: 2304 Z-score: 1551.9 bits: 296.4 E(32554): 4e-80 Smith-Waterman score: 2304; 85.5% identity (93.6% similar) in 392 aa overlap (156-545:1-390) 130 140 150 160 170 180 pF1KB7 VLLEYLERQLDEPAPQVPVGDQGQELLCCKMALLTQTQGSQSSQCQPMKALFKHESLGSQ ::::: . :::::: : ::::.::::.::: CCDS56 MALLTPAPGSQSSQFQLMKALLKHESVGSQ 10 20 30 190 200 210 220 230 240 pF1KB7 PLHDRVLQVPGLAQGGCCREDAMVASRLTPGSQGLLKMEDVALTLTPGWTQLDSSQVNLY ::.::::::: ::.::::::: .::::::: ::::::.::::::::: ::: :::: :: CCDS56 PLQDRVLQVPVLAHGGCCREDKVVASRLTPESQGLLKVEDVALTLTPEWTQQDSSQGNLC 40 50 60 70 80 90 250 260 270 280 290 300 pF1KB7 RDEKQENHSSLVSLGGEIQTKSRDLPPVKKLPEKEHGKI-CHLREDIAQIPTHAEAGEQE ::::::::.:::::: : :::::::::...::::::::: :::::::::::: ::::::: CCDS56 RDEKQENHGSLVSLGDEKQTKSRDLPPAEELPEKEHGKISCHLREDIAQIPTCAEAGEQE 100 110 120 130 140 150 310 320 330 340 350 360 pF1KB7 GRLQRKQKNAIGSRRHYCHECGKSFAQSSGLTKHRRIHTGEKPYECEDCGKTFIGSSALV :::::::::: :.::: ::::::::::::::.:::::::::::::::.:::.:::::::: CCDS56 GRLQRKQKNATGGRRHICHECGKSFAQSSGLSKHRRIHTGEKPYECEECGKAFIGSSALV 160 170 180 190 200 210 370 380 390 400 410 420 pF1KB7 IHQRVHTGEKPYECEECGKVFSHSSNLIKHQRTHTGEKPYECDDCGKTFSQSCSLLEHHK :::::::::::::::::::.:::::.:::::::::::::::::::::::::::::::::. CCDS56 IHQRVHTGEKPYECEECGKAFSHSSDLIKHQRTHTGEKPYECDDCGKTFSQSCSLLEHHR 220 230 240 250 260 270 430 440 450 460 470 480 pF1KB7 IHTGEKPYQCNMCGKAFRRNSHLLRHQRIH-GDKNVQNPEHGESWESQGRTESQWENTEA ::::::::::.::::::::.:::::::::: ::::::.::.::.:.: : ::: ::.:. CCDS56 IHTGEKPYQCSMCGKAFRRSSHLLRHQRIHTGDKNVQEPEQGEAWKS--RMESQLENVET 280 290 300 310 320 490 500 510 520 530 540 pF1KB7 PVSYKCNECERSFTRNRSLIEHQKIHTGEKPYQCDTCGKGFTRTSYLVQHQRSHVGKKTL :.::::::::::::.: .::::::::::::::::..::::::: :::::::::::::. : CCDS56 PMSYKCNECERSFTQNTGLIEHQKIHTGEKPYQCNACGKGFTRISYLVQHQRSHVGKNIL 330 340 350 360 370 380 pF1KB7 SQ :: CCDS56 SQ 390 >>CCDS4645.1 ZKSCAN8 gene_id:7745|Hs108|chr6 (578 aa) initn: 1739 init1: 726 opt: 1543 Z-score: 1045.3 bits: 203.3 E(32554): 6.7e-52 Smith-Waterman score: 1543; 45.6% identity (69.6% similar) in 550 aa overlap (1-541:1-544) 10 20 30 40 50 60 pF1KB7 MAREPRKNAALDAQSAEDQTGLLTVKVEKEEASALTAEVRAPCSPARGPERSRQRFRGFR ::.: :: .: . . . :. :::: : . : : : : : ::: .: CCDS46 MAEESRKPSAPSPPDQTPEEDLVIVKVE--EDHGWDQESSLHESNPLGQEVFRLRFRQLR 10 20 30 40 50 70 80 90 100 110 120 pF1KB7 YPEAAGPREALSRLRELCGQWLQPEMHSKEQILELLVLEQFLTILPGNLQSWVREQHPES : :. :::::: .:: :: :::.:....:::::::::::::::::: .::. :.:.. :. CCDS46 YQETLGPREALIQLRALCHQWLRPDLNTKEQILELLVLEQFLTILPEELQTLVKEHQLEN 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB7 GEEVVVLLEYLERQLDEPAPQVPVGDQGQELLCCKMALLTQTQGSQSSQCQPMKALFKHE :::::.::: ::::.: . : . .:...: ... ... ..: : . .:. CCDS46 GEEVVTLLEDLERQIDILGRPVSARVHGHRVLWEEVVHSASAPEPPNTQLQSEAT--QHK 120 130 140 150 160 170 190 200 210 220 230 pF1KB7 SLGSQPLHDRVL---QVPGLAQGGCCREDAMVASRLTPGSQGLLKMEDVALTLTPGWTQL : : ..:.. : : .: : .. :.:. :: : : : :.::.:..: : CCDS46 SPVPQESQERAMSTSQSPTRSQKGSSGDQEMTATLLTAGFQTLEKIEDMAVSLIREEWLL 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB7 DSSQVNLYRDEKQENHSSLVSLGGEIQTKSRDLPPVKKL-----PEKEHGKICHLREDIA : :: .: ::.. :: .. ::::: ....:.: . . :. : . :. :. CCDS46 DPSQKDLCRDNRPENFRNMFSLGGETRSENRELASKQVISTGIQPHGETAAKCN--GDVI 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB7 QIPTHAEAGEQEGRLQRKQKNAIGSRRHYCHECGKSFAQSSGLTKHRRIHTGEKPYECED . : :: . :::.:.. : ::: : ::::::::::::..: :::::::::.:. CCDS46 RGLEHEEARDLLGRLERQRGNPTQERRHKCDECGKSFAQSSGLVRHWRIHTGEKPYQCNV 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB7 CGKTFIGSSALVIHQRVHTGEKPYECEECGKVFSHSSNLIKHQRTHTGEKPYECDDCGKT :::.: :::. :: .:. : :.:.::::.::....:: ::: :::::::.:..:::. CCDS46 CGKAFSYRSALLSHQDIHNKVKRYHCKECGKAFSQNTGLILHQRIHTGEKPYQCNQCGKA 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB7 FSQSCSLLEHHKIHTGEKPYQCNMCGKAFRRNSHLLRHQRIH-GDKNVQNPEHGESWESQ :::: .:. :..::.::.::.:: ::::: ..:::. ::::: :.: . : :.... . CCDS46 FSQSAGLILHQRIHSGERPYECNECGKAFSHSSHLIGHQRIHTGEKPYECDECGKTFRRS 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB7 GRTESQWENTEAPVSYKCNECERSFTRNRSLIEHQKIHTGEKPYQCDTCGKGFTRTSYLV .. .. .. . :::::: :.:... .:::::.:::::.::.: :::.:. .. :. CCDS46 SHLIGHQRSHTGEKPYKCNECGRAFSQKSGLIEHQRIHTGERPYKCKECGKAFNGNTGLI 480 490 500 510 520 530 540 pF1KB7 QHQRSHVGKKTLSQ :: : :.:.: CCDS46 QHLRIHTGEKPYQCNECGKAFIQRSSLIRHQRIHSGEKSESISV 540 550 560 570 >>CCDS5666.1 ZNF394 gene_id:84124|Hs108|chr7 (561 aa) initn: 2211 init1: 606 opt: 1061 Z-score: 725.5 bits: 144.0 E(32554): 4.3e-34 Smith-Waterman score: 1117; 37.8% identity (61.9% similar) in 580 aa overlap (5-540:18-550) 10 20 30 40 pF1KB7 MAREPRKNAALDAQSAEDQT-GLLTVKVEKEEASALTAEVRAPC-SP : :: . ..: .: ::: :::: : : . : : :: CCDS56 MNSSLTAQRRGSDAELGPWVMAARSKDAAPSQRDGLLPVKVE--EDSPGSWEPNYPAASP 10 20 30 40 50 50 60 70 80 90 100 pF1KB7 ARGPERSRQRFRGFRYPEAAGPREALSRLRELCGQWLQPEMHSKEQILELLVLEQFLTIL :: :: .:: .:: :.:::.:::::::::: .::.::. :::::::::::::::::: CCDS56 --DPETSRLHFRQLRYQEVAGPEEALSRLRELCRRWLRPELLSKEQILELLVLEQFLTIL 60 70 80 90 100 110 110 120 130 140 pF1KB7 PGNLQSWVREQHPESGEEVVVLLEYLERQLDEPAPQVPVG----------------DQGQ : .::.::::. ::::::.:.... :.: :: . : : : .. CCDS56 PEELQAWVREHCPESGEEAVAVVRALQRALDGTSSQGMVTFEDTAVSLTWEEWERLDPAR 120 130 140 150 160 170 150 160 170 180 190 pF1KB7 ELLCCKMALLTQTQGS----------QSSQCQPMKALFKHESLGSQPLHDRVLQVPGLAQ . .: . : . .:: .... ::. .... .: . . : ... CCDS56 RDFCRESA--QKDSGSTVPPSLESRVENKELIPMQQILEEAEPQGQLQEAFQGKRPLFSK 180 190 200 210 220 230 200 210 220 230 240 250 pF1KB7 GGCCREDAMVASRLTPGSQGLLKMEDVALTLTPGWTQLDS-SQVNLYRDEKQENHSSLVS : .:: . . : ::.:. .: :.: :.:: .. . :...: CCDS56 CGSTHEDRVEKQSGDPLP---LKLEN-----SPEAEGLNSISDVN--KNGSIEGEDSK-- 240 250 260 270 280 260 270 280 290 300 pF1KB7 LGGEIQTKSR--DLPPVKKLPE-------KEHGKIC----HLREDIAQIPTHAEAGE--Q ..:.:...: .: ...:. .:::. : :. . : ....:. . CCDS56 -NNELQNSARCSNLVLCQHIPKAERPTDSEEHGNKCKQSFHMVTWHVLKPHKSDSGDSFH 290 300 310 320 330 340 310 320 330 340 350 360 pF1KB7 EGRLQRKQKNAIGSRRHYCHECGKSFAQSSGLTKHRRIHTGEKPYECEDCGKTFIGSSAL .. : . :.. : . : .::::: : : : .:.::::::::: :..:::.: :.:: CCDS56 HSSLFETQRQLHEERPYKCGNCGKSFKQRSDLFRHQRIHTGEKPYGCQECGKSFSQSAAL 350 360 370 380 390 400 370 380 390 400 410 420 pF1KB7 VIHQRVHTGEKPYECEECGKVFSHSSNLIKHQRTHTGEKPYECDDCGKTFSQSCSLLEHH . :::.::::::: : .::. : ..:.: .:: ::. .: ..:..::.: : .:..:. CCDS56 TKHQRTHTGEKPYTCLKCGERFRQNSHLNRHQSTHSRDKHFKCEECGETCHIS-NLFRHQ 410 420 430 440 450 460 430 440 450 460 470 480 pF1KB7 KIHTGEKPYQCNMCGKAFRRNSHLLRHQRIHGDKNVQNPEHGESWESQGRTESQWENTEA ..: ::.::.:. : :.:.. : :..:.::: . : CCDS56 RLHKGERPYKCEECEKSFKQRSDLFKHHRIH-------------------------TGEK 470 480 490 490 500 510 520 530 540 pF1KB7 PVSYKCNECERSFTRNRSLIEHQKIHTGEKPYQCDTCGKGFTRTSYLVQHQRSHVGKKTL : : :. : . :... .::.::.::::::::.: ::. : ....:..::: : .: CCDS56 P--YGCSVCGKRFNQSATLIKHQRIHTGEKPYKCLECGERFRQSTHLIRHQRIHQNKVLS 500 510 520 530 540 550 pF1KB7 SQ CCDS56 AGRGGSRL 560 >>CCDS12975.1 ZSCAN22 gene_id:342945|Hs108|chr19 (491 aa) initn: 1259 init1: 673 opt: 1036 Z-score: 709.4 bits: 140.9 E(32554): 3.4e-33 Smith-Waterman score: 1175; 39.8% identity (63.4% similar) in 527 aa overlap (18-538:14-487) 10 20 30 40 50 60 pF1KB7 MAREPRKNAALDAQSAEDQTGLLTVKVEKEEASALTAEVRAPCSPARGPERSRQRFRGFR .. ..: ::::.:: ..:. .. . : .: ::: :: CCDS12 MAIPKHSLSPVPWEEDSFLQVKVEEEEEASLSQGGESSHDHIAHSEAARLRFRHFR 10 20 30 40 50 70 80 90 100 110 120 pF1KB7 YPEAAGPREALSRLRELCGQWLQPEMHSKEQILELLVLEQFLTILPGNLQSWVREQHPES : ::.::.:::..:: :: :::::: :::::::::::::::: :: ..:.:: : :.: CCDS12 YEEASGPHEALAHLRALCCQWLQPEAHSKEQILELLVLEQFLGALPPEIQAWVGAQSPKS 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB7 GEEVVVLLEYLERQLDEPAPQVPVGDQGQELLCCKMALLTQTQGSQSSQCQPMKALFKHE :::..::.: : . ::. . . : : . : ::.. : ... :. .. .:. CCDS12 GEEAAVLVEDLTQVLDKRGWD-P-GAEPTEA-SCKQSDLGESEPSNVTE-----TLMGGV 120 130 140 150 160 190 200 210 220 230 pF1KB7 SLGSQPLHDRVLQVPGLAQGGCCREDAMVASRLTPGSQGLLKMEDVALTLTPG-WTQLDS ::: :..... : : . : :. ... . : : . .. . CCDS12 SLG-----------PAFVKA-CEPEGSSERSGLSGEIWTKSVTQQIHFKKTSGPYKDVPT 170 180 190 200 210 240 250 260 270 280 290 pF1KB7 SQVNLYRDEKQENHSSLVSLGGEIQTKSRDLPPV-----KKLPEKEHGKICHLREDIAQI .: . .... :. .: .. . :.: . . : :: .. .. CCDS12 DQRGRESGASRNSSSAWPNLTSQEKPPSEDKFDLVDAYGTEPPYTYSGKRSSKCRECRKM 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB7 PTHAEAGEQEGRLQRKQKNAIGSRRHYCHECGKSFAQSSGLTKHRRIHTGEKPYECEDCG : : :. .::. . . : ::::.:..:. :..:. .::: ::.::..:: CCDS12 FQSASA------LEAHQKTHSRKTPYACSECGKAFSRSTHLAQHQVVHTGAKPHECKECG 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB7 KTFIGSSALVIHQRVHTGEKPYECEECGKVFSHSSNLIKHQRTHTGEKPYECDDCGKTFS :.: . :. :::.:::::::.: ::::.::.:..: .:::.::::.::::: :::.:: CCDS12 KAFSRVTHLTQHQRIHTGEKPYKCGECGKTFSRSTHLTQHQRVHTGERPYECDACGKAFS 340 350 360 370 380 390 420 430 440 450 460 470 pF1KB7 QSCSLLEHHKIHTGEKPYQCNMCGKAFRRNSHLLRHQRIHGDKNVQNPEHGESWESQGRT :: : .:..::::::::.:. ::.:: : :.:: :::. ::. CCDS12 QSTHLTQHQRIHTGEKPYKCDACGRAFSDCSALIRHLRIHS---------GEK------- 400 410 420 430 480 490 500 510 520 530 pF1KB7 ESQWENTEAPVSYKCNECERSFTRNRSLIEHQKIHTGEKPYQCDTCGKGFTRTSYLVQHQ : :.:. : ..:... ::::::.::::::::.:. :::.:.:.: :. : CCDS12 ---------P--YQCKVCPKAFAQSSSLIEHQRIHTGEKPYKCSDCGKAFSRSSALMVHL 440 450 460 470 480 540 pF1KB7 RSHVGKKTLSQ : :. CCDS12 RIHITVLQ 490 >>CCDS4643.1 ZNF165 gene_id:7718|Hs108|chr6 (485 aa) initn: 999 init1: 814 opt: 1017 Z-score: 696.9 bits: 138.5 E(32554): 1.7e-32 Smith-Waterman score: 1133; 39.8% identity (61.6% similar) in 558 aa overlap (1-543:1-484) 10 20 30 40 50 pF1KB7 MAREPRKNAALDAQSAEDQTGLLTVKVEKEEASALTAEVRAPC---SPARGPERSRQRFR :: ::.: :: . : ::. ::: ::.:.:: . . : : : :: :: CCDS46 MATEPKKAAAQN--SPEDE-GLLIVKIEEEE----FIHGQDTCLQRSELLKQELCRQLFR 10 20 30 40 50 60 70 80 90 100 110 pF1KB7 GFRYPEAAGPREALSRLRELCGQWLQPEMHSKEQILELLVLEQFLTILPGNLQSWVREQH : : .. ::::::::::::: :::.::.:.:::::::::::::::::::.::.::.:.. CCDS46 QFCYQDSPGPREALSRLRELCCQWLKPEIHTKEQILELLVLEQFLTILPGDLQAWVHEHY 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 PESGEEVVVLLEYLERQLDEPAPQVPVGDQGQELLCCKMALLTQTQGSQSSQCQPMKALF ::::::.:..:: ::: :: . :: . ..:::.. :. . . . . ::... CCDS46 PESGEEAVTILEDLERGTDEAVLQVQAHEHGQEIFQKKV---SPPGPALNVKLQPVETKA 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB7 KHESLGSQPLHDRVLQVPGLAQGGCCREDAMVASRLTPGSQGLLKMEDVALTLTPGWTQL . .: : : : : :. :: : . . :.:. .. CCDS46 HFDSSEPQLLWD------------CDNESE--NSRSMPKLEIFEKIES---------QRI 180 190 200 240 250 260 270 280 290 pF1KB7 DSSQVNLYRDEKQENHSSLVSLGGEIQTKSRDLPPVKKLPEKEHGKICHLR----EDIAQ :.... : .: . :: : .. ::. ::: :. .: : ... CCDS46 ISGRISGYISEAS----------GESQDICKSAGRVKRQWEKESGESQRLSSAQDEGFGK 210 220 230 240 250 300 310 320 330 340 pF1KB7 IPTHAEA--GE---QEGRLQRKQKNAIG-SRRHYCHE--CGKSFAQSSGLTKHRRIHTGE : :: .. :: ..: .: . :. .... :.. : .:: .: . .:. :..:: CCDS46 ILTHKNTVRGEIISHDGCERRLNLNSNEFTHQKSCKHGTCDQSFKWNSDFINHQIIYAGE 260 270 280 290 300 310 350 360 370 380 390 400 pF1KB7 KPYECEDCGKTFIGSSALVIHQRVHTGEKPYECEECGKVFSHSSNLIKHQRTHTGEKPYE : .. ::.: : :. : : .:.: ..:.::::.: :::.: .::: ::::. :: CCDS46 KNHQY---GKSF-KSPKLAKHAAVFSGDKTHQCNECGKAFRHSSKLARHQRIHTGERCYE 320 330 340 350 360 370 410 420 430 440 450 460 pF1KB7 CDDCGKTFSQSCSLLEHHKIHTGEKPYQCNMCGKAFRRNSHLLRHQRIHGDKNVQNPEHG :..:::.:..: .: .:..:::::.:. :. ::.:: ::::.:::::: CCDS46 CNECGKSFAESSDLTRHRRIHTGERPFGCKECGRAFNLNSHLIRHQRIH----------- 380 390 400 410 420 470 480 490 500 510 520 pF1KB7 ESWESQGRTESQWENTEAPVSYKCNECERSFTRNRSLIEHQKIHTGEKPYQCDTCGKGFT . : : :.:.:: ..: . ::.: .::::::::.:. ::..:. CCDS46 --------------TREKP--YECSECGKTFRVSSHLIRHFRIHTGEKPYECSECGRAFS 430 440 450 460 530 540 pF1KB7 RTSYLVQHQRSHVGKKTLSQ ..: : :::: :. .. : CCDS46 QSSNLSQHQRIHMRENLLM 470 480 >>CCDS32383.1 ZNF500 gene_id:26048|Hs108|chr16 (480 aa) initn: 1776 init1: 598 opt: 1008 Z-score: 690.9 bits: 137.4 E(32554): 3.6e-32 Smith-Waterman score: 1011; 41.3% identity (61.5% similar) in 465 aa overlap (18-454:18-459) 10 20 30 40 50 60 pF1KB7 MAREPRKNAALDAQSAEDQTGLLTVKVEKEEASALTAEVRAPCSPARGPERSRQRFRGFR .: .: ::::.. :.. .:. :: :: :: : CCDS32 MATVPGLQPLPTLEQDLEQEEILIVKVEEDFCLEEEPSVETE-DPS--PETFRQLFRLFC 10 20 30 40 50 70 80 90 100 110 120 pF1KB7 YPEAAGPREALSRLRELCGQWLQPEMHSKEQILELLVLEQFLTILPGNLQSWVREQHPES : :.:::::::::: ::: .::.::...:::::::::::::::.:::..:. ::::.::: CCDS32 YQEVAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPES 60 70 80 90 100 110 130 140 150 160 pF1KB7 GEEVVVLLEYLERQLDE---------PAPQVPVGDQGQELLCCKMAL---LTQTQGSQSS :::.:::.: :.:. . .::.: :: : : :. . .. : CCDS32 GEEAVVLVEGLQRKPRKHRQRGSELLSDDEVPLGIGGQFLKHQAEAQPEDLSLEEEARFS 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB7 QCQPMKALFKHESLGSQPLHDRVLQVPGLAQGGCCREDAMVASRLTPGSQGLLKMEDVAL . :: : .. . : .: .: .: : .. :. :: ...::::. CCDS32 SQQPPAQLSHRPQRGPLLWPERGPPAPRH------QEMASASPFLSAWSQVPVNLEDVAV 180 190 200 210 220 230 230 240 250 260 270 pF1KB7 TLTPGWTQ-LDSSQVNLYRDEKQENHSSLVSL--GGEIQT------------KSRDLPPV :. . .: .: :: ::.. ..: ::. . ..: : CCDS32 YLSGEEPRCMDPAQ----RDAPLENEGPGIQLEDGGDGREDAPLRMEWYRVLSARCQGPG 240 250 260 270 280 280 290 300 310 320 330 pF1KB7 KKLPEKEHGKICHLREDIAQIPTHAEAGEQEGRLQRKQKNAIGSRRHY-CHECGKSFAQS . :: .. . . : . : . ..: :: . . :. . : : ::::.:... CCDS32 HPLPGQRPAPVRGLVR-----PDQPRGGPPPGR-----RASHGADKPYTCPECGKGFSKT 290 300 310 320 330 340 350 360 370 380 390 pF1KB7 SGLTKHRRIHTGEKPYECEDCGKTFIGSSALVIHQRVHTGEKPYECEECGKVFSHSSNLI : ::::.: ::::.::.: ::: : : . ::::::::::: : :::: ::.::.:. CCDS32 SHLTKHQRTHTGERPYKCLVCGKGFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLV 340 350 360 370 380 390 400 410 420 430 440 450 pF1KB7 KHQRTHTGEKPYECDDCGKTFSQSCSLLEHHKIHTGEKPYQCNMCGKAFRRNSHLLRHQR :.:::.::.:: : .::: :..: . :.. ::::::: : ::..:::.. : .::: CCDS32 IHRRTHSGERPYACTQCGKRFNNSSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQR 400 410 420 430 440 450 460 470 480 490 500 510 pF1KB7 IHGDKNVQNPEHGESWESQGRTESQWENTEAPVSYKCNECERSFTRNRSLIEHQKIHTGE : CCDS32 THMGAGSLPTLQPVAPGGPGAKA 460 470 480 >>CCDS78119.1 ZSCAN26 gene_id:7741|Hs108|chr6 (478 aa) initn: 1621 init1: 637 opt: 1003 Z-score: 687.6 bits: 136.8 E(32554): 5.6e-32 Smith-Waterman score: 1109; 39.9% identity (62.6% similar) in 494 aa overlap (44-537:42-472) 20 30 40 50 60 70 pF1KB7 QSAEDQTGLLTVKVEKEEASALTAEVRAPCSPARGPERSRQRFRGFRYPEAAGPREALSR : . : : ..:: .:: :..:::::::: CCDS78 APLNLKKEGLRVVREDHYSTWEQGFKLQGNSKGLGQEPLCKQFRQLRYEETTGPREALSR 20 30 40 50 60 70 80 90 100 110 120 130 pF1KB7 LRELCGQWLQPEMHSKEQILELLVLEQFLTILPGNLQSWVREQHPESGEEVVVLLEYLER ::::: :::::: :.:::::::::::::: ::: .::. :.:.:::: :.:::.:: :. CCDS78 LRELCQQWLQPETHTKEQILELLVLEQFLIILPKELQARVQEHHPESREDVVVVLEDLQL 80 90 100 110 120 130 140 150 160 170 180 190 pF1KB7 QLDEPAPQVPVGDQGQELLCCKMALLTQTQGSQSSQCQPMKALFKHESLGSQPLHDRVLQ .: : . : : . :..: .:: : .: : .: .:: ..: ... CCDS78 DLGETGQQDPDQPKKQKILVEEMAPL---KGVQEQQV-------RHECEVTKPEKEK--- 140 150 160 170 200 210 220 230 240 250 pF1KB7 VPGLAQGGCCREDAMVASRLTPGSQGLLKMEDVALTLTPGWTQLDSSQVNLYRDEKQENH : .: . ..: ... ..:. . : .. ..: :: : . . .. CCDS78 --G-------EETRIENGKLIVVTDSCGRVESSGKISEPMEAHNEGS--NLERHQAKPKE 180 190 200 210 220 260 270 280 290 300 310 pF1KB7 SSLVSLGGEIQTKSRDLPPVKKLPEKEHGKICHLREDIAQIPTHAEAGEQEGRLQRKQKN . . . . : . : ... . :.:. :. : . . .:.. .. ..:. CCDS78 KIEYKCSEREQRFIQHLDLIEHASTHTGKKLCE--SDVCQ--SSSLTGHK--KVLSREKG 230 240 250 260 270 280 320 330 340 350 360 370 pF1KB7 AIGSRRHYCHECGKSFAQSSGLTKHRRIHTGEKPYECEDCGKTFIGSSALVIHQRVHTGE : ::::::.: .:: :..:..:: :::::.:..:::.: ...:. : :.:::: CCDS78 ------HQCHECGKAFQRSSHLVRHQKIHLGEKPYQCNECGKVFSQNAGLLEHLRIHTGE 290 300 310 320 330 380 390 400 410 420 430 pF1KB7 KPYECEECGKVFSHSSNLIKHQRTHTGEKPYECDDCGKTFSQSCSLLEHHKIHTGEKPYQ ::: : .::: : .::.: .::: :. :.: :: .:::::::. : .:..::. : .: CCDS78 KPYLCIHCGKNFRRSSHLNRHQRIHSQEEPCECKECGKTFSQALLLTHHQRIHSHSKSHQ 340 350 360 370 380 390 440 450 460 470 480 490 pF1KB7 CNMCGKAFRRNSHLLRHQRIHGDKNVQNPEHGESWESQGRTESQWENTEAPVSYKCNECE :: ::::: .: :.::.::: . : : .::: :. CCDS78 CNECGKAFSLTSDLIRHHRIH-------------------------TGEKP--FKCNICQ 400 410 420 500 510 520 530 540 pF1KB7 RSFTRNRSLIEHQKIHTGEKPYQCDTCGKGFTRTSYLVQHQRSHVGKKTLSQ ..: : : .: .::. ::::::. ::..: . : : :::: : CCDS78 KAFRLNSHLAQHVRIHNEEKPYQCSECGEAFRQRSGLFQHQRYHHKDKLA 430 440 450 460 470 >>CCDS10495.1 ZNF213 gene_id:7760|Hs108|chr16 (459 aa) initn: 1524 init1: 574 opt: 971 Z-score: 666.6 bits: 132.8 E(32554): 8.3e-31 Smith-Waterman score: 1070; 39.9% identity (63.1% similar) in 471 aa overlap (9-454:3-451) 10 20 30 40 50 pF1KB7 MAREPRKNAALDAQSAE--DQTGLLTVKVEKEEASALTAEVRAPCSPARGPERSRQRFRG : :.::. . ::: :::: :. : : .: : ::::: CCDS10 MAAPLEAQDQAPGEGEGLLIVKVED---SSWEQE-SAQHEDGRDSEACRQRFRQ 10 20 30 40 50 60 70 80 90 100 110 pF1KB7 FRYPEAAGPREALSRLRELCGQWLQPEMHSKEQILELLVLEQFLTILPGNLQSWVREQHP : : .. ::.::.:.: ::: .::.::...:::::::::::::::.:::..:.::::::: CCDS10 FCYGDVHGPHEAFSQLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQGWVREQHP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 ESGEEVVVLLEYLERQLDEPAPQVPVGDQGQELLCCKMALLTQTQGSQSSQCQPMKALFK ::::.:.:.: :..: :: :.. . . .:::.. : . . CCDS10 GSGEEAVALVEDLQKQ--------PVKAWRQDVPSEEAEPEAAGRGSQATGPPPTVGARR 120 130 140 150 160 180 190 200 210 220 230 pF1KB7 HESLGSQPLHDRVLQVPGLAQGGCCREDAMVASRLTPGSQGLLKMEDVALTLT-PGWTQL . :. : :.. : :.: . : : . . .. : .: . . :. . .. : : CCDS10 RPSV-PQEQHSHSAQPPALLKEG--RPGETTDTCFVSGVHGPVALGDIPFYFSREEWGTL 170 180 190 200 210 240 250 260 270 280 290 pF1KB7 DSSQVNLYRDEKQEN-HSSLVSLGGEIQTKS---RDLPPVKKLPEKEHGKICHLREDIAQ : .: .:. : :.:: ... ...: . :... ... :: .: . . . .. CCDS10 DPAQRDLFWDIKRENSRNTTLGFGLKGQSEKSLLQEMVPV--VPGQTGSDVT-----VSW 220 230 240 250 260 270 300 310 320 330 pF1KB7 IPTHAEAGEQEGRLQRKQKNAIGSRR------------------HYCHECGKSFAQSSGL : .::: :.:.: . ..:.:: : : .::: : .: : CCDS10 SPEEAEAWESENRPRAALGPVVGARRGRPPTRRRQFRDLAAEKPHSCGQCGKRFRWGSDL 280 290 300 310 320 330 340 350 360 370 380 390 pF1KB7 TKHRRIHTGEKPYECEDCGKTFIGSSALVIHQRVHTGEKPYECEECGKVFSHSSNLIKHQ ..:.: ::::::..: .: :.: .:: :: :: :::::::. : :::: ::.:. : :: CCDS10 ARHQRTHTGEKPHKCPECDKSFRSSSDLVRHQGVHTGEKPFSCSECGKSFSRSAYLADHQ 340 350 360 370 380 390 400 410 420 430 440 450 pF1KB7 RTHTGEKPYECDDCGKTFSQSCSLLEHHKIHTGEKPYQCNMCGKAFRRNSHLLRHQRIHG : ::::::. :.::::.:: ::.:...::::.:. :. : :.:.. .::. :: .: CCDS10 RIHTGEKPFGCSDCGKSFSLRSYLLDHRRVHTGERPFGCGECDKSFKQRAHLIAHQSLHA 400 410 420 430 440 450 460 470 480 490 500 510 pF1KB7 DKNVQNPEHGESWESQGRTESQWENTEAPVSYKCNECERSFTRNRSLIEHQKIHTGEKPY CCDS10 KMAQPVG 545 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 22:59:25 2016 done: Sun Nov 6 22:59:25 2016 Total Scan time: 3.690 Total Display time: 0.100 Function used was FASTA [36.3.4 Apr, 2011]