FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5830, 1059 aa 1>>>pF1KE5830 1059 - 1059 aa - 1059 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.7613+/-0.00108; mu= 2.1815+/- 0.066 mean_var=459.9595+/-94.276, 0's: 0 Z-trim(117.1): 904 B-trim: 417 in 1/54 Lambda= 0.059802 statistics sampled from 16906 (17855) to 16906 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.78), E-opt: 0.2 (0.548), width: 16 Scan time: 4.710 The best scores are: opt bits E(32554) CCDS33116.3 ZNF628 gene_id:89887|Hs108|chr19 (1059) 7465 659.2 1.3e-188 CCDS59368.1 ZNF729 gene_id:100287226|Hs108|chr19 (1252) 1375 133.9 2.2e-30 CCDS47357.2 ZFP62 gene_id:643836|Hs108|chr5 ( 867) 1313 128.3 7e-29 CCDS54955.1 ZFP62 gene_id:643836|Hs108|chr5 ( 900) 1313 128.3 7.2e-29 CCDS12412.1 ZNF493 gene_id:284443|Hs108|chr19 ( 646) 1093 109.2 3e-23 CCDS42536.1 ZNF493 gene_id:284443|Hs108|chr19 ( 774) 1093 109.3 3.4e-23 CCDS77335.1 ZNF473 gene_id:25888|Hs108|chr19 ( 859) 1081 108.3 7.4e-23 CCDS33077.1 ZNF473 gene_id:25888|Hs108|chr19 ( 871) 1081 108.3 7.5e-23 CCDS62706.1 ZNF229 gene_id:7772|Hs108|chr19 ( 819) 1077 107.9 9.1e-23 CCDS42574.1 ZNF229 gene_id:7772|Hs108|chr19 ( 825) 1077 107.9 9.2e-23 CCDS32915.1 ZNF700 gene_id:90592|Hs108|chr19 ( 742) 1064 106.8 1.9e-22 CCDS74289.1 ZNF700 gene_id:90592|Hs108|chr19 ( 745) 1064 106.8 1.9e-22 CCDS46101.1 ZNF234 gene_id:10780|Hs108|chr19 ( 700) 1034 104.1 1.1e-21 CCDS75846.1 ZNF658 gene_id:26149|Hs108|chr9 (1059) 1033 104.3 1.5e-21 CCDS12856.1 ZNF600 gene_id:162966|Hs108|chr19 ( 722) 984 99.8 2.2e-20 CCDS12988.1 MZF1 gene_id:7593|Hs108|chr19 ( 734) 933 95.4 4.7e-19 CCDS12632.1 ZNF45 gene_id:7596|Hs108|chr19 ( 682) 898 92.4 3.6e-18 CCDS44202.1 ZNF697 gene_id:90874|Hs108|chr1 ( 545) 883 91.0 7.7e-18 CCDS82391.1 ZNF160 gene_id:90338|Hs108|chr19 ( 782) 874 90.4 1.7e-17 CCDS12859.1 ZNF160 gene_id:90338|Hs108|chr19 ( 818) 874 90.4 1.7e-17 CCDS32890.2 ZNF358 gene_id:140467|Hs108|chr19 ( 568) 854 88.5 4.5e-17 CCDS45460.1 ZNF771 gene_id:51333|Hs108|chr16 ( 317) 844 87.3 5.6e-17 CCDS54259.1 ZNF607 gene_id:84775|Hs108|chr19 ( 695) 845 87.8 8.7e-17 CCDS33006.1 ZNF607 gene_id:84775|Hs108|chr19 ( 696) 845 87.8 8.7e-17 CCDS58688.1 ZNF211 gene_id:10520|Hs108|chr19 ( 503) 840 87.2 9.6e-17 CCDS58687.1 ZNF211 gene_id:10520|Hs108|chr19 ( 555) 840 87.3 1e-16 CCDS12957.1 ZNF211 gene_id:10520|Hs108|chr19 ( 564) 840 87.3 1e-16 CCDS12956.1 ZNF211 gene_id:10520|Hs108|chr19 ( 577) 840 87.3 1e-16 CCDS74468.1 ZNF211 gene_id:10520|Hs108|chr19 ( 616) 840 87.3 1.1e-16 CCDS58686.1 ZNF211 gene_id:10520|Hs108|chr19 ( 629) 840 87.3 1.1e-16 CCDS43619.1 ZNF3 gene_id:7551|Hs108|chr7 ( 446) 835 86.7 1.2e-16 CCDS45463.1 ZNF629 gene_id:23361|Hs108|chr16 ( 869) 840 87.5 1.4e-16 CCDS46212.1 ZNF814 gene_id:730051|Hs108|chr19 ( 855) 837 87.2 1.6e-16 CCDS10901.1 ZNF19 gene_id:7567|Hs108|chr16 ( 458) 829 86.2 1.7e-16 CCDS32330.1 ZNF774 gene_id:342132|Hs108|chr15 ( 483) 827 86.1 2e-16 CCDS41502.1 ZNF239 gene_id:8187|Hs108|chr10 ( 458) 823 85.7 2.5e-16 CCDS75904.1 ZNF79 gene_id:7633|Hs108|chr9 ( 364) 819 85.3 2.7e-16 CCDS12959.2 ZNF551 gene_id:90233|Hs108|chr19 ( 670) 825 86.1 2.8e-16 CCDS6437.1 ZNF16 gene_id:7564|Hs108|chr8 ( 682) 825 86.1 2.8e-16 CCDS69664.1 ZNF79 gene_id:7633|Hs108|chr9 ( 474) 819 85.4 3.2e-16 CCDS6871.1 ZNF79 gene_id:7633|Hs108|chr9 ( 498) 819 85.4 3.3e-16 CCDS35075.1 ZNF782 gene_id:158431|Hs108|chr9 ( 699) 820 85.7 3.9e-16 CCDS74207.1 ZSCAN30 gene_id:100101467|Hs108|chr18 ( 307) 808 84.2 4.7e-16 CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 815 85.2 4.9e-16 CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 815 85.2 5.1e-16 CCDS12977.1 ZNF497 gene_id:162968|Hs108|chr19 ( 498) 812 84.8 5.1e-16 CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 815 85.2 5.1e-16 CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 815 85.2 5.2e-16 CCDS10681.2 ZNF768 gene_id:79724|Hs108|chr16 ( 540) 812 84.9 5.3e-16 CCDS31418.1 ZNF214 gene_id:7761|Hs108|chr11 ( 606) 812 84.9 5.7e-16 >>CCDS33116.3 ZNF628 gene_id:89887|Hs108|chr19 (1059 aa) initn: 7465 init1: 7465 opt: 7465 Z-score: 3499.4 bits: 659.2 E(32554): 1.3e-188 Smith-Waterman score: 7465; 99.8% identity (100.0% similar) in 1059 aa overlap (1-1059:1-1059) 10 20 30 40 50 60 pF1KE5 MSGVMVGSHADMAPASTAEGAGEKPGPAAPAPAAQYECGECGKSFRWSSRLLHHQRTHTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MSGVMVGSHADMAPASTAEGAGEKPGPAAPAPAAQYECGECGKSFRWSSRLLHHQRTHTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 ERPYKCPDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHRSVHTGLRAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ERPYKCPDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHRSVHTGLRAF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 ICGQCGLAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHTGERPYTCGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ICGQCGLAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHTGERPYTCGV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 CGKSFTQSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPAPGAASAAPP :::::::::::::::::::::::::::::::::::::::::::::::::::::.:::::: CCDS33 CGKSFTQSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPAPGTASAAPP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 PQSREPGKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTVELVYRCDGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PQSREPGKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTVELVYRCDGC 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 EQGFSSEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 EQGFSSEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACLP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 CGKSFRTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 CGKSFRTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPPQ 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 AEAAEVTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRYHLRDHTGER ::::::::::::::::::.::::::::::::::::::::::::::::::::::::::::: CCDS33 AEAAEVTCPQEPLAPAAPVPPPPPSAPASAERPYKCAECGKSFKGSSGLRYHLRDHTGER 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE5 PYQCGECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYAC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PYQCGECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYAC 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE5 GECGKAFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLCP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GECGKAFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLCP 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE5 KTFTHSSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPPSTTAPAAGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KTFTHSSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPPSTTAPAAGP 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE5 QPPAPLAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQTFLLVQTAQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QPPAPLAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQTFLLVQTAQG 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE5 LQLIPSSVQPPTPPPPPAPPKLILLPSSSAGAGGGRARQGPRAVGKAGQGAGVVWLPGPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LQLIPSSVQPPTPPPPPAPPKLILLPSSSAGAGGGRARQGPRAVGKAGQGAGVVWLPGPG 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE5 GLGVQGAASAGASGTGQSLIVLQNVGGGEAGPQEMSGVQLQPLRPAPEVTTVQLQPAQEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GLGVQGAASAGASGTGQSLIVLQNVGGGEAGPQEMSGVQLQPLRPAPEVTTVQLQPAQEV 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE5 TTVQLQPAQEVTTVQLQPAQEVTTVQLQPVAGQLSNSSGGAVATEAPNLLVVQSGAAEEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TTVQLQPAQEVTTVQLQPAQEVTTVQLQPVAGQLSNSSGGAVATEAPNLLVVQSGAAEEL 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE5 LTGPGPGEAGDGEASTGVVQDVLFETLQTDEGLQSVLVLSGADGEQTRLCVQEVETLPPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LTGPGPGEAGDGEASTGVVQDVLFETLQTDEGLQSVLVLSGADGEQTRLCVQEVETLPPG 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE5 LTEPPATGPPGQKLLIIRSAPATELLDSSNTGGGTATLQLLAPPPSGPASGPAGLPGAPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LTEPPATGPPGQKLLIIRSAPATELLDSSNTGGGTATLQLLAPPPSGPASGPAGLPGAPA 970 980 990 1000 1010 1020 1030 1040 1050 pF1KE5 SQMVQVVPAGAGPGVMTPQGLPSIQIVQTLPAVQLVHTF ::::::::::::::::::::::::::::::::::::::: CCDS33 SQMVQVVPAGAGPGVMTPQGLPSIQIVQTLPAVQLVHTF 1030 1040 1050 >>CCDS59368.1 ZNF729 gene_id:100287226|Hs108|chr19 (1252 aa) initn: 3532 init1: 760 opt: 1375 Z-score: 659.0 bits: 133.9 E(32554): 2.2e-30 Smith-Waterman score: 1561; 38.6% identity (61.4% similar) in 609 aa overlap (36-644:376-930) 10 20 30 40 50 60 pF1KE5 VGSHADMAPASTAEGAGEKPGPAAPAPAAQYECGECGKSFRWSSRLLHHQRTHTGERPYK :.: ::::.:.:::.: :. .::::.::: CCDS59 KPYKREECGKAFSQSSTLRKHEIIHTGEKPYKCEECGKAFKWSSKLTVHKVVHTGEKPYK 350 360 370 380 390 400 70 80 90 100 110 120 pF1KE5 CPDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHRSVHTGLRAFICGQC : .: :::. :.: :. :::..::.: .: :::. :: :. :. .::: . . : .: CCDS59 CEECGKAFSQFSTLKKHKIIHTGKKPYKCEECGKAFNSSSTLMKHKIIHTGEKPYKCEEC 410 420 430 440 450 460 130 140 150 160 170 180 pF1KE5 GLAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHTGERPYTCGVCGKSF : ::. ::: : ::::.:: : .: :::.. :.::::. .:::..:: : :::.: CCDS59 GKAFRQSSHLTRHKAIHTGEKPYKCEECGKAFNHFSDLRRHKIIHTGKKPYKCEECGKAF 470 480 490 500 510 520 190 200 210 220 230 240 pF1KE5 TQSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPAPGAASAAPPPQSRE .::..::.:: .::::.:..: : :.: ::.: .:. : .. : . .: CCDS59 SQSSTLRNHQIIHTGEKPYKCEECGKAFKWSSKLTVHKVIH---------TGEKPCKCEE 530 540 550 560 570 250 260 270 280 290 300 pF1KE5 PGKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTVELVYRCDGCEQGFS ::.: . :..: : : : .:.:. : ..:. CCDS59 CGKAFKHFSALRKHKVIH--------------------------TREKLYKCEECGKAFN 580 590 600 610 310 320 330 340 350 360 pF1KE5 SEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACLPCGKSF . .: .:. .. .: . : :: . : : . .. : . : :::.: CCDS59 NSSILAKHKII---HTGKKPYKCE-ECGKAFRQSSHLTRHKAIHTGEKP-YKCEECGKAF 620 630 640 650 660 370 380 390 400 410 420 pF1KE5 RTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPPQAEAAE ..: ::. : .: . ..: : .: ....: :. :. :. : . : CCDS59 SHFSALRRHKIIH--TGKKPYKCEECGKAFSHFSALRRHKIIHT-----GEKPYKCEE-- 670 680 690 700 710 430 440 450 460 470 480 pF1KE5 VTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRYHLRDHTGERPYQCG : . : . .. .::.: :: ::::::: :.:: : :: :. :.: CCDS59 --CGK---AFKWSSKLTVHKVIHTAEKPCKCEECGKSFKHFSALRKHKVIHTREKLYKCE 720 730 740 750 760 770 490 500 510 520 530 540 pF1KE5 ECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYACGECGK :: :::. : : :. .::: . . : .:: .:::::. : .:.::.: : :::: CCDS59 ECVKAFNSFSALMKHKVIHTGEKPYKCEECGKAFKWSSKLTVHKVIHTGEKPCKCEECGK 780 790 800 810 820 830 550 560 570 580 590 600 pF1KE5 AFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLCPKTFTH ::.. : ::.:. .:::..:. : :::.:.:.:.::.:. .:.::.:..: : :.: CCDS59 AFKHFSALRKHKVIHTGKKPYKCEECGKAFSQSSSLRKHEIIHSGEKPYKCEECGKAFKW 840 850 860 870 880 890 610 620 630 640 650 660 pF1KE5 SSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPPSTTAPAAGPQPPAP :.: .:. :.::.: : ::..: . :..: : CCDS59 LSKLTVHKVIHTAEKPCKCEECGKAFKHFSALRKHKIIHTGKKPYKCEECGKAFNDSSTL 900 910 920 930 940 950 670 680 690 700 710 720 pF1KE5 LAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQTFLLVQTAQGLQLIP CCDS59 MKHKIIHTGKKPYKCAECGKAFKQSSHLTRHKAIHTGEKPYKCEECGKDFNNSSTLKKHK 960 970 980 990 1000 1010 >-- initn: 2629 init1: 704 opt: 741 Z-score: 363.4 bits: 79.2 E(32554): 6.4e-14 Smith-Waterman score: 777; 37.8% identity (61.8% similar) in 296 aa overlap (356-648:936-1217) 330 340 350 360 370 380 pF1KE5 QEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACLPCGKSFRTVAGLSRHQHSHGAAGGQA . : :::.: . : .:. : .: . CCDS59 KPCKCEECGKAFKHFSALRKHKIIHTGKKPYKCEECGKAFNDSSTLMKHKIIH--TGKKP 910 920 930 940 950 960 390 400 410 420 430 440 pF1KE5 FRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPPQAEAAEVTCPQEPLAPAAPAPPPPPS ..:. : .: : . : :. :. :. : . : : .. . . CCDS59 YKCAECGKAFKQSSHLTRHKAIHT-----GEKPYKCEE----CGKDF---NNSSTLKKHK 970 980 990 1000 1010 450 460 470 480 490 500 pF1KE5 APASAERPYKCAECGKSFKGSSGLRYHLRDHTGERPYQCGECGKAFKRSSLLAIHQRVHT . :. ::: :: :.:.. :.: : ::::.::.: ::::::: :: :. :. .:: CCDS59 LIHTREKLYKCEECVKAFNNFSALMKHKIIHTGEKPYKCEECGKAFKWSSKLTEHKVIHT 1020 1030 1040 1050 1060 1070 510 520 530 540 550 560 pF1KE5 GLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYACGECGKAFRNTSCLRRHRHVHTGERP : . : .: .:: : . : .:.:..:: : :::::: :.: : .:. .::::.: CCDS59 GEKPCKCEECDKAFKHFSALRKHKVIHTGKKPYQCDECGKAFNNSSTLTKHKIIHTGEKP 1080 1090 1100 1110 1120 1130 570 580 590 600 610 620 pF1KE5 HACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHSAERPFTCP . : :::.:.:.: : .:. .:. :.:..: : :.:..::.: :. :..:.:. : CCDS59 YKCEECGKAFSQSSILTKHKIIHSVEKPYKCEECGKAFNQSSHLTRHKTIHTGEKPYKCE 1140 1150 1160 1170 1180 1190 630 640 650 660 670 680 pF1KE5 ICGRGFVMAAYLQRHLRTHA---PANTPPSTTAPAAGPQPPAPLAAARAPPATQDVHVLP ::..:.. .:: :: :. :.: CCDS59 ECGKAFIQCSYLIRHKTIHTREKPTNVKKVPKLLSNPHTLLDKTIHTGEKPYKCEECAKA 1200 1210 1220 1230 1240 1250 >>CCDS47357.2 ZFP62 gene_id:643836|Hs108|chr5 (867 aa) initn: 3562 init1: 743 opt: 1313 Z-score: 631.9 bits: 128.3 E(32554): 7e-29 Smith-Waterman score: 1503; 37.4% identity (59.7% similar) in 615 aa overlap (37-644:193-774) 10 20 30 40 50 60 pF1KE5 GSHADMAPASTAEGAGEKPGPAAPAPAAQYECGECGKSFRWSSRLLHHQRTHTGERPYKC .: :::::: .:: : .:.: ::::.::.: CCDS47 PYKCEECGKAYMSYSSLINHKSTHSGEKNCKCDECGKSFNYSSVLDQHKRIHTGEKPYEC 170 180 190 200 210 220 70 80 90 100 110 120 pF1KE5 PDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHRSVHTGLRAFICGQCG .: :::..::.: :.: ::::.::.: : :.:. :: :..:. .::: . . : .:: CCDS47 GECGKAFRNSSGLRVHKRIHTGEKPYECDICGKTFSNSSGLRVHKRIHTGEKPYECDECG 230 240 250 260 270 280 130 140 150 160 170 180 pF1KE5 LAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHTGERPYTCGVCGKSFT :: : : :..:: : .: :.:. :: : .:. .::::.:: : :::.: CCDS47 KAFITCRTLLNHKSIHFGDKPYKCDECEKSFNYSSLLIQHKVIHTGEKPYECDECGKAFR 290 300 310 320 330 340 190 200 210 220 230 240 pF1KE5 QSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPAPGAASAAPPPQSREP .:..: :.:.::::.:..: .: :.:..::.: .:. : :: . . .: CCDS47 NSSGLIVHKRIHTGEKPYKCDVCGKAFSYSSGLAVHKSIH-----PGKKA----HECKEC 350 360 370 380 390 250 260 270 280 290 pF1KE5 GKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTV-------ELVYRCDG :: : .. : .: :. : . : . : : : : :.:: CCDS47 GKSFSYNSLLLQHRTIHTGERPYVCD-----VCGKTFRNNAGLKVHRRLHTGEKPYKCDV 400 410 420 430 440 300 310 320 330 340 350 pF1KE5 CEQGFSSEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACL : ... :. : .:. : . .: . . :. . : : : . : :.: CCDS47 CGKAYISRSSLKNHK---GIHLGEKPYKC-SYCEKSFNYSSALEQHKRIHTREKP-FGCD 450 460 470 480 490 500 360 370 380 390 400 410 pF1KE5 PCGKSFRTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPP :::.::. .::. :.. : .: . ..: : .. .:.::. :.. : :. : CCDS47 ECGKAFRNNSGLKVHKRIH--TGERPYKCEECGKAYISLSSLINHKSVH-----PGEKP- 510 520 530 540 550 420 430 440 450 460 470 pF1KE5 QAEAAEVTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRYHLRDHTGE : . : . . .:.:::: : :::. .: : : : :: : CCDS47 ------FKCDECEKAFITYRTLTNHKKVHLGEKPYKCDVCEKSFNYTSLLSQHRRVHTRE 560 570 580 590 600 480 490 500 510 520 530 pF1KE5 RPYQCGECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYA .::.: .: :.:. .: : .:.:.::: : . : :: .. : : : :. :.. CCDS47 KPYECDRCEKVFRNNSSLKVHKRIHTGERPYECDVCGKAYISHSSLINHKSTHPGRTPHT 610 620 630 640 650 660 540 550 560 570 580 590 pF1KE5 CGECGKAFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLC : :::::: .. : :..:: ::.: : :::::. .: : ::.:.::::.:. : : CCDS47 CDECGKAFFSSRTLISHKRVHLGEKPFKCVECGKSFSYSSLLSQHKRIHTGEKPYVCDRC 670 680 690 700 710 720 600 610 620 630 640 650 pF1KE5 PKTFTHSSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPPSTTAPAAG :.: .::.: .:.: :..:.:. : ::.... . : : .: CCDS47 GKAFRNSSGLTVHKRIHTGEKPYECDECGKAYISHSSLINHKSVHQGKQPYNCECGKSFN 730 740 750 760 770 780 660 670 680 690 700 710 pF1KE5 PQPPAPLAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQTFLLVQTAQ CCDS47 YRSVLDQHKRIHTGKKPYRCNECGKAFNIRSNLTKHKRTHTGEESLNVIYVGSYSGTSQK 790 800 810 820 830 840 >>CCDS54955.1 ZFP62 gene_id:643836|Hs108|chr5 (900 aa) initn: 3562 init1: 743 opt: 1313 Z-score: 631.7 bits: 128.3 E(32554): 7.2e-29 Smith-Waterman score: 1503; 37.4% identity (59.7% similar) in 615 aa overlap (37-644:226-807) 10 20 30 40 50 60 pF1KE5 GSHADMAPASTAEGAGEKPGPAAPAPAAQYECGECGKSFRWSSRLLHHQRTHTGERPYKC .: :::::: .:: : .:.: ::::.::.: CCDS54 PYKCEECGKAYMSYSSLINHKSTHSGEKNCKCDECGKSFNYSSVLDQHKRIHTGEKPYEC 200 210 220 230 240 250 70 80 90 100 110 120 pF1KE5 PDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHRSVHTGLRAFICGQCG .: :::..::.: :.: ::::.::.: : :.:. :: :..:. .::: . . : .:: CCDS54 GECGKAFRNSSGLRVHKRIHTGEKPYECDICGKTFSNSSGLRVHKRIHTGEKPYECDECG 260 270 280 290 300 310 130 140 150 160 170 180 pF1KE5 LAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHTGERPYTCGVCGKSFT :: : : :..:: : .: :.:. :: : .:. .::::.:: : :::.: CCDS54 KAFITCRTLLNHKSIHFGDKPYKCDECEKSFNYSSLLIQHKVIHTGEKPYECDECGKAFR 320 330 340 350 360 370 190 200 210 220 230 240 pF1KE5 QSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPAPGAASAAPPPQSREP .:..: :.:.::::.:..: .: :.:..::.: .:. : :: . . .: CCDS54 NSSGLIVHKRIHTGEKPYKCDVCGKAFSYSSGLAVHKSIH-----PGKKA----HECKEC 380 390 400 410 420 250 260 270 280 290 pF1KE5 GKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTV-------ELVYRCDG :: : .. : .: :. : . : . : : : : :.:: CCDS54 GKSFSYNSLLLQHRTIHTGERPYVCD-----VCGKTFRNNAGLKVHRRLHTGEKPYKCDV 430 440 450 460 470 480 300 310 320 330 340 350 pF1KE5 CEQGFSSEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACL : ... :. : .:. : . .: . . :. . : : : . : :.: CCDS54 CGKAYISRSSLKNHK---GIHLGEKPYKC-SYCEKSFNYSSALEQHKRIHTREKP-FGCD 490 500 510 520 530 360 370 380 390 400 410 pF1KE5 PCGKSFRTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPP :::.::. .::. :.. : .: . ..: : .. .:.::. :.. : :. : CCDS54 ECGKAFRNNSGLKVHKRIH--TGERPYKCEECGKAYISLSSLINHKSVH-----PGEKP- 540 550 560 570 580 420 430 440 450 460 470 pF1KE5 QAEAAEVTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRYHLRDHTGE : . : . . .:.:::: : :::. .: : : : :: : CCDS54 ------FKCDECEKAFITYRTLTNHKKVHLGEKPYKCDVCEKSFNYTSLLSQHRRVHTRE 590 600 610 620 630 640 480 490 500 510 520 530 pF1KE5 RPYQCGECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYA .::.: .: :.:. .: : .:.:.::: : . : :: .. : : : :. :.. CCDS54 KPYECDRCEKVFRNNSSLKVHKRIHTGERPYECDVCGKAYISHSSLINHKSTHPGRTPHT 650 660 670 680 690 700 540 550 560 570 580 590 pF1KE5 CGECGKAFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLC : :::::: .. : :..:: ::.: : :::::. .: : ::.:.::::.:. : : CCDS54 CDECGKAFFSSRTLISHKRVHLGEKPFKCVECGKSFSYSSLLSQHKRIHTGEKPYVCDRC 710 720 730 740 750 760 600 610 620 630 640 650 pF1KE5 PKTFTHSSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPPSTTAPAAG :.: .::.: .:.: :..:.:. : ::.... . : : .: CCDS54 GKAFRNSSGLTVHKRIHTGEKPYECDECGKAYISHSSLINHKSVHQGKQPYNCECGKSFN 770 780 790 800 810 820 660 670 680 690 700 710 pF1KE5 PQPPAPLAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQTFLLVQTAQ CCDS54 YRSVLDQHKRIHTGKKPYRCNECGKAFNIRSNLTKHKRTHTGEESLNVIYVGSYSGTSQK 830 840 850 860 870 880 >>CCDS12412.1 ZNF493 gene_id:284443|Hs108|chr19 (646 aa) initn: 2096 init1: 735 opt: 1093 Z-score: 530.8 bits: 109.2 E(32554): 3e-23 Smith-Waterman score: 1371; 35.3% identity (57.5% similar) in 614 aa overlap (36-649:82-640) 10 20 30 40 50 60 pF1KE5 VGSHADMAPASTAEGAGEKPGPAAPAPAAQYECGECGKSFRWSSRLLHHQRTHTGERPYK :.: ::::.: : : : .:.:.::::. :: CCDS12 KPFKCKKCGKSFCMLLHLCQHKRIHIRENSYRCEECGKAFIWFSTLTRHRRVHTGEKSYK 60 70 80 90 100 110 70 80 90 100 110 120 pF1KE5 CPDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHRSVHTGLRAFICGQC .: :.:. .: : :.: :::..::.: .: .: . : : :. .:: . . : : CCDS12 Y-ECGKSFNQDSNLTTHKRIHTGQKPYKCEECGTSFYQFSYLTRHKLIHTREKPYKCEQY 120 130 140 150 160 170 130 140 150 160 170 180 pF1KE5 GLAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHTGERPYTCGVCGKSF : .:. :: : :.::.:: : .: :::. :. .:. .:: :. . : :.. CCDS12 GKTFNQSSTLTGHKIIHNGEKPYKCEECGKAFSIFSTPTKHKIIHTEEKSHRCEEYCKAY 180 190 200 210 220 230 190 200 210 220 230 240 pF1KE5 TQSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPAPGAASAAPPPQSRE .:..: :.:.::::.:..: : :.:. :.: :. : . . .: CCDS12 KESSHLTTHKRIHTGEKPYKCEECGKAFSIFSTLTKHKIIH---------TEEKSHRCEE 240 250 260 270 280 250 260 270 280 290 300 pF1KE5 PGKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTVELVYRCDGCEQGFS ::.. ...: : . :. : :.:. : . :: CCDS12 CGKAYKESSHLTTHKRIHTGEKP--------------------------YKCEECGKTFS 290 300 310 310 320 330 340 350 360 pF1KE5 SEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACLPCGKSF .: .:. . : : : :: . : : . . : . : :::.: CCDS12 VFSILTKHKIIH-TEEKPYKCE---ECGKAFKRSSTLTKHRIIHTEEKP-YKCEECGKAF 320 330 340 350 360 370 370 380 390 400 410 420 pF1KE5 RTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPPQAEAAE . :: :. : .: . ..: : .: . ..: :.. : .:. : . : CCDS12 NQSSTLSIHKIIH--TGEKPYKCEECGKAFKRSSTLTIHKMIH-----TGEKPYKCEE-- 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 VTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRYHLRDHTGERPYQCG : . : . . ....:::: ::::::. : : : :: ..::.: CCDS12 --CGK---AFNRSSHLTTHKRIHTGHKPYKCKECGKSFSVFSTLTKHKIIHTDKKPYKCE 430 440 450 460 470 490 500 510 520 530 540 pF1KE5 ECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYACGECGK ::::::.:::.:.::...::: . . : .:: .:: ::: : ..:: ..:: : :::: CCDS12 ECGKAFNRSSILSIHKKIHTGEKPYKCEECGKAFKRSSHLAGHKQIHSVQKPYKCEECGK 480 490 500 510 520 530 550 560 570 580 590 600 pF1KE5 AFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLCPKTFTH :: : : .:. .:: :.:. : :::.: . ::: :. .::::.: .: : :.:.: CCDS12 AFSIFSTLTKHKIIHTEEKPYKCEKCGKTFYRFSNLNTHKIIHTGEKPCKCEECGKAFNH 540 550 560 570 580 590 610 620 630 640 650 660 pF1KE5 SSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPPSTTAPAAGPQPPAP ::::. :. :....:. : ::..: ...:.:: : .: CCDS12 SSNLIKHKLIHTGDKPYKCEACGKAFRRSSHLSRHKIIHIGIHTEETVQK 600 610 620 630 640 670 680 690 700 710 720 pF1KE5 LAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQTFLLVQTAQGLQLIP >>CCDS42536.1 ZNF493 gene_id:284443|Hs108|chr19 (774 aa) initn: 2096 init1: 735 opt: 1093 Z-score: 529.9 bits: 109.3 E(32554): 3.4e-23 Smith-Waterman score: 1371; 35.3% identity (57.5% similar) in 614 aa overlap (36-649:210-768) 10 20 30 40 50 60 pF1KE5 VGSHADMAPASTAEGAGEKPGPAAPAPAAQYECGECGKSFRWSSRLLHHQRTHTGERPYK :.: ::::.: : : : .:.:.::::. :: CCDS42 KPFKCKKCGKSFCMLLHLCQHKRIHIRENSYRCEECGKAFIWFSTLTRHRRVHTGEKSYK 180 190 200 210 220 230 70 80 90 100 110 120 pF1KE5 CPDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHRSVHTGLRAFICGQC .: :.:. .: : :.: :::..::.: .: .: . : : :. .:: . . : : CCDS42 Y-ECGKSFNQDSNLTTHKRIHTGQKPYKCEECGTSFYQFSYLTRHKLIHTREKPYKCEQY 240 250 260 270 280 290 130 140 150 160 170 180 pF1KE5 GLAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHTGERPYTCGVCGKSF : .:. :: : :.::.:: : .: :::. :. .:. .:: :. . : :.. CCDS42 GKTFNQSSTLTGHKIIHNGEKPYKCEECGKAFSIFSTPTKHKIIHTEEKSHRCEEYCKAY 300 310 320 330 340 350 190 200 210 220 230 240 pF1KE5 TQSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPAPGAASAAPPPQSRE .:..: :.:.::::.:..: : :.:. :.: :. : . . .: CCDS42 KESSHLTTHKRIHTGEKPYKCEECGKAFSIFSTLTKHKIIH---------TEEKSHRCEE 360 370 380 390 400 250 260 270 280 290 300 pF1KE5 PGKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTVELVYRCDGCEQGFS ::.. ...: : . :. : :.:. : . :: CCDS42 CGKAYKESSHLTTHKRIHTGEKP--------------------------YKCEECGKTFS 410 420 430 440 310 320 330 340 350 360 pF1KE5 SEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACLPCGKSF .: .:. . : : : :: . : : . . : . : :::.: CCDS42 VFSILTKHKIIH-TEEKPYKCE---ECGKAFKRSSTLTKHRIIHTEEKP-YKCEECGKAF 450 460 470 480 490 370 380 390 400 410 420 pF1KE5 RTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPPQAEAAE . :: :. : .: . ..: : .: . ..: :.. : .:. : . : CCDS42 NQSSTLSIHKIIH--TGEKPYKCEECGKAFKRSSTLTIHKMIH-----TGEKPYKCEE-- 500 510 520 530 540 430 440 450 460 470 480 pF1KE5 VTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRYHLRDHTGERPYQCG : . : . . ....:::: ::::::. : : : :: ..::.: CCDS42 --CGK---AFNRSSHLTTHKRIHTGHKPYKCKECGKSFSVFSTLTKHKIIHTDKKPYKCE 550 560 570 580 590 600 490 500 510 520 530 540 pF1KE5 ECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYACGECGK ::::::.:::.:.::...::: . . : .:: .:: ::: : ..:: ..:: : :::: CCDS42 ECGKAFNRSSILSIHKKIHTGEKPYKCEECGKAFKRSSHLAGHKQIHSVQKPYKCEECGK 610 620 630 640 650 660 550 560 570 580 590 600 pF1KE5 AFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLCPKTFTH :: : : .:. .:: :.:. : :::.: . ::: :. .::::.: .: : :.:.: CCDS42 AFSIFSTLTKHKIIHTEEKPYKCEKCGKTFYRFSNLNTHKIIHTGEKPCKCEECGKAFNH 670 680 690 700 710 720 610 620 630 640 650 660 pF1KE5 SSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPPSTTAPAAGPQPPAP ::::. :. :....:. : ::..: ...:.:: : .: CCDS42 SSNLIKHKLIHTGDKPYKCEACGKAFRRSSHLSRHKIIHIGIHTEETVQK 730 740 750 760 770 670 680 690 700 710 720 pF1KE5 LAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQTFLLVQTAQGLQLIP >>CCDS77335.1 ZNF473 gene_id:25888|Hs108|chr19 (859 aa) initn: 2651 init1: 737 opt: 1081 Z-score: 523.8 bits: 108.3 E(32554): 7.4e-23 Smith-Waterman score: 1337; 33.5% identity (57.9% similar) in 623 aa overlap (24-644:294-852) 10 20 30 40 50 pF1KE5 MSGVMVGSHADMAPASTAEGAGEKPGP--AAPAPAAQYECGECGKSFRWSSRL .:: . . . .:.:.::::.: .: CCDS77 QSTYLWHQKTHTGEKPCKSQDSDHPPSHDTQPGEHQKTHTDSKSYNCNECGKAFTRIFHL 270 280 290 300 310 320 60 70 80 90 100 110 pF1KE5 LHHQRTHTGERPYKCPDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHR .::. :: .: :.: : .:. . :. ::. :... .: .: : :..:::: :. CCDS77 TRHQKIHTRKR-YECSKCQATFNLRKHLIQHQKTHAAKTTSECQECGKIFRHSSLLIEHQ 330 340 350 360 370 380 120 130 140 150 160 170 pF1KE5 SVHTGLRAFICGQCGLAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHT ..:.: . . :.. : .:. .: . : : :.::.:: : .: :::. . : .::..:: CCDS77 ALHAGEEPYKCNERGKSFRHNSTLKIHQRVHSGEKPYKCSECGKAFHRHTHLNEHRRIHT 390 400 410 420 430 440 180 190 200 210 220 230 pF1KE5 GERPYTCGVCGKSFTQSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPA : ::. : : .::.. ..: .:: .::.:.:. : : .::. .. :. ::. : CCDS77 GYRPHKCQECVRSFSRPSHLMRHQAIHTAEKPYSCAECKETFSDNNRLVQHQKMH----- 450 460 470 480 490 240 250 260 270 280 290 pF1KE5 PGAASAAPPPQSREPGKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTV .. : . .: :. :.: . :. : . :. : .: CCDS77 ----TVKTPYECQECGERFICGSTLKCHESVHAREKQGF-------FVSGKILDQNPEQK 500 510 520 530 540 300 310 320 330 340 350 pF1KE5 ELVYRCDGCEQGFSSEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAA : ..:. ::. :: . : .:. . : CCDS77 EKCFKCNKCEKTFSCSKYLTQHERIHTRGVKP---------------------------- 550 560 570 360 370 380 390 400 410 pF1KE5 PAPGFACLPCGKSFRTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEE : : :::.: . : .::. :. . . .. : .:. . :::. :. :..: CCDS77 ----FECDQCGKAFGQSTRLIHHQRIHSRV--RLYKWGE-QGKAISSASLIKLQSFHTKE 580 590 600 610 620 630 420 430 440 450 460 470 pF1KE5 AAAGRPPPQAEAAEVTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRY .: : . . . : . ..: :.::..: . : . : CCDS77 ----HP--------FKCNECGKTFSHSAHLSKHQLIHAGENPFKCSKCDRVFTQRNYLVQ 640 650 660 670 480 490 500 510 520 530 pF1KE5 HLRDHTGERPYQCGECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRL : : :. ..: :.::::.:..:: :. :::.:.: . ..: :: .: :.. : :. CCDS77 HERTHARKKPLVCNECGKTFRQSSCLSKHQRIHSGEKPYVCDYCGKAFGLSAELVRHQRI 680 690 700 710 720 730 540 550 560 570 580 590 pF1KE5 HSGERPYACGECGKAFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGE :.::.::.: :::::: ..::: ::.:::::.:. :: :::.::: .:: ::::.:::: CCDS77 HTGEKPYVCQECGKAFTQSSCLSIHRRVHTGEKPYRCGECGKAFAQKANLTQHQRIHTGE 740 750 760 770 780 790 600 610 620 630 640 650 pF1KE5 RPFRCPLCPKTFTHSSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPP .:. : .: :.:. :..: : :.:. : . : : ..: . :.:: :.: CCDS77 KPYSCNVCGKAFVLSAHLNQHLRVHTQETLYQCQRCQKAFRCHSSLSRHQRVHNKQQYCL 800 810 820 830 840 850 660 670 680 690 700 710 pF1KE5 STTAPAAGPQPPAPLAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQT >>CCDS33077.1 ZNF473 gene_id:25888|Hs108|chr19 (871 aa) initn: 2930 init1: 737 opt: 1081 Z-score: 523.7 bits: 108.3 E(32554): 7.5e-23 Smith-Waterman score: 1337; 33.5% identity (57.9% similar) in 623 aa overlap (24-644:306-864) 10 20 30 40 50 pF1KE5 MSGVMVGSHADMAPASTAEGAGEKPGP--AAPAPAAQYECGECGKSFRWSSRL .:: . . . .:.:.::::.: .: CCDS33 QSTYLWHQKTHTGEKPCKSQDSDHPPSHDTQPGEHQKTHTDSKSYNCNECGKAFTRIFHL 280 290 300 310 320 330 60 70 80 90 100 110 pF1KE5 LHHQRTHTGERPYKCPDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHR .::. :: .: :.: : .:. . :. ::. :... .: .: : :..:::: :. CCDS33 TRHQKIHTRKR-YECSKCQATFNLRKHLIQHQKTHAAKTTSECQECGKIFRHSSLLIEHQ 340 350 360 370 380 390 120 130 140 150 160 170 pF1KE5 SVHTGLRAFICGQCGLAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHT ..:.: . . :.. : .:. .: . : : :.::.:: : .: :::. . : .::..:: CCDS33 ALHAGEEPYKCNERGKSFRHNSTLKIHQRVHSGEKPYKCSECGKAFHRHTHLNEHRRIHT 400 410 420 430 440 450 180 190 200 210 220 230 pF1KE5 GERPYTCGVCGKSFTQSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPA : ::. : : .::.. ..: .:: .::.:.:. : : .::. .. :. ::. : CCDS33 GYRPHKCQECVRSFSRPSHLMRHQAIHTAEKPYSCAECKETFSDNNRLVQHQKMH----- 460 470 480 490 500 240 250 260 270 280 290 pF1KE5 PGAASAAPPPQSREPGKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTV .. : . .: :. :.: . :. : . :. : .: CCDS33 ----TVKTPYECQECGERFICGSTLKCHESVHAREKQGF-------FVSGKILDQNPEQK 510 520 530 540 550 300 310 320 330 340 350 pF1KE5 ELVYRCDGCEQGFSSEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAA : ..:. ::. :: . : .:. . : CCDS33 EKCFKCNKCEKTFSCSKYLTQHERIHTRGVKP---------------------------- 560 570 580 590 360 370 380 390 400 410 pF1KE5 PAPGFACLPCGKSFRTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEE : : :::.: . : .::. :. . . .. : .:. . :::. :. :..: CCDS33 ----FECDQCGKAFGQSTRLIHHQRIHSRV--RLYKWGE-QGKAISSASLIKLQSFHTKE 600 610 620 630 640 420 430 440 450 460 470 pF1KE5 AAAGRPPPQAEAAEVTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRY .: : . . . : . ..: :.::..: . : . : CCDS33 ----HP--------FKCNECGKTFSHSAHLSKHQLIHAGENPFKCSKCDRVFTQRNYLVQ 650 660 670 680 690 480 490 500 510 520 530 pF1KE5 HLRDHTGERPYQCGECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRL : : :. ..: :.::::.:..:: :. :::.:.: . ..: :: .: :.. : :. CCDS33 HERTHARKKPLVCNECGKTFRQSSCLSKHQRIHSGEKPYVCDYCGKAFGLSAELVRHQRI 700 710 720 730 740 750 540 550 560 570 580 590 pF1KE5 HSGERPYACGECGKAFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGE :.::.::.: :::::: ..::: ::.:::::.:. :: :::.::: .:: ::::.:::: CCDS33 HTGEKPYVCQECGKAFTQSSCLSIHRRVHTGEKPYRCGECGKAFAQKANLTQHQRIHTGE 760 770 780 790 800 810 600 610 620 630 640 650 pF1KE5 RPFRCPLCPKTFTHSSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPP .:. : .: :.:. :..: : :.:. : . : : ..: . :.:: :.: CCDS33 KPYSCNVCGKAFVLSAHLNQHLRVHTQETLYQCQRCQKAFRCHSSLSRHQRVHNKQQYCL 820 830 840 850 860 870 660 670 680 690 700 710 pF1KE5 STTAPAAGPQPPAPLAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQT >>CCDS62706.1 ZNF229 gene_id:7772|Hs108|chr19 (819 aa) initn: 3868 init1: 836 opt: 1077 Z-score: 522.2 bits: 107.9 E(32554): 9.1e-23 Smith-Waterman score: 1510; 38.4% identity (58.8% similar) in 619 aa overlap (30-648:309-816) 10 20 30 40 50 pF1KE5 MSGVMVGSHADMAPASTAEGAGEKPGPAAPAPAAQYECGECGKSFRWSSRLLHHQRTHT :. . . : :.. : .... .: :. . CCDS62 RVPLKEKLCQYDEFSEGLRHSAHLNRHQRVPTGEKSVKSLERGRGVRQNTHIRNHPRAPV 280 290 300 310 320 330 60 70 80 90 100 110 pF1KE5 GERPYKCPDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHRSVHTGLRA :. ::.: : :.:. .:.:: :: :::.:::.: .: ::: ::: : .:. :::: . CCDS62 GDMPYRCDVCGKGFRYKSVLLIHQGVHTGRRPYKCEECGKAFGRSSNLLVHQRVHTGEKP 340 350 360 370 380 390 120 130 140 150 160 170 pF1KE5 FICGQCGLAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHTGERPYTCG . :..:: .:..:: : : : ::::.:: : .: :.: .:.:..:.:.: ::.::.:: CCDS62 YKCSECGKGFSYSSVLQVHQRLHTGEKPYTCSECGKGFCAKSALHKHQHIHPGEKPYSCG 400 410 420 430 440 450 180 190 200 210 220 230 pF1KE5 VCGKSFTQSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPAPGAASAAP :::.:. :..: .::..::::::..: : : :.:.: : :::.: CCDS62 ECGKGFSCSSHLSSHQKTHTGERPYQCDKCGKGFSHNSYLQAHQRVH------------- 460 470 480 490 500 240 250 260 270 280 290 pF1KE5 PPQSREPGKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTVELVYRCDG . .:: :.:. CCDS62 ----------------MGQHL----------------------------------YKCNV 510 300 310 320 330 340 350 pF1KE5 CEQGFSSEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACL : ..:: :: :: .. .: . : :. : : .. : . : CCDS62 CGKSFSYSSGLLMHQRL---HTGEKPYKC--ECGKSFGRSSDLHIHQRVHTGEKP-YKCS 520 530 540 550 560 360 370 380 390 400 410 pF1KE5 PCGKSFRTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPP :::.:: . : ::. : .: . . : : .: ..:: ::. : CCDS62 ECGKGFRRNSDLHSHQRVH--TGERPYVCDVCGKGFIYSSDLLIHQRVH----------- 570 580 590 600 610 420 430 440 450 460 470 pF1KE5 QAEAAEVTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRYHLRDHTGE ..:.:::::::::.:. :::: : : :::: CCDS62 -----------------------------TGEKPYKCAECGKGFSYSSGLLIHQRVHTGE 620 630 640 480 490 500 510 520 530 pF1KE5 RPYQCGECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYA .::.: ::::.:. .: : ::::::: . .:: ::: :...:. . : :::.::.::. CCDS62 KPYRCQECGKGFRCTSSLHKHQRVHTGKKPYTCDQCGKGFSYGSNLRTHQRLHTGEKPYT 650 660 670 680 690 700 540 550 560 570 580 590 pF1KE5 CGECGKAFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLC : ::::.:: : : :..:::::.:. : ::::...:.:.:. ::::::::.:..: : CCDS62 CCECGKGFRYGSGLLSHKRVHTGEKPYRCHVCGKGYSQSSHLQGHQRVHTGEKPYKCEEC 710 720 730 740 750 760 600 610 620 630 640 650 pF1KE5 PKTFTHSSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPPSTTAPAAG : : ..: : .:::.:..:.:.:: .::.:: ... :. : :.: : CCDS62 GKGFGRNSCLHVHQRVHTGEKPYTCGVCGKGFSYTSGLRNHQRVHLGENPYK 770 780 790 800 810 660 670 680 690 700 710 pF1KE5 PQPPAPLAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQTFLLVQTAQ >>CCDS42574.1 ZNF229 gene_id:7772|Hs108|chr19 (825 aa) initn: 3837 init1: 836 opt: 1077 Z-score: 522.1 bits: 107.9 E(32554): 9.2e-23 Smith-Waterman score: 1510; 38.4% identity (58.8% similar) in 619 aa overlap (30-648:315-822) 10 20 30 40 50 pF1KE5 MSGVMVGSHADMAPASTAEGAGEKPGPAAPAPAAQYECGECGKSFRWSSRLLHHQRTHT :. . . : :.. : .... .: :. . CCDS42 RVPLKEKLCQYDEFSEGLRHSAHLNRHQRVPTGEKSVKSLERGRGVRQNTHIRNHPRAPV 290 300 310 320 330 340 60 70 80 90 100 110 pF1KE5 GERPYKCPDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHRSVHTGLRA :. ::.: : :.:. .:.:: :: :::.:::.: .: ::: ::: : .:. :::: . CCDS42 GDMPYRCDVCGKGFRYKSVLLIHQGVHTGRRPYKCEECGKAFGRSSNLLVHQRVHTGEKP 350 360 370 380 390 400 120 130 140 150 160 170 pF1KE5 FICGQCGLAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHTGERPYTCG . :..:: .:..:: : : : ::::.:: : .: :.: .:.:..:.:.: ::.::.:: CCDS42 YKCSECGKGFSYSSVLQVHQRLHTGEKPYTCSECGKGFCAKSALHKHQHIHPGEKPYSCG 410 420 430 440 450 460 180 190 200 210 220 230 pF1KE5 VCGKSFTQSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPAPGAASAAP :::.:. :..: .::..::::::..: : : :.:.: : :::.: CCDS42 ECGKGFSCSSHLSSHQKTHTGERPYQCDKCGKGFSHNSYLQAHQRVH------------- 470 480 490 500 510 240 250 260 270 280 290 pF1KE5 PPQSREPGKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTVELVYRCDG . .:: :.:. CCDS42 ----------------MGQHL----------------------------------YKCNV 520 300 310 320 330 340 350 pF1KE5 CEQGFSSEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACL : ..:: :: :: .. .: . : :. : : .. : . : CCDS42 CGKSFSYSSGLLMHQRL---HTGEKPYKC--ECGKSFGRSSDLHIHQRVHTGEKP-YKCS 530 540 550 560 570 360 370 380 390 400 410 pF1KE5 PCGKSFRTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPP :::.:: . : ::. : .: . . : : .: ..:: ::. : CCDS42 ECGKGFRRNSDLHSHQRVH--TGERPYVCDVCGKGFIYSSDLLIHQRVH----------- 580 590 600 610 620 420 430 440 450 460 470 pF1KE5 QAEAAEVTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRYHLRDHTGE ..:.:::::::::.:. :::: : : :::: CCDS42 -----------------------------TGEKPYKCAECGKGFSYSSGLLIHQRVHTGE 630 640 650 480 490 500 510 520 530 pF1KE5 RPYQCGECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYA .::.: ::::.:. .: : ::::::: . .:: ::: :...:. . : :::.::.::. CCDS42 KPYRCQECGKGFRCTSSLHKHQRVHTGKKPYTCDQCGKGFSYGSNLRTHQRLHTGEKPYT 660 670 680 690 700 710 540 550 560 570 580 590 pF1KE5 CGECGKAFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLC : ::::.:: : : :..:::::.:. : ::::...:.:.:. ::::::::.:..: : CCDS42 CCECGKGFRYGSGLLSHKRVHTGEKPYRCHVCGKGYSQSSHLQGHQRVHTGEKPYKCEEC 720 730 740 750 760 770 600 610 620 630 640 650 pF1KE5 PKTFTHSSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPPSTTAPAAG : : ..: : .:::.:..:.:.:: .::.:: ... :. : :.: : CCDS42 GKGFGRNSCLHVHQRVHTGEKPYTCGVCGKGFSYTSGLRNHQRVHLGENPYK 780 790 800 810 820 660 670 680 690 700 710 pF1KE5 PQPPAPLAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQTFLLVQTAQ 1059 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 07:03:19 2016 done: Tue Nov 8 07:03:20 2016 Total Scan time: 4.710 Total Display time: 0.230 Function used was FASTA [36.3.4 Apr, 2011]