FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE5830, 1059 aa
1>>>pF1KE5830 1059 - 1059 aa - 1059 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.7613+/-0.00108; mu= 2.1815+/- 0.066
mean_var=459.9595+/-94.276, 0's: 0 Z-trim(117.1): 904 B-trim: 417 in 1/54
Lambda= 0.059802
statistics sampled from 16906 (17855) to 16906 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.78), E-opt: 0.2 (0.548), width: 16
Scan time: 4.710
The best scores are: opt bits E(32554)
CCDS33116.3 ZNF628 gene_id:89887|Hs108|chr19 (1059) 7465 659.2 1.3e-188
CCDS59368.1 ZNF729 gene_id:100287226|Hs108|chr19 (1252) 1375 133.9 2.2e-30
CCDS47357.2 ZFP62 gene_id:643836|Hs108|chr5 ( 867) 1313 128.3 7e-29
CCDS54955.1 ZFP62 gene_id:643836|Hs108|chr5 ( 900) 1313 128.3 7.2e-29
CCDS12412.1 ZNF493 gene_id:284443|Hs108|chr19 ( 646) 1093 109.2 3e-23
CCDS42536.1 ZNF493 gene_id:284443|Hs108|chr19 ( 774) 1093 109.3 3.4e-23
CCDS77335.1 ZNF473 gene_id:25888|Hs108|chr19 ( 859) 1081 108.3 7.4e-23
CCDS33077.1 ZNF473 gene_id:25888|Hs108|chr19 ( 871) 1081 108.3 7.5e-23
CCDS62706.1 ZNF229 gene_id:7772|Hs108|chr19 ( 819) 1077 107.9 9.1e-23
CCDS42574.1 ZNF229 gene_id:7772|Hs108|chr19 ( 825) 1077 107.9 9.2e-23
CCDS32915.1 ZNF700 gene_id:90592|Hs108|chr19 ( 742) 1064 106.8 1.9e-22
CCDS74289.1 ZNF700 gene_id:90592|Hs108|chr19 ( 745) 1064 106.8 1.9e-22
CCDS46101.1 ZNF234 gene_id:10780|Hs108|chr19 ( 700) 1034 104.1 1.1e-21
CCDS75846.1 ZNF658 gene_id:26149|Hs108|chr9 (1059) 1033 104.3 1.5e-21
CCDS12856.1 ZNF600 gene_id:162966|Hs108|chr19 ( 722) 984 99.8 2.2e-20
CCDS12988.1 MZF1 gene_id:7593|Hs108|chr19 ( 734) 933 95.4 4.7e-19
CCDS12632.1 ZNF45 gene_id:7596|Hs108|chr19 ( 682) 898 92.4 3.6e-18
CCDS44202.1 ZNF697 gene_id:90874|Hs108|chr1 ( 545) 883 91.0 7.7e-18
CCDS82391.1 ZNF160 gene_id:90338|Hs108|chr19 ( 782) 874 90.4 1.7e-17
CCDS12859.1 ZNF160 gene_id:90338|Hs108|chr19 ( 818) 874 90.4 1.7e-17
CCDS32890.2 ZNF358 gene_id:140467|Hs108|chr19 ( 568) 854 88.5 4.5e-17
CCDS45460.1 ZNF771 gene_id:51333|Hs108|chr16 ( 317) 844 87.3 5.6e-17
CCDS54259.1 ZNF607 gene_id:84775|Hs108|chr19 ( 695) 845 87.8 8.7e-17
CCDS33006.1 ZNF607 gene_id:84775|Hs108|chr19 ( 696) 845 87.8 8.7e-17
CCDS58688.1 ZNF211 gene_id:10520|Hs108|chr19 ( 503) 840 87.2 9.6e-17
CCDS58687.1 ZNF211 gene_id:10520|Hs108|chr19 ( 555) 840 87.3 1e-16
CCDS12957.1 ZNF211 gene_id:10520|Hs108|chr19 ( 564) 840 87.3 1e-16
CCDS12956.1 ZNF211 gene_id:10520|Hs108|chr19 ( 577) 840 87.3 1e-16
CCDS74468.1 ZNF211 gene_id:10520|Hs108|chr19 ( 616) 840 87.3 1.1e-16
CCDS58686.1 ZNF211 gene_id:10520|Hs108|chr19 ( 629) 840 87.3 1.1e-16
CCDS43619.1 ZNF3 gene_id:7551|Hs108|chr7 ( 446) 835 86.7 1.2e-16
CCDS45463.1 ZNF629 gene_id:23361|Hs108|chr16 ( 869) 840 87.5 1.4e-16
CCDS46212.1 ZNF814 gene_id:730051|Hs108|chr19 ( 855) 837 87.2 1.6e-16
CCDS10901.1 ZNF19 gene_id:7567|Hs108|chr16 ( 458) 829 86.2 1.7e-16
CCDS32330.1 ZNF774 gene_id:342132|Hs108|chr15 ( 483) 827 86.1 2e-16
CCDS41502.1 ZNF239 gene_id:8187|Hs108|chr10 ( 458) 823 85.7 2.5e-16
CCDS75904.1 ZNF79 gene_id:7633|Hs108|chr9 ( 364) 819 85.3 2.7e-16
CCDS12959.2 ZNF551 gene_id:90233|Hs108|chr19 ( 670) 825 86.1 2.8e-16
CCDS6437.1 ZNF16 gene_id:7564|Hs108|chr8 ( 682) 825 86.1 2.8e-16
CCDS69664.1 ZNF79 gene_id:7633|Hs108|chr9 ( 474) 819 85.4 3.2e-16
CCDS6871.1 ZNF79 gene_id:7633|Hs108|chr9 ( 498) 819 85.4 3.3e-16
CCDS35075.1 ZNF782 gene_id:158431|Hs108|chr9 ( 699) 820 85.7 3.9e-16
CCDS74207.1 ZSCAN30 gene_id:100101467|Hs108|chr18 ( 307) 808 84.2 4.7e-16
CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 815 85.2 4.9e-16
CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 815 85.2 5.1e-16
CCDS12977.1 ZNF497 gene_id:162968|Hs108|chr19 ( 498) 812 84.8 5.1e-16
CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 815 85.2 5.1e-16
CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 815 85.2 5.2e-16
CCDS10681.2 ZNF768 gene_id:79724|Hs108|chr16 ( 540) 812 84.9 5.3e-16
CCDS31418.1 ZNF214 gene_id:7761|Hs108|chr11 ( 606) 812 84.9 5.7e-16
>>CCDS33116.3 ZNF628 gene_id:89887|Hs108|chr19 (1059 aa)
initn: 7465 init1: 7465 opt: 7465 Z-score: 3499.4 bits: 659.2 E(32554): 1.3e-188
Smith-Waterman score: 7465; 99.8% identity (100.0% similar) in 1059 aa overlap (1-1059:1-1059)
10 20 30 40 50 60
pF1KE5 MSGVMVGSHADMAPASTAEGAGEKPGPAAPAPAAQYECGECGKSFRWSSRLLHHQRTHTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MSGVMVGSHADMAPASTAEGAGEKPGPAAPAPAAQYECGECGKSFRWSSRLLHHQRTHTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE5 ERPYKCPDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHRSVHTGLRAF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ERPYKCPDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHRSVHTGLRAF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE5 ICGQCGLAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHTGERPYTCGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ICGQCGLAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHTGERPYTCGV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE5 CGKSFTQSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPAPGAASAAPP
:::::::::::::::::::::::::::::::::::::::::::::::::::::.::::::
CCDS33 CGKSFTQSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPAPGTASAAPP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE5 PQSREPGKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTVELVYRCDGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PQSREPGKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTVELVYRCDGC
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE5 EQGFSSEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 EQGFSSEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACLP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE5 CGKSFRTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 CGKSFRTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPPQ
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE5 AEAAEVTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRYHLRDHTGER
::::::::::::::::::.:::::::::::::::::::::::::::::::::::::::::
CCDS33 AEAAEVTCPQEPLAPAAPVPPPPPSAPASAERPYKCAECGKSFKGSSGLRYHLRDHTGER
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE5 PYQCGECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYAC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PYQCGECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYAC
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE5 GECGKAFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLCP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GECGKAFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLCP
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE5 KTFTHSSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPPSTTAPAAGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KTFTHSSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPPSTTAPAAGP
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE5 QPPAPLAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQTFLLVQTAQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QPPAPLAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQTFLLVQTAQG
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE5 LQLIPSSVQPPTPPPPPAPPKLILLPSSSAGAGGGRARQGPRAVGKAGQGAGVVWLPGPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LQLIPSSVQPPTPPPPPAPPKLILLPSSSAGAGGGRARQGPRAVGKAGQGAGVVWLPGPG
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE5 GLGVQGAASAGASGTGQSLIVLQNVGGGEAGPQEMSGVQLQPLRPAPEVTTVQLQPAQEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GLGVQGAASAGASGTGQSLIVLQNVGGGEAGPQEMSGVQLQPLRPAPEVTTVQLQPAQEV
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE5 TTVQLQPAQEVTTVQLQPAQEVTTVQLQPVAGQLSNSSGGAVATEAPNLLVVQSGAAEEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TTVQLQPAQEVTTVQLQPAQEVTTVQLQPVAGQLSNSSGGAVATEAPNLLVVQSGAAEEL
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE5 LTGPGPGEAGDGEASTGVVQDVLFETLQTDEGLQSVLVLSGADGEQTRLCVQEVETLPPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LTGPGPGEAGDGEASTGVVQDVLFETLQTDEGLQSVLVLSGADGEQTRLCVQEVETLPPG
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE5 LTEPPATGPPGQKLLIIRSAPATELLDSSNTGGGTATLQLLAPPPSGPASGPAGLPGAPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LTEPPATGPPGQKLLIIRSAPATELLDSSNTGGGTATLQLLAPPPSGPASGPAGLPGAPA
970 980 990 1000 1010 1020
1030 1040 1050
pF1KE5 SQMVQVVPAGAGPGVMTPQGLPSIQIVQTLPAVQLVHTF
:::::::::::::::::::::::::::::::::::::::
CCDS33 SQMVQVVPAGAGPGVMTPQGLPSIQIVQTLPAVQLVHTF
1030 1040 1050
>>CCDS59368.1 ZNF729 gene_id:100287226|Hs108|chr19 (1252 aa)
initn: 3532 init1: 760 opt: 1375 Z-score: 659.0 bits: 133.9 E(32554): 2.2e-30
Smith-Waterman score: 1561; 38.6% identity (61.4% similar) in 609 aa overlap (36-644:376-930)
10 20 30 40 50 60
pF1KE5 VGSHADMAPASTAEGAGEKPGPAAPAPAAQYECGECGKSFRWSSRLLHHQRTHTGERPYK
:.: ::::.:.:::.: :. .::::.:::
CCDS59 KPYKREECGKAFSQSSTLRKHEIIHTGEKPYKCEECGKAFKWSSKLTVHKVVHTGEKPYK
350 360 370 380 390 400
70 80 90 100 110 120
pF1KE5 CPDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHRSVHTGLRAFICGQC
: .: :::. :.: :. :::..::.: .: :::. :: :. :. .::: . . : .:
CCDS59 CEECGKAFSQFSTLKKHKIIHTGKKPYKCEECGKAFNSSSTLMKHKIIHTGEKPYKCEEC
410 420 430 440 450 460
130 140 150 160 170 180
pF1KE5 GLAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHTGERPYTCGVCGKSF
: ::. ::: : ::::.:: : .: :::.. :.::::. .:::..:: : :::.:
CCDS59 GKAFRQSSHLTRHKAIHTGEKPYKCEECGKAFNHFSDLRRHKIIHTGKKPYKCEECGKAF
470 480 490 500 510 520
190 200 210 220 230 240
pF1KE5 TQSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPAPGAASAAPPPQSRE
.::..::.:: .::::.:..: : :.: ::.: .:. : .. : . .:
CCDS59 SQSSTLRNHQIIHTGEKPYKCEECGKAFKWSSKLTVHKVIH---------TGEKPCKCEE
530 540 550 560 570
250 260 270 280 290 300
pF1KE5 PGKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTVELVYRCDGCEQGFS
::.: . :..: : : : .:.:. : ..:.
CCDS59 CGKAFKHFSALRKHKVIH--------------------------TREKLYKCEECGKAFN
580 590 600 610
310 320 330 340 350 360
pF1KE5 SEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACLPCGKSF
. .: .:. .. .: . : :: . : : . .. : . : :::.:
CCDS59 NSSILAKHKII---HTGKKPYKCE-ECGKAFRQSSHLTRHKAIHTGEKP-YKCEECGKAF
620 630 640 650 660
370 380 390 400 410 420
pF1KE5 RTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPPQAEAAE
..: ::. : .: . ..: : .: ....: :. :. :. : . :
CCDS59 SHFSALRRHKIIH--TGKKPYKCEECGKAFSHFSALRRHKIIHT-----GEKPYKCEE--
670 680 690 700 710
430 440 450 460 470 480
pF1KE5 VTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRYHLRDHTGERPYQCG
: . : . .. .::.: :: ::::::: :.:: : :: :. :.:
CCDS59 --CGK---AFKWSSKLTVHKVIHTAEKPCKCEECGKSFKHFSALRKHKVIHTREKLYKCE
720 730 740 750 760 770
490 500 510 520 530 540
pF1KE5 ECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYACGECGK
:: :::. : : :. .::: . . : .:: .:::::. : .:.::.: : ::::
CCDS59 ECVKAFNSFSALMKHKVIHTGEKPYKCEECGKAFKWSSKLTVHKVIHTGEKPCKCEECGK
780 790 800 810 820 830
550 560 570 580 590 600
pF1KE5 AFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLCPKTFTH
::.. : ::.:. .:::..:. : :::.:.:.:.::.:. .:.::.:..: : :.:
CCDS59 AFKHFSALRKHKVIHTGKKPYKCEECGKAFSQSSSLRKHEIIHSGEKPYKCEECGKAFKW
840 850 860 870 880 890
610 620 630 640 650 660
pF1KE5 SSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPPSTTAPAAGPQPPAP
:.: .:. :.::.: : ::..: . :..: :
CCDS59 LSKLTVHKVIHTAEKPCKCEECGKAFKHFSALRKHKIIHTGKKPYKCEECGKAFNDSSTL
900 910 920 930 940 950
670 680 690 700 710 720
pF1KE5 LAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQTFLLVQTAQGLQLIP
CCDS59 MKHKIIHTGKKPYKCAECGKAFKQSSHLTRHKAIHTGEKPYKCEECGKDFNNSSTLKKHK
960 970 980 990 1000 1010
>--
initn: 2629 init1: 704 opt: 741 Z-score: 363.4 bits: 79.2 E(32554): 6.4e-14
Smith-Waterman score: 777; 37.8% identity (61.8% similar) in 296 aa overlap (356-648:936-1217)
330 340 350 360 370 380
pF1KE5 QEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACLPCGKSFRTVAGLSRHQHSHGAAGGQA
. : :::.: . : .:. : .: .
CCDS59 KPCKCEECGKAFKHFSALRKHKIIHTGKKPYKCEECGKAFNDSSTLMKHKIIH--TGKKP
910 920 930 940 950 960
390 400 410 420 430 440
pF1KE5 FRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPPQAEAAEVTCPQEPLAPAAPAPPPPPS
..:. : .: : . : :. :. :. : . : : .. . .
CCDS59 YKCAECGKAFKQSSHLTRHKAIHT-----GEKPYKCEE----CGKDF---NNSSTLKKHK
970 980 990 1000 1010
450 460 470 480 490 500
pF1KE5 APASAERPYKCAECGKSFKGSSGLRYHLRDHTGERPYQCGECGKAFKRSSLLAIHQRVHT
. :. ::: :: :.:.. :.: : ::::.::.: ::::::: :: :. :. .::
CCDS59 LIHTREKLYKCEECVKAFNNFSALMKHKIIHTGEKPYKCEECGKAFKWSSKLTEHKVIHT
1020 1030 1040 1050 1060 1070
510 520 530 540 550 560
pF1KE5 GLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYACGECGKAFRNTSCLRRHRHVHTGERP
: . : .: .:: : . : .:.:..:: : :::::: :.: : .:. .::::.:
CCDS59 GEKPCKCEECDKAFKHFSALRKHKVIHTGKKPYQCDECGKAFNNSSTLTKHKIIHTGEKP
1080 1090 1100 1110 1120 1130
570 580 590 600 610 620
pF1KE5 HACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHSAERPFTCP
. : :::.:.:.: : .:. .:. :.:..: : :.:..::.: :. :..:.:. :
CCDS59 YKCEECGKAFSQSSILTKHKIIHSVEKPYKCEECGKAFNQSSHLTRHKTIHTGEKPYKCE
1140 1150 1160 1170 1180 1190
630 640 650 660 670 680
pF1KE5 ICGRGFVMAAYLQRHLRTHA---PANTPPSTTAPAAGPQPPAPLAAARAPPATQDVHVLP
::..:.. .:: :: :. :.:
CCDS59 ECGKAFIQCSYLIRHKTIHTREKPTNVKKVPKLLSNPHTLLDKTIHTGEKPYKCEECAKA
1200 1210 1220 1230 1240 1250
>>CCDS47357.2 ZFP62 gene_id:643836|Hs108|chr5 (867 aa)
initn: 3562 init1: 743 opt: 1313 Z-score: 631.9 bits: 128.3 E(32554): 7e-29
Smith-Waterman score: 1503; 37.4% identity (59.7% similar) in 615 aa overlap (37-644:193-774)
10 20 30 40 50 60
pF1KE5 GSHADMAPASTAEGAGEKPGPAAPAPAAQYECGECGKSFRWSSRLLHHQRTHTGERPYKC
.: :::::: .:: : .:.: ::::.::.:
CCDS47 PYKCEECGKAYMSYSSLINHKSTHSGEKNCKCDECGKSFNYSSVLDQHKRIHTGEKPYEC
170 180 190 200 210 220
70 80 90 100 110 120
pF1KE5 PDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHRSVHTGLRAFICGQCG
.: :::..::.: :.: ::::.::.: : :.:. :: :..:. .::: . . : .::
CCDS47 GECGKAFRNSSGLRVHKRIHTGEKPYECDICGKTFSNSSGLRVHKRIHTGEKPYECDECG
230 240 250 260 270 280
130 140 150 160 170 180
pF1KE5 LAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHTGERPYTCGVCGKSFT
:: : : :..:: : .: :.:. :: : .:. .::::.:: : :::.:
CCDS47 KAFITCRTLLNHKSIHFGDKPYKCDECEKSFNYSSLLIQHKVIHTGEKPYECDECGKAFR
290 300 310 320 330 340
190 200 210 220 230 240
pF1KE5 QSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPAPGAASAAPPPQSREP
.:..: :.:.::::.:..: .: :.:..::.: .:. : :: . . .:
CCDS47 NSSGLIVHKRIHTGEKPYKCDVCGKAFSYSSGLAVHKSIH-----PGKKA----HECKEC
350 360 370 380 390
250 260 270 280 290
pF1KE5 GKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTV-------ELVYRCDG
:: : .. : .: :. : . : . : : : : :.::
CCDS47 GKSFSYNSLLLQHRTIHTGERPYVCD-----VCGKTFRNNAGLKVHRRLHTGEKPYKCDV
400 410 420 430 440
300 310 320 330 340 350
pF1KE5 CEQGFSSEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACL
: ... :. : .:. : . .: . . :. . : : : . : :.:
CCDS47 CGKAYISRSSLKNHK---GIHLGEKPYKC-SYCEKSFNYSSALEQHKRIHTREKP-FGCD
450 460 470 480 490 500
360 370 380 390 400 410
pF1KE5 PCGKSFRTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPP
:::.::. .::. :.. : .: . ..: : .. .:.::. :.. : :. :
CCDS47 ECGKAFRNNSGLKVHKRIH--TGERPYKCEECGKAYISLSSLINHKSVH-----PGEKP-
510 520 530 540 550
420 430 440 450 460 470
pF1KE5 QAEAAEVTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRYHLRDHTGE
: . : . . .:.:::: : :::. .: : : : :: :
CCDS47 ------FKCDECEKAFITYRTLTNHKKVHLGEKPYKCDVCEKSFNYTSLLSQHRRVHTRE
560 570 580 590 600
480 490 500 510 520 530
pF1KE5 RPYQCGECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYA
.::.: .: :.:. .: : .:.:.::: : . : :: .. : : : :. :..
CCDS47 KPYECDRCEKVFRNNSSLKVHKRIHTGERPYECDVCGKAYISHSSLINHKSTHPGRTPHT
610 620 630 640 650 660
540 550 560 570 580 590
pF1KE5 CGECGKAFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLC
: :::::: .. : :..:: ::.: : :::::. .: : ::.:.::::.:. : :
CCDS47 CDECGKAFFSSRTLISHKRVHLGEKPFKCVECGKSFSYSSLLSQHKRIHTGEKPYVCDRC
670 680 690 700 710 720
600 610 620 630 640 650
pF1KE5 PKTFTHSSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPPSTTAPAAG
:.: .::.: .:.: :..:.:. : ::.... . : : .:
CCDS47 GKAFRNSSGLTVHKRIHTGEKPYECDECGKAYISHSSLINHKSVHQGKQPYNCECGKSFN
730 740 750 760 770 780
660 670 680 690 700 710
pF1KE5 PQPPAPLAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQTFLLVQTAQ
CCDS47 YRSVLDQHKRIHTGKKPYRCNECGKAFNIRSNLTKHKRTHTGEESLNVIYVGSYSGTSQK
790 800 810 820 830 840
>>CCDS54955.1 ZFP62 gene_id:643836|Hs108|chr5 (900 aa)
initn: 3562 init1: 743 opt: 1313 Z-score: 631.7 bits: 128.3 E(32554): 7.2e-29
Smith-Waterman score: 1503; 37.4% identity (59.7% similar) in 615 aa overlap (37-644:226-807)
10 20 30 40 50 60
pF1KE5 GSHADMAPASTAEGAGEKPGPAAPAPAAQYECGECGKSFRWSSRLLHHQRTHTGERPYKC
.: :::::: .:: : .:.: ::::.::.:
CCDS54 PYKCEECGKAYMSYSSLINHKSTHSGEKNCKCDECGKSFNYSSVLDQHKRIHTGEKPYEC
200 210 220 230 240 250
70 80 90 100 110 120
pF1KE5 PDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHRSVHTGLRAFICGQCG
.: :::..::.: :.: ::::.::.: : :.:. :: :..:. .::: . . : .::
CCDS54 GECGKAFRNSSGLRVHKRIHTGEKPYECDICGKTFSNSSGLRVHKRIHTGEKPYECDECG
260 270 280 290 300 310
130 140 150 160 170 180
pF1KE5 LAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHTGERPYTCGVCGKSFT
:: : : :..:: : .: :.:. :: : .:. .::::.:: : :::.:
CCDS54 KAFITCRTLLNHKSIHFGDKPYKCDECEKSFNYSSLLIQHKVIHTGEKPYECDECGKAFR
320 330 340 350 360 370
190 200 210 220 230 240
pF1KE5 QSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPAPGAASAAPPPQSREP
.:..: :.:.::::.:..: .: :.:..::.: .:. : :: . . .:
CCDS54 NSSGLIVHKRIHTGEKPYKCDVCGKAFSYSSGLAVHKSIH-----PGKKA----HECKEC
380 390 400 410 420
250 260 270 280 290
pF1KE5 GKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTV-------ELVYRCDG
:: : .. : .: :. : . : . : : : : :.::
CCDS54 GKSFSYNSLLLQHRTIHTGERPYVCD-----VCGKTFRNNAGLKVHRRLHTGEKPYKCDV
430 440 450 460 470 480
300 310 320 330 340 350
pF1KE5 CEQGFSSEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACL
: ... :. : .:. : . .: . . :. . : : : . : :.:
CCDS54 CGKAYISRSSLKNHK---GIHLGEKPYKC-SYCEKSFNYSSALEQHKRIHTREKP-FGCD
490 500 510 520 530
360 370 380 390 400 410
pF1KE5 PCGKSFRTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPP
:::.::. .::. :.. : .: . ..: : .. .:.::. :.. : :. :
CCDS54 ECGKAFRNNSGLKVHKRIH--TGERPYKCEECGKAYISLSSLINHKSVH-----PGEKP-
540 550 560 570 580
420 430 440 450 460 470
pF1KE5 QAEAAEVTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRYHLRDHTGE
: . : . . .:.:::: : :::. .: : : : :: :
CCDS54 ------FKCDECEKAFITYRTLTNHKKVHLGEKPYKCDVCEKSFNYTSLLSQHRRVHTRE
590 600 610 620 630 640
480 490 500 510 520 530
pF1KE5 RPYQCGECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYA
.::.: .: :.:. .: : .:.:.::: : . : :: .. : : : :. :..
CCDS54 KPYECDRCEKVFRNNSSLKVHKRIHTGERPYECDVCGKAYISHSSLINHKSTHPGRTPHT
650 660 670 680 690 700
540 550 560 570 580 590
pF1KE5 CGECGKAFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLC
: :::::: .. : :..:: ::.: : :::::. .: : ::.:.::::.:. : :
CCDS54 CDECGKAFFSSRTLISHKRVHLGEKPFKCVECGKSFSYSSLLSQHKRIHTGEKPYVCDRC
710 720 730 740 750 760
600 610 620 630 640 650
pF1KE5 PKTFTHSSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPPSTTAPAAG
:.: .::.: .:.: :..:.:. : ::.... . : : .:
CCDS54 GKAFRNSSGLTVHKRIHTGEKPYECDECGKAYISHSSLINHKSVHQGKQPYNCECGKSFN
770 780 790 800 810 820
660 670 680 690 700 710
pF1KE5 PQPPAPLAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQTFLLVQTAQ
CCDS54 YRSVLDQHKRIHTGKKPYRCNECGKAFNIRSNLTKHKRTHTGEESLNVIYVGSYSGTSQK
830 840 850 860 870 880
>>CCDS12412.1 ZNF493 gene_id:284443|Hs108|chr19 (646 aa)
initn: 2096 init1: 735 opt: 1093 Z-score: 530.8 bits: 109.2 E(32554): 3e-23
Smith-Waterman score: 1371; 35.3% identity (57.5% similar) in 614 aa overlap (36-649:82-640)
10 20 30 40 50 60
pF1KE5 VGSHADMAPASTAEGAGEKPGPAAPAPAAQYECGECGKSFRWSSRLLHHQRTHTGERPYK
:.: ::::.: : : : .:.:.::::. ::
CCDS12 KPFKCKKCGKSFCMLLHLCQHKRIHIRENSYRCEECGKAFIWFSTLTRHRRVHTGEKSYK
60 70 80 90 100 110
70 80 90 100 110 120
pF1KE5 CPDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHRSVHTGLRAFICGQC
.: :.:. .: : :.: :::..::.: .: .: . : : :. .:: . . : :
CCDS12 Y-ECGKSFNQDSNLTTHKRIHTGQKPYKCEECGTSFYQFSYLTRHKLIHTREKPYKCEQY
120 130 140 150 160 170
130 140 150 160 170 180
pF1KE5 GLAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHTGERPYTCGVCGKSF
: .:. :: : :.::.:: : .: :::. :. .:. .:: :. . : :..
CCDS12 GKTFNQSSTLTGHKIIHNGEKPYKCEECGKAFSIFSTPTKHKIIHTEEKSHRCEEYCKAY
180 190 200 210 220 230
190 200 210 220 230 240
pF1KE5 TQSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPAPGAASAAPPPQSRE
.:..: :.:.::::.:..: : :.:. :.: :. : . . .:
CCDS12 KESSHLTTHKRIHTGEKPYKCEECGKAFSIFSTLTKHKIIH---------TEEKSHRCEE
240 250 260 270 280
250 260 270 280 290 300
pF1KE5 PGKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTVELVYRCDGCEQGFS
::.. ...: : . :. : :.:. : . ::
CCDS12 CGKAYKESSHLTTHKRIHTGEKP--------------------------YKCEECGKTFS
290 300 310
310 320 330 340 350 360
pF1KE5 SEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACLPCGKSF
.: .:. . : : : :: . : : . . : . : :::.:
CCDS12 VFSILTKHKIIH-TEEKPYKCE---ECGKAFKRSSTLTKHRIIHTEEKP-YKCEECGKAF
320 330 340 350 360 370
370 380 390 400 410 420
pF1KE5 RTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPPQAEAAE
. :: :. : .: . ..: : .: . ..: :.. : .:. : . :
CCDS12 NQSSTLSIHKIIH--TGEKPYKCEECGKAFKRSSTLTIHKMIH-----TGEKPYKCEE--
380 390 400 410 420
430 440 450 460 470 480
pF1KE5 VTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRYHLRDHTGERPYQCG
: . : . . ....:::: ::::::. : : : :: ..::.:
CCDS12 --CGK---AFNRSSHLTTHKRIHTGHKPYKCKECGKSFSVFSTLTKHKIIHTDKKPYKCE
430 440 450 460 470
490 500 510 520 530 540
pF1KE5 ECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYACGECGK
::::::.:::.:.::...::: . . : .:: .:: ::: : ..:: ..:: : ::::
CCDS12 ECGKAFNRSSILSIHKKIHTGEKPYKCEECGKAFKRSSHLAGHKQIHSVQKPYKCEECGK
480 490 500 510 520 530
550 560 570 580 590 600
pF1KE5 AFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLCPKTFTH
:: : : .:. .:: :.:. : :::.: . ::: :. .::::.: .: : :.:.:
CCDS12 AFSIFSTLTKHKIIHTEEKPYKCEKCGKTFYRFSNLNTHKIIHTGEKPCKCEECGKAFNH
540 550 560 570 580 590
610 620 630 640 650 660
pF1KE5 SSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPPSTTAPAAGPQPPAP
::::. :. :....:. : ::..: ...:.:: : .:
CCDS12 SSNLIKHKLIHTGDKPYKCEACGKAFRRSSHLSRHKIIHIGIHTEETVQK
600 610 620 630 640
670 680 690 700 710 720
pF1KE5 LAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQTFLLVQTAQGLQLIP
>>CCDS42536.1 ZNF493 gene_id:284443|Hs108|chr19 (774 aa)
initn: 2096 init1: 735 opt: 1093 Z-score: 529.9 bits: 109.3 E(32554): 3.4e-23
Smith-Waterman score: 1371; 35.3% identity (57.5% similar) in 614 aa overlap (36-649:210-768)
10 20 30 40 50 60
pF1KE5 VGSHADMAPASTAEGAGEKPGPAAPAPAAQYECGECGKSFRWSSRLLHHQRTHTGERPYK
:.: ::::.: : : : .:.:.::::. ::
CCDS42 KPFKCKKCGKSFCMLLHLCQHKRIHIRENSYRCEECGKAFIWFSTLTRHRRVHTGEKSYK
180 190 200 210 220 230
70 80 90 100 110 120
pF1KE5 CPDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHRSVHTGLRAFICGQC
.: :.:. .: : :.: :::..::.: .: .: . : : :. .:: . . : :
CCDS42 Y-ECGKSFNQDSNLTTHKRIHTGQKPYKCEECGTSFYQFSYLTRHKLIHTREKPYKCEQY
240 250 260 270 280 290
130 140 150 160 170 180
pF1KE5 GLAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHTGERPYTCGVCGKSF
: .:. :: : :.::.:: : .: :::. :. .:. .:: :. . : :..
CCDS42 GKTFNQSSTLTGHKIIHNGEKPYKCEECGKAFSIFSTPTKHKIIHTEEKSHRCEEYCKAY
300 310 320 330 340 350
190 200 210 220 230 240
pF1KE5 TQSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPAPGAASAAPPPQSRE
.:..: :.:.::::.:..: : :.:. :.: :. : . . .:
CCDS42 KESSHLTTHKRIHTGEKPYKCEECGKAFSIFSTLTKHKIIH---------TEEKSHRCEE
360 370 380 390 400
250 260 270 280 290 300
pF1KE5 PGKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTVELVYRCDGCEQGFS
::.. ...: : . :. : :.:. : . ::
CCDS42 CGKAYKESSHLTTHKRIHTGEKP--------------------------YKCEECGKTFS
410 420 430 440
310 320 330 340 350 360
pF1KE5 SEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACLPCGKSF
.: .:. . : : : :: . : : . . : . : :::.:
CCDS42 VFSILTKHKIIH-TEEKPYKCE---ECGKAFKRSSTLTKHRIIHTEEKP-YKCEECGKAF
450 460 470 480 490
370 380 390 400 410 420
pF1KE5 RTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPPQAEAAE
. :: :. : .: . ..: : .: . ..: :.. : .:. : . :
CCDS42 NQSSTLSIHKIIH--TGEKPYKCEECGKAFKRSSTLTIHKMIH-----TGEKPYKCEE--
500 510 520 530 540
430 440 450 460 470 480
pF1KE5 VTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRYHLRDHTGERPYQCG
: . : . . ....:::: ::::::. : : : :: ..::.:
CCDS42 --CGK---AFNRSSHLTTHKRIHTGHKPYKCKECGKSFSVFSTLTKHKIIHTDKKPYKCE
550 560 570 580 590 600
490 500 510 520 530 540
pF1KE5 ECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYACGECGK
::::::.:::.:.::...::: . . : .:: .:: ::: : ..:: ..:: : ::::
CCDS42 ECGKAFNRSSILSIHKKIHTGEKPYKCEECGKAFKRSSHLAGHKQIHSVQKPYKCEECGK
610 620 630 640 650 660
550 560 570 580 590 600
pF1KE5 AFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLCPKTFTH
:: : : .:. .:: :.:. : :::.: . ::: :. .::::.: .: : :.:.:
CCDS42 AFSIFSTLTKHKIIHTEEKPYKCEKCGKTFYRFSNLNTHKIIHTGEKPCKCEECGKAFNH
670 680 690 700 710 720
610 620 630 640 650 660
pF1KE5 SSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPPSTTAPAAGPQPPAP
::::. :. :....:. : ::..: ...:.:: : .:
CCDS42 SSNLIKHKLIHTGDKPYKCEACGKAFRRSSHLSRHKIIHIGIHTEETVQK
730 740 750 760 770
670 680 690 700 710 720
pF1KE5 LAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQTFLLVQTAQGLQLIP
>>CCDS77335.1 ZNF473 gene_id:25888|Hs108|chr19 (859 aa)
initn: 2651 init1: 737 opt: 1081 Z-score: 523.8 bits: 108.3 E(32554): 7.4e-23
Smith-Waterman score: 1337; 33.5% identity (57.9% similar) in 623 aa overlap (24-644:294-852)
10 20 30 40 50
pF1KE5 MSGVMVGSHADMAPASTAEGAGEKPGP--AAPAPAAQYECGECGKSFRWSSRL
.:: . . . .:.:.::::.: .:
CCDS77 QSTYLWHQKTHTGEKPCKSQDSDHPPSHDTQPGEHQKTHTDSKSYNCNECGKAFTRIFHL
270 280 290 300 310 320
60 70 80 90 100 110
pF1KE5 LHHQRTHTGERPYKCPDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHR
.::. :: .: :.: : .:. . :. ::. :... .: .: : :..:::: :.
CCDS77 TRHQKIHTRKR-YECSKCQATFNLRKHLIQHQKTHAAKTTSECQECGKIFRHSSLLIEHQ
330 340 350 360 370 380
120 130 140 150 160 170
pF1KE5 SVHTGLRAFICGQCGLAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHT
..:.: . . :.. : .:. .: . : : :.::.:: : .: :::. . : .::..::
CCDS77 ALHAGEEPYKCNERGKSFRHNSTLKIHQRVHSGEKPYKCSECGKAFHRHTHLNEHRRIHT
390 400 410 420 430 440
180 190 200 210 220 230
pF1KE5 GERPYTCGVCGKSFTQSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPA
: ::. : : .::.. ..: .:: .::.:.:. : : .::. .. :. ::. :
CCDS77 GYRPHKCQECVRSFSRPSHLMRHQAIHTAEKPYSCAECKETFSDNNRLVQHQKMH-----
450 460 470 480 490
240 250 260 270 280 290
pF1KE5 PGAASAAPPPQSREPGKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTV
.. : . .: :. :.: . :. : . :. : .:
CCDS77 ----TVKTPYECQECGERFICGSTLKCHESVHAREKQGF-------FVSGKILDQNPEQK
500 510 520 530 540
300 310 320 330 340 350
pF1KE5 ELVYRCDGCEQGFSSEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAA
: ..:. ::. :: . : .:. . :
CCDS77 EKCFKCNKCEKTFSCSKYLTQHERIHTRGVKP----------------------------
550 560 570
360 370 380 390 400 410
pF1KE5 PAPGFACLPCGKSFRTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEE
: : :::.: . : .::. :. . . .. : .:. . :::. :. :..:
CCDS77 ----FECDQCGKAFGQSTRLIHHQRIHSRV--RLYKWGE-QGKAISSASLIKLQSFHTKE
580 590 600 610 620 630
420 430 440 450 460 470
pF1KE5 AAAGRPPPQAEAAEVTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRY
.: : . . . : . ..: :.::..: . : . :
CCDS77 ----HP--------FKCNECGKTFSHSAHLSKHQLIHAGENPFKCSKCDRVFTQRNYLVQ
640 650 660 670
480 490 500 510 520 530
pF1KE5 HLRDHTGERPYQCGECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRL
: : :. ..: :.::::.:..:: :. :::.:.: . ..: :: .: :.. : :.
CCDS77 HERTHARKKPLVCNECGKTFRQSSCLSKHQRIHSGEKPYVCDYCGKAFGLSAELVRHQRI
680 690 700 710 720 730
540 550 560 570 580 590
pF1KE5 HSGERPYACGECGKAFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGE
:.::.::.: :::::: ..::: ::.:::::.:. :: :::.::: .:: ::::.::::
CCDS77 HTGEKPYVCQECGKAFTQSSCLSIHRRVHTGEKPYRCGECGKAFAQKANLTQHQRIHTGE
740 750 760 770 780 790
600 610 620 630 640 650
pF1KE5 RPFRCPLCPKTFTHSSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPP
.:. : .: :.:. :..: : :.:. : . : : ..: . :.:: :.:
CCDS77 KPYSCNVCGKAFVLSAHLNQHLRVHTQETLYQCQRCQKAFRCHSSLSRHQRVHNKQQYCL
800 810 820 830 840 850
660 670 680 690 700 710
pF1KE5 STTAPAAGPQPPAPLAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQT
>>CCDS33077.1 ZNF473 gene_id:25888|Hs108|chr19 (871 aa)
initn: 2930 init1: 737 opt: 1081 Z-score: 523.7 bits: 108.3 E(32554): 7.5e-23
Smith-Waterman score: 1337; 33.5% identity (57.9% similar) in 623 aa overlap (24-644:306-864)
10 20 30 40 50
pF1KE5 MSGVMVGSHADMAPASTAEGAGEKPGP--AAPAPAAQYECGECGKSFRWSSRL
.:: . . . .:.:.::::.: .:
CCDS33 QSTYLWHQKTHTGEKPCKSQDSDHPPSHDTQPGEHQKTHTDSKSYNCNECGKAFTRIFHL
280 290 300 310 320 330
60 70 80 90 100 110
pF1KE5 LHHQRTHTGERPYKCPDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHR
.::. :: .: :.: : .:. . :. ::. :... .: .: : :..:::: :.
CCDS33 TRHQKIHTRKR-YECSKCQATFNLRKHLIQHQKTHAAKTTSECQECGKIFRHSSLLIEHQ
340 350 360 370 380 390
120 130 140 150 160 170
pF1KE5 SVHTGLRAFICGQCGLAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHT
..:.: . . :.. : .:. .: . : : :.::.:: : .: :::. . : .::..::
CCDS33 ALHAGEEPYKCNERGKSFRHNSTLKIHQRVHSGEKPYKCSECGKAFHRHTHLNEHRRIHT
400 410 420 430 440 450
180 190 200 210 220 230
pF1KE5 GERPYTCGVCGKSFTQSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPA
: ::. : : .::.. ..: .:: .::.:.:. : : .::. .. :. ::. :
CCDS33 GYRPHKCQECVRSFSRPSHLMRHQAIHTAEKPYSCAECKETFSDNNRLVQHQKMH-----
460 470 480 490 500
240 250 260 270 280 290
pF1KE5 PGAASAAPPPQSREPGKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTV
.. : . .: :. :.: . :. : . :. : .:
CCDS33 ----TVKTPYECQECGERFICGSTLKCHESVHAREKQGF-------FVSGKILDQNPEQK
510 520 530 540 550
300 310 320 330 340 350
pF1KE5 ELVYRCDGCEQGFSSEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAA
: ..:. ::. :: . : .:. . :
CCDS33 EKCFKCNKCEKTFSCSKYLTQHERIHTRGVKP----------------------------
560 570 580 590
360 370 380 390 400 410
pF1KE5 PAPGFACLPCGKSFRTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEE
: : :::.: . : .::. :. . . .. : .:. . :::. :. :..:
CCDS33 ----FECDQCGKAFGQSTRLIHHQRIHSRV--RLYKWGE-QGKAISSASLIKLQSFHTKE
600 610 620 630 640
420 430 440 450 460 470
pF1KE5 AAAGRPPPQAEAAEVTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRY
.: : . . . : . ..: :.::..: . : . :
CCDS33 ----HP--------FKCNECGKTFSHSAHLSKHQLIHAGENPFKCSKCDRVFTQRNYLVQ
650 660 670 680 690
480 490 500 510 520 530
pF1KE5 HLRDHTGERPYQCGECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRL
: : :. ..: :.::::.:..:: :. :::.:.: . ..: :: .: :.. : :.
CCDS33 HERTHARKKPLVCNECGKTFRQSSCLSKHQRIHSGEKPYVCDYCGKAFGLSAELVRHQRI
700 710 720 730 740 750
540 550 560 570 580 590
pF1KE5 HSGERPYACGECGKAFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGE
:.::.::.: :::::: ..::: ::.:::::.:. :: :::.::: .:: ::::.::::
CCDS33 HTGEKPYVCQECGKAFTQSSCLSIHRRVHTGEKPYRCGECGKAFAQKANLTQHQRIHTGE
760 770 780 790 800 810
600 610 620 630 640 650
pF1KE5 RPFRCPLCPKTFTHSSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPP
.:. : .: :.:. :..: : :.:. : . : : ..: . :.:: :.:
CCDS33 KPYSCNVCGKAFVLSAHLNQHLRVHTQETLYQCQRCQKAFRCHSSLSRHQRVHNKQQYCL
820 830 840 850 860 870
660 670 680 690 700 710
pF1KE5 STTAPAAGPQPPAPLAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQT
>>CCDS62706.1 ZNF229 gene_id:7772|Hs108|chr19 (819 aa)
initn: 3868 init1: 836 opt: 1077 Z-score: 522.2 bits: 107.9 E(32554): 9.1e-23
Smith-Waterman score: 1510; 38.4% identity (58.8% similar) in 619 aa overlap (30-648:309-816)
10 20 30 40 50
pF1KE5 MSGVMVGSHADMAPASTAEGAGEKPGPAAPAPAAQYECGECGKSFRWSSRLLHHQRTHT
:. . . : :.. : .... .: :. .
CCDS62 RVPLKEKLCQYDEFSEGLRHSAHLNRHQRVPTGEKSVKSLERGRGVRQNTHIRNHPRAPV
280 290 300 310 320 330
60 70 80 90 100 110
pF1KE5 GERPYKCPDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHRSVHTGLRA
:. ::.: : :.:. .:.:: :: :::.:::.: .: ::: ::: : .:. :::: .
CCDS62 GDMPYRCDVCGKGFRYKSVLLIHQGVHTGRRPYKCEECGKAFGRSSNLLVHQRVHTGEKP
340 350 360 370 380 390
120 130 140 150 160 170
pF1KE5 FICGQCGLAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHTGERPYTCG
. :..:: .:..:: : : : ::::.:: : .: :.: .:.:..:.:.: ::.::.::
CCDS62 YKCSECGKGFSYSSVLQVHQRLHTGEKPYTCSECGKGFCAKSALHKHQHIHPGEKPYSCG
400 410 420 430 440 450
180 190 200 210 220 230
pF1KE5 VCGKSFTQSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPAPGAASAAP
:::.:. :..: .::..::::::..: : : :.:.: : :::.:
CCDS62 ECGKGFSCSSHLSSHQKTHTGERPYQCDKCGKGFSHNSYLQAHQRVH-------------
460 470 480 490 500
240 250 260 270 280 290
pF1KE5 PPQSREPGKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTVELVYRCDG
. .:: :.:.
CCDS62 ----------------MGQHL----------------------------------YKCNV
510
300 310 320 330 340 350
pF1KE5 CEQGFSSEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACL
: ..:: :: :: .. .: . : :. : : .. : . :
CCDS62 CGKSFSYSSGLLMHQRL---HTGEKPYKC--ECGKSFGRSSDLHIHQRVHTGEKP-YKCS
520 530 540 550 560
360 370 380 390 400 410
pF1KE5 PCGKSFRTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPP
:::.:: . : ::. : .: . . : : .: ..:: ::. :
CCDS62 ECGKGFRRNSDLHSHQRVH--TGERPYVCDVCGKGFIYSSDLLIHQRVH-----------
570 580 590 600 610
420 430 440 450 460 470
pF1KE5 QAEAAEVTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRYHLRDHTGE
..:.:::::::::.:. :::: : : ::::
CCDS62 -----------------------------TGEKPYKCAECGKGFSYSSGLLIHQRVHTGE
620 630 640
480 490 500 510 520 530
pF1KE5 RPYQCGECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYA
.::.: ::::.:. .: : ::::::: . .:: ::: :...:. . : :::.::.::.
CCDS62 KPYRCQECGKGFRCTSSLHKHQRVHTGKKPYTCDQCGKGFSYGSNLRTHQRLHTGEKPYT
650 660 670 680 690 700
540 550 560 570 580 590
pF1KE5 CGECGKAFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLC
: ::::.:: : : :..:::::.:. : ::::...:.:.:. ::::::::.:..: :
CCDS62 CCECGKGFRYGSGLLSHKRVHTGEKPYRCHVCGKGYSQSSHLQGHQRVHTGEKPYKCEEC
710 720 730 740 750 760
600 610 620 630 640 650
pF1KE5 PKTFTHSSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPPSTTAPAAG
: : ..: : .:::.:..:.:.:: .::.:: ... :. : :.: :
CCDS62 GKGFGRNSCLHVHQRVHTGEKPYTCGVCGKGFSYTSGLRNHQRVHLGENPYK
770 780 790 800 810
660 670 680 690 700 710
pF1KE5 PQPPAPLAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQTFLLVQTAQ
>>CCDS42574.1 ZNF229 gene_id:7772|Hs108|chr19 (825 aa)
initn: 3837 init1: 836 opt: 1077 Z-score: 522.1 bits: 107.9 E(32554): 9.2e-23
Smith-Waterman score: 1510; 38.4% identity (58.8% similar) in 619 aa overlap (30-648:315-822)
10 20 30 40 50
pF1KE5 MSGVMVGSHADMAPASTAEGAGEKPGPAAPAPAAQYECGECGKSFRWSSRLLHHQRTHT
:. . . : :.. : .... .: :. .
CCDS42 RVPLKEKLCQYDEFSEGLRHSAHLNRHQRVPTGEKSVKSLERGRGVRQNTHIRNHPRAPV
290 300 310 320 330 340
60 70 80 90 100 110
pF1KE5 GERPYKCPDCPKAFKGSSALLYHQRGHTGERPYQCPDCPKAFKRSSLLQIHRSVHTGLRA
:. ::.: : :.:. .:.:: :: :::.:::.: .: ::: ::: : .:. :::: .
CCDS42 GDMPYRCDVCGKGFRYKSVLLIHQGVHTGRRPYKCEECGKAFGRSSNLLVHQRVHTGEKP
350 360 370 380 390 400
120 130 140 150 160 170
pF1KE5 FICGQCGLAFKWSSHYQYHLRQHTGERPYPCPDCPKAFKNSSSLRRHRHVHTGERPYTCG
. :..:: .:..:: : : : ::::.:: : .: :.: .:.:..:.:.: ::.::.::
CCDS42 YKCSECGKGFSYSSVLQVHQRLHTGEKPYTCSECGKGFCAKSALHKHQHIHPGEKPYSCG
410 420 430 440 450 460
180 190 200 210 220 230
pF1KE5 VCGKSFTQSTNLRQHQRVHTGERPFRCPLCPKTFTHSSNLLLHQRTHGAAPAPGAASAAP
:::.:. :..: .::..::::::..: : : :.:.: : :::.:
CCDS42 ECGKGFSCSSHLSSHQKTHTGERPYQCDKCGKGFSHNSYLQAHQRVH-------------
470 480 490 500 510
240 250 260 270 280 290
pF1KE5 PPQSREPGKVFVCDAYLQRHLQPHSPPAPPAPPPPPPPVVPELFLAAAETTVELVYRCDG
. .:: :.:.
CCDS42 ----------------MGQHL----------------------------------YKCNV
520
300 310 320 330 340 350
pF1KE5 CEQGFSSEELLLEHQPCPGPDAAPQPQEAPAEAPKADQPPSPLPQPPPPAAAPAPGFACL
: ..:: :: :: .. .: . : :. : : .. : . :
CCDS42 CGKSFSYSSGLLMHQRL---HTGEKPYKC--ECGKSFGRSSDLHIHQRVHTGEKP-YKCS
530 540 550 560 570
360 370 380 390 400 410
pF1KE5 PCGKSFRTVAGLSRHQHSHGAAGGQAFRCGSCDGSFPQLASLLAHQQCHVEEAAAGRPPP
:::.:: . : ::. : .: . . : : .: ..:: ::. :
CCDS42 ECGKGFRRNSDLHSHQRVH--TGERPYVCDVCGKGFIYSSDLLIHQRVH-----------
580 590 600 610 620
420 430 440 450 460 470
pF1KE5 QAEAAEVTCPQEPLAPAAPAPPPPPSAPASAERPYKCAECGKSFKGSSGLRYHLRDHTGE
..:.:::::::::.:. :::: : : ::::
CCDS42 -----------------------------TGEKPYKCAECGKGFSYSSGLLIHQRVHTGE
630 640 650
480 490 500 510 520 530
pF1KE5 RPYQCGECGKAFKRSSLLAIHQRVHTGLRAFTCGQCGLTFKWSSHYQYHLRLHSGERPYA
.::.: ::::.:. .: : ::::::: . .:: ::: :...:. . : :::.::.::.
CCDS42 KPYRCQECGKGFRCTSSLHKHQRVHTGKKPYTCDQCGKGFSYGSNLRTHQRLHTGEKPYT
660 670 680 690 700 710
540 550 560 570 580 590
pF1KE5 CGECGKAFRNTSCLRRHRHVHTGERPHACGVCGKSFAQTSNLRQHQRVHTGERPFRCPLC
: ::::.:: : : :..:::::.:. : ::::...:.:.:. ::::::::.:..: :
CCDS42 CCECGKGFRYGSGLLSHKRVHTGEKPYRCHVCGKGYSQSSHLQGHQRVHTGEKPYKCEEC
720 730 740 750 760 770
600 610 620 630 640 650
pF1KE5 PKTFTHSSNLLLHQRTHSAERPFTCPICGRGFVMAAYLQRHLRTHAPANTPPSTTAPAAG
: : ..: : .:::.:..:.:.:: .::.:: ... :. : :.: :
CCDS42 GKGFGRNSCLHVHQRVHTGEKPYTCGVCGKGFSYTSGLRNHQRVHLGENPYK
780 790 800 810 820
660 670 680 690 700 710
pF1KE5 PQPPAPLAAARAPPATQDVHVLPHLQATLSLEVAGGTAQAPSLGPAAPNSQTFLLVQTAQ
1059 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 07:03:19 2016 done: Tue Nov 8 07:03:20 2016
Total Scan time: 4.710 Total Display time: 0.230
Function used was FASTA [36.3.4 Apr, 2011]