FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4118, 496 aa
1>>>pF1KE4118 496 - 496 aa - 496 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.1998+/-0.00083; mu= 13.4932+/- 0.050
mean_var=254.2208+/-52.183, 0's: 0 Z-trim(116.7): 867 B-trim: 1008 in 1/52
Lambda= 0.080439
statistics sampled from 16342 (17306) to 16342 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.809), E-opt: 0.2 (0.532), width: 16
Scan time: 3.330
The best scores are: opt bits E(32554)
CCDS12928.1 FIZ1 gene_id:84922|Hs108|chr19 ( 496) 3588 429.3 4.7e-120
CCDS46170.1 ZNF845 gene_id:91664|Hs108|chr19 ( 970) 705 95.1 3.6e-19
CCDS46162.1 ZNF836 gene_id:162962|Hs108|chr19 ( 936) 680 92.2 2.7e-18
CCDS74350.1 ZNF850 gene_id:342892|Hs108|chr19 (1058) 660 90.0 1.4e-17
CCDS59379.1 ZNF850 gene_id:342892|Hs108|chr19 (1090) 660 90.0 1.4e-17
CCDS82391.1 ZNF160 gene_id:90338|Hs108|chr19 ( 782) 657 89.4 1.5e-17
CCDS12859.1 ZNF160 gene_id:90338|Hs108|chr19 ( 818) 657 89.4 1.6e-17
CCDS62706.1 ZNF229 gene_id:7772|Hs108|chr19 ( 819) 642 87.7 5.2e-17
CCDS42574.1 ZNF229 gene_id:7772|Hs108|chr19 ( 825) 642 87.7 5.2e-17
CCDS33122.1 ZNF470 gene_id:388566|Hs108|chr19 ( 717) 631 86.4 1.2e-16
CCDS75846.1 ZNF658 gene_id:26149|Hs108|chr9 (1059) 620 85.3 3.6e-16
CCDS32973.1 ZNF93 gene_id:81931|Hs108|chr19 ( 620) 616 84.5 3.6e-16
CCDS33026.2 ZNF780A gene_id:284323|Hs108|chr19 ( 641) 610 83.8 5.9e-16
CCDS46079.1 ZNF780A gene_id:284323|Hs108|chr19 ( 642) 610 83.8 6e-16
CCDS12498.1 ZNF420 gene_id:147923|Hs108|chr19 ( 688) 609 83.8 6.7e-16
CCDS74322.1 ZNF91 gene_id:7644|Hs108|chr19 (1159) 599 82.9 2e-15
CCDS42541.1 ZNF91 gene_id:7644|Hs108|chr19 (1191) 599 82.9 2.1e-15
CCDS46167.1 ZNF808 gene_id:388558|Hs108|chr19 ( 903) 583 80.9 6.4e-15
CCDS12856.1 ZNF600 gene_id:162966|Hs108|chr19 ( 722) 578 80.2 8.4e-15
CCDS32918.1 ZNF443 gene_id:10224|Hs108|chr19 ( 671) 574 79.7 1.1e-14
CCDS2717.1 ZNF197 gene_id:10168|Hs108|chr3 (1029) 569 79.4 2.1e-14
CCDS42241.1 ZNF594 gene_id:84622|Hs108|chr17 ( 807) 567 79.0 2.2e-14
CCDS46991.1 ZNF721 gene_id:170960|Hs108|chr4 ( 923) 566 79.0 2.5e-14
CCDS82297.1 ZNF799 gene_id:90576|Hs108|chr19 ( 611) 555 77.4 4.8e-14
CCDS45989.1 ZNF799 gene_id:90576|Hs108|chr19 ( 643) 555 77.5 5e-14
CCDS64999.1 ZNF7 gene_id:7553|Hs108|chr8 ( 590) 554 77.3 5.1e-14
CCDS6435.1 ZNF7 gene_id:7553|Hs108|chr8 ( 686) 554 77.4 5.6e-14
CCDS64996.1 ZNF7 gene_id:7553|Hs108|chr8 ( 697) 554 77.4 5.6e-14
CCDS33090.1 ZNF616 gene_id:90317|Hs108|chr19 ( 781) 554 77.5 6e-14
CCDS45988.1 ZNF44 gene_id:51710|Hs108|chr19 ( 615) 551 77.0 6.7e-14
CCDS54223.1 ZNF44 gene_id:51710|Hs108|chr19 ( 663) 551 77.0 7e-14
CCDS46077.1 ZNF780B gene_id:163131|Hs108|chr19 ( 833) 548 76.8 1e-13
CCDS47357.2 ZFP62 gene_id:643836|Hs108|chr5 ( 867) 543 76.3 1.6e-13
CCDS54955.1 ZFP62 gene_id:643836|Hs108|chr5 ( 900) 543 76.3 1.6e-13
CCDS12988.1 MZF1 gene_id:7593|Hs108|chr19 ( 734) 537 75.5 2.3e-13
CCDS77240.1 ZNF433 gene_id:163059|Hs108|chr19 ( 638) 529 74.4 4e-13
CCDS45983.1 ZNF433 gene_id:163059|Hs108|chr19 ( 673) 529 74.5 4.1e-13
CCDS5667.1 ZKSCAN5 gene_id:23660|Hs108|chr7 ( 839) 529 74.6 4.7e-13
CCDS13174.1 ZNF337 gene_id:26152|Hs108|chr20 ( 751) 522 73.7 7.7e-13
CCDS45981.1 ZNF823 gene_id:55552|Hs108|chr19 ( 610) 517 73.0 1e-12
CCDS54240.1 ZNF208 gene_id:7757|Hs108|chr19 (1280) 512 72.9 2.4e-12
CCDS43678.1 ZNF775 gene_id:285971|Hs108|chr7 ( 537) 500 71.0 3.7e-12
CCDS46166.1 ZNF534 gene_id:147658|Hs108|chr19 ( 661) 499 71.0 4.6e-12
CCDS46165.1 ZNF534 gene_id:147658|Hs108|chr19 ( 674) 499 71.0 4.6e-12
CCDS42495.1 ZNF699 gene_id:374879|Hs108|chr19 ( 642) 498 70.9 4.9e-12
CCDS73868.1 ZNF48 gene_id:197407|Hs108|chr16 ( 495) 493 70.1 6.3e-12
CCDS10679.1 ZNF48 gene_id:197407|Hs108|chr16 ( 618) 493 70.2 7.1e-12
CCDS46030.1 ZNF257 gene_id:113835|Hs108|chr19 ( 563) 492 70.1 7.3e-12
CCDS2713.1 ZNF445 gene_id:353274|Hs108|chr3 (1031) 495 70.8 8.2e-12
CCDS75077.1 ZNF595 gene_id:152687|Hs108|chr4 ( 465) 489 69.6 8.3e-12
>>CCDS12928.1 FIZ1 gene_id:84922|Hs108|chr19 (496 aa)
initn: 3588 init1: 3588 opt: 3588 Z-score: 2268.8 bits: 429.3 E(32554): 4.7e-120
Smith-Waterman score: 3588; 99.8% identity (100.0% similar) in 496 aa overlap (1-496:1-496)
10 20 30 40 50 60
pF1KE4 MDDVPAPTPAPAPPAAAAPRVPFHCSECGKSFRYRSDLRRHFARHTALKPHACPRCGKGF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MDDVPAPTPAPAPPAAAAPRVPFHCSECGKSFRYRSDLRRHFARHTALKPHACPRCGKGF
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 KHSFNLANHLRSHTGERPYRCSACPKGFRDSTGLLHHQVVHTGEKPYCCLVCELRFSSRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 KHSFNLANHLRSHTGERPYRCSACPKGFRDSTGLLHHQVVHTGEKPYCCLVCELRFSSRS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 SLGRHLKRQHRGVLPSPLQPGPGLPALSAPCSVCCNVGPCSVCGGSGAGGGEGPEGAGAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 SLGRHLKRQHRGVLPSPLQPGPGLPALSAPCSVCCNVGPCSVCGGSGAGGGEGPEGAGAG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 LGSWGLAEAAAAAAASLPPFACGACARRFDHGRELAAHWAAHTDVKPFKCPRCERDFNAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LGSWGLAEAAAAAAASLPPFACGACARRFDHGRELAAHWAAHTDVKPFKCPRCERDFNAP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 ALLERHKLTHDLQGPGAPPAQAWAAGPGAGPETAGEGTAAEAGDAPLASDRRLLLGPAGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 ALLERHKLTHDLQGPGAPPAQAWAAGPGAGPETAGEGTAAEAGDAPLASDRRLLLGPAGG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 GVPKLGGLLPEGGGEAPAPAAAAEPSEDTLYQCDCGTFFASAAALASHLEAHSGPATYGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GVPKLGGLLPEGGGEAPAPAAAAEPSEDTLYQCDCGTFFASAAALASHLEAHSGPATYGC
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 GHCGALYAALAALEEHRRVSHGEGGGEEAAAAAREREPASGEPPSGSGRGKKIFGCSECE
::::::::::::::::::::::::::::::.:::::::::::::::::::::::::::::
CCDS12 GHCGALYAALAALEEHRRVSHGEGGGEEAATAAREREPASGEPPSGSGRGKKIFGCSECE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 KLFRSPRDLERHVLVHTGEKPFPCLECGKFFRHECYLKRHRLLHGTERPFPCHICGKGFI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 KLFRSPRDLERHVLVHTGEKPFPCLECGKFFRHECYLKRHRLLHGTERPFPCHICGKGFI
430 440 450 460 470 480
490
pF1KE4 TLSNLSRHLKLHRGMD
::::::::::::::::
CCDS12 TLSNLSRHLKLHRGMD
490
>>CCDS46170.1 ZNF845 gene_id:91664|Hs108|chr19 (970 aa)
initn: 1844 init1: 405 opt: 705 Z-score: 457.6 bits: 95.1 E(32554): 3.6e-19
Smith-Waterman score: 852; 31.7% identity (53.5% similar) in 477 aa overlap (22-494:438-883)
10 20 30 40 50
pF1KE4 MDDVPAPTPAPAPPAAAAPRVPFHCSECGKSFRYRSDLRRHFARHTALKPH
:..: :: ..: ..:.:.:: ::. ::.
CCDS46 EKPYKCNDCGKTFSQMSSLVYHRRLHTGEKPYKCEECDEAFSFKSNLERHRRIHTGEKPY
410 420 430 440 450 460
60 70 80 90 100 110
pF1KE4 ACPRCGKGFKHSFNLANHLRSHTGERPYRCSACPKGFRDSTGLLHHQVVHTGEKPYCCLV
: ::: :... .:. : : ::::.::.: : ..: ...: .:...::::: : :
CCDS46 KCNDCGKTFSQTSSLVYHRRLHTGEKPYKCEECDEAFSFKSNLERHRIIHTGEKLYKCNE
470 480 490 500 510 520
120 130 140 150 160
pF1KE4 CELRFSSRSSLGRHLKRQHRGVLPSPLQP-GPGLPALSAPC--SVCCNVGPCSVCGGSGA
: :: .::: :: : : : : . : .. . :: .. ..: :.
CCDS46 CGKTFSRKSSLTRHC-RLHTGEKPYQCNECGKAFRGQSALIYHQAIHGIGKLYKCNDCH-
530 540 550 560 570 580
170 180 190 200 210 220
pF1KE4 GGGEGPEGAGAGLGSWGLAEAAAAAAASLPPFACGACARRFDHGRELAAHWAAHTDVKPF
. .: . . : . . . . :. :.. : : ::.:: .:. ::.
CCDS46 ---QVFSNATTIANHWRIHNEERS-------YKCNRCGKFFRHRSYLAVHWRTHSGEKPY
590 600 610 620 630
230 240 250 260 270 280
pF1KE4 KCPRCERDFNAPALLERHKLTHDLQGPGAPPAQAWAAGPGAGPETAGEGTAAEAGDAPLA
:: .:.. :. . :.::. : : : .: . . . :.
CCDS46 KCEECDEAFSFKSNLQRHRRIHT----------------GEKPYRCNECGKTFSRKSYLT
640 650 660 670
290 300 310 320 330 340
pF1KE4 SDRRLLLGPAGGGVPKLGGLLPEGGGEAPAPAAAAEPSEDTLYQCD-CGTFFASAAALAS
::: : . : . : . : : . .: :.:. :: :.. ..:.
CCDS46 CHRRLHTGEKPYKCNECGKTF--GRNSALIIHKAIHTGEKP-YKCNECGKAFSQKSSLTC
680 690 700 710 720 730
350 360 370 380 390 400
pF1KE4 HLEAHSGPATYGCGHCGALYAALAALEEHRRVSHGEGGGEEAAAAAREREPASGEPPSGS
::. :.: : : .: ... ..::.:::. :: . . . . .
CCDS46 HLRLHTGEKPYKCEECDKVFSRKSSLEKHRRIHTGEKPYKCKVCDKAFGRDSHLAQHTRI
740 750 760 770 780 790
410 420 430 440 450 460
pF1KE4 GRGKKIFGCSECEKLFRSPRDLERHVLVHTGEKPFPCLECGKFFRHECYLKRHRLLHGTE
:.: . :.:: : :: : : .:.::::. : :::: :::. :. :. .: :
CCDS46 HTGEKPYKCNECGKNFRHNSALVIHKAIHSGEKPYKCNECGKTFRHNSALEIHKAIHTGE
800 810 820 830 840 850
470 480 490
pF1KE4 RPFPCHICGKGFITLSNLSRHLKLHRGMD
.:. : ::: : .::::: .:: :
CCDS46 KPYKCSECGKVFNRKANLSRHHRLHTGEKPYKCNKCGKVFNQQAHLACHHRIHTGEKPYK
860 870 880 890 900 910
>>CCDS46162.1 ZNF836 gene_id:162962|Hs108|chr19 (936 aa)
initn: 1067 init1: 379 opt: 680 Z-score: 442.1 bits: 92.2 E(32554): 2.7e-18
Smith-Waterman score: 859; 32.3% identity (50.5% similar) in 507 aa overlap (22-494:357-830)
10 20 30 40 50
pF1KE4 MDDVPAPTPAPAPPAAAAPRVPFHCSECGKSFRYRSDLRRHFARHTALKPH
:..:. ::: :: :.: : ::. ::.
CCDS46 EKPYKCNECGKTFKQGSCLTTHQIIHTGEKPYQCDICGKVFRQNSNLVNHQRIHTGEKPY
330 340 350 360 370 380
60 70 80 90 100 110
pF1KE4 ACPRCGKGFKHSFNLANHLRSHTGERPYRCSACPKGFRDSTGLLHHQVVHTGEKPYCCLV
: :::.:..: :::.: :.:..::.:. : : :. :..: ::..::::::: : :
CCDS46 KCNICGKSFSQSSNLATHQTVHSGNKPYKCDECGKTFKRSSSLTTHQIIHTGEKPYTCDV
390 400 410 420 430 440
120 130 140 150 160
pF1KE4 CELRFSSRSSLGRHLKRQHRGVLPSPLQPGPGLPALSAPCSVCCNV--GPCSVCGGSGAG
:. ::.::.:.:: .:.: : : :. : .: . :
CCDS46 CDKVFSQRSQLARH-QRSHTGEKPYK-------------CNECGKVFSQTSHLVGHRRIH
450 460 470 480 490
170 180 190 200 210 220
pF1KE4 GGEGP---EGAGAGLGSWGLAEAAAAAAASLPPFACGACARRFDHGRELAAHWAAHTDVK
:: : . : .. . .: . . :: :.. :... :. : :: .
CCDS46 TGEKPYKCDKCGKAFKQGSLLTRHKIIHTREKRYQCGECGKVFSENSCLVRHLRIHTGEQ
500 510 520 530 540 550
230 240 250 260 270 280
pF1KE4 PFKCPRCERDFNAPALLERHKLTHDLQGPGAPPAQAWAAGPGAGPETAGEGTAAEAGDAP
:.:: : . :: . : :: : : : : : .. . .
CCDS46 PYKCNVCGKVFNYSGNLSIHKRIHT----GEKPFQCNECG------------TVFRNYSC
560 570 580 590
290 300 310 320 330 340
pF1KE4 LASDRRLLLGPAGGGVPKLGGLLPEGGGEAPAPAAAAEPSEDTLYQCD-CGTFFASAAAL
:: :. : : .. ..:. . . . .::. :: :. . :
CCDS46 LARHLRIHTGQKPYKCNVCGKVFNDSGNLSNHKRIH---TGEKPFQCNECGKVFSYYSCL
600 610 620 630 640 650
350 360 370 380 390
pF1KE4 ASHLEAHSGPATYGCGHCGALYAALAALEEHRRVSHGEG-------GGE--EAAAAARER
: : . :.: : :. :: :. ..: .: . :: :: ... :: .
CCDS46 ARHRKIHTGEKPYKCNDCGKAYTQRSSLTKHLIIHTGEKPYNCNEFGGAFIQSSKLARYH
660 670 680 690 700 710
400 410 420 430
pF1KE4 EPASGEPP---SGSGR----------------GKKIFGCSECEKLFRSPRDLERHVLVHT
. .:: : : :: :. . : :: ..: : .: :: .::
CCDS46 RNPTGEKPHKCSHCGRTFSHITGLTYHQRRHTGEMPYKCIECGQVFNSTSNLARHRRIHT
720 730 740 750 760 770
440 450 460 470 480 490
pF1KE4 GEKPFPCLECGKFFRHECYLKRHRLLHGTERPFPCHICGKGFITLSNLSRHLKLHRGMD
::::. : :::: :::. : ::: .: :.:. :. :::.: . : : : :.: :
CCDS46 GEKPYKCNECGKVFRHQSTLARHRSIHTGEKPYVCNECGKAFRVRSILVNHQKMHTGDKP
780 790 800 810 820 830
CCDS46 YKCNECGKAFIERSKLVYHQRNHTGEKPYKCIECGKAFGRFSCLNKHQMIHSGEKPYKCN
840 850 860 870 880 890
>>CCDS74350.1 ZNF850 gene_id:342892|Hs108|chr19 (1058 aa)
initn: 1019 init1: 405 opt: 660 Z-score: 429.0 bits: 90.0 E(32554): 1.4e-17
Smith-Waterman score: 792; 30.8% identity (51.8% similar) in 496 aa overlap (22-494:360-833)
10 20 30 40 50
pF1KE4 MDDVPAPTPAPAPPAAAAPRVPFHCSECGKSFRYRSDLRRHFARHTALKPH
:. :.:::::: .:: : : : ::. ::.
CCDS74 EKPYDCKECGKSFTFHSALIRHQRIHTGEKPYDCKECGKSFTFRSGLIGHQAIHTGEKPY
330 340 350 360 370 380
60 70 80 90 100 110
pF1KE4 ACPRCGKGFKHSFNLANHLRSHTGERPYRCSACPKGFRDSTGLLHHQVVHTGEKPYCCLV
: .:::.: . .: .: : ::::.:: :. : :.: ....::.:: .:::::::::
CCDS74 DCKECGKSFTAGSTLIQHQRIHTGEKPYDCKECGKSFASGSALLQHQRIHTGEKPYCCKE
390 400 410 420 430 440
120 130 140 150 160
pF1KE4 CELRFSSRSSLGRHLKRQHRGVLPSPLQP-GPGLPALSAPCS---VCCNVGP--CSVCGG
: :. ::. .:: .: : : : . : .. . :: . . . : :. ::
CCDS74 CGKSFTFRSTRNRH-QRIHTGEKPYNCKECGKSFASGSALLQHQRIHTGEKPYHCKECGK
450 460 470 480 490 500
170 180 190 200 210
pF1KE4 S-----GAGG------GEGP---EGAGAGLGSWGLAEAAAAAAASLPPFACGACARRFDH
: : : :: : . : .. : . .. :. : :.. :
CCDS74 SFTFRSGLIGHQAVHTGEKPYDCKECGKSFTSRSALIQHQRIHTGEKPYHCKECGKSFTV
510 520 530 540 550 560
220 230 240 250 260 270
pF1KE4 GRELAAHWAAHTDVKPFKCPRCERDFNAPALLERHKLTHDLQGPGAPPAQAWAAGPGAGP
: : : :: ::. : .: . : : .:. : : : :
CCDS74 GSTLLQHQQIHTGEKPYDCKECGKAFRLRLRLTQHQQIHT----GEKPYQC---------
570 580 590 600 610
280 290 300 310 320
pF1KE4 ETAGEGTAAEAGDAPLASDRRLLLGPAGGGVPKLGGLLPEGG--GEAPAPAAAAEPSEDT
. :.. .. .: :.. .:. : : : . . .. .. .:
CCDS74 QECGKAFVSVSG---LTQHHRIHTGEKPYECPDCGKAFRQRTYLNQHRRIHTGEKP----
620 630 640 650 660
330 340 350 360 370 380
pF1KE4 LYQC-DCGTFFASAAALASHLEAHSGPATYGCGHCGALYAALAALEEHRRVSHGEGGGEE
:.: .:: :. ..: .: . :. : .:: ... ..: .:... :: .
CCDS74 -YECKECGKSFTFCSGLIQHQQNHTDEKPYDGKECGKSFTSHSTLIQHQQIHTGEKPYDC
670 680 690 700 710 720
390 400 410 420 430 440
pF1KE4 AAAAAREREPASGEPPSGSGRGKKIFGCSECEKLFRSPRDLERHVLVHTGEKPFPCLECG
. .. . :.:.. :.:: : : : : .: .::::::. : :::
CCDS74 KECGKSFTSHSTLIQHQQIHTGEKLYDCKECGKSFTSHSTLIQHQPLHTGEKPYHCKECG
730 740 750 760 770 780
450 460 470 480 490
pF1KE4 KFFRHECYLKRHRLLHGTERPFPCHICGKGFITLSNLSRHLKLHRGMD
: : . : .:: .: :. . :. :::.: . :.: .: ..: :
CCDS74 KSFTLRSALIQHRPVHTGEKRYSCKECGKSFTSRSTLIEHQRIHTGEKPYHCKECGKSFA
790 800 810 820 830 840
CCDS74 FRSAIIQHRRIHTGEKPYDCKECGKAFRRRSKLTQHQRIHTGEKPYRCHECGKAFVRFSG
850 860 870 880 890 900
>>CCDS59379.1 ZNF850 gene_id:342892|Hs108|chr19 (1090 aa)
initn: 1019 init1: 405 opt: 660 Z-score: 428.8 bits: 90.0 E(32554): 1.4e-17
Smith-Waterman score: 792; 30.8% identity (51.8% similar) in 496 aa overlap (22-494:392-865)
10 20 30 40 50
pF1KE4 MDDVPAPTPAPAPPAAAAPRVPFHCSECGKSFRYRSDLRRHFARHTALKPH
:. :.:::::: .:: : : : ::. ::.
CCDS59 EKPYDCKECGKSFTFHSALIRHQRIHTGEKPYDCKECGKSFTFRSGLIGHQAIHTGEKPY
370 380 390 400 410 420
60 70 80 90 100 110
pF1KE4 ACPRCGKGFKHSFNLANHLRSHTGERPYRCSACPKGFRDSTGLLHHQVVHTGEKPYCCLV
: .:::.: . .: .: : ::::.:: :. : :.: ....::.:: .:::::::::
CCDS59 DCKECGKSFTAGSTLIQHQRIHTGEKPYDCKECGKSFASGSALLQHQRIHTGEKPYCCKE
430 440 450 460 470 480
120 130 140 150 160
pF1KE4 CELRFSSRSSLGRHLKRQHRGVLPSPLQP-GPGLPALSAPCS---VCCNVGP--CSVCGG
: :. ::. .:: .: : : : . : .. . :: . . . : :. ::
CCDS59 CGKSFTFRSTRNRH-QRIHTGEKPYNCKECGKSFASGSALLQHQRIHTGEKPYHCKECGK
490 500 510 520 530 540
170 180 190 200 210
pF1KE4 S-----GAGG------GEGP---EGAGAGLGSWGLAEAAAAAAASLPPFACGACARRFDH
: : : :: : . : .. : . .. :. : :.. :
CCDS59 SFTFRSGLIGHQAVHTGEKPYDCKECGKSFTSRSALIQHQRIHTGEKPYHCKECGKSFTV
550 560 570 580 590 600
220 230 240 250 260 270
pF1KE4 GRELAAHWAAHTDVKPFKCPRCERDFNAPALLERHKLTHDLQGPGAPPAQAWAAGPGAGP
: : : :: ::. : .: . : : .:. : : : :
CCDS59 GSTLLQHQQIHTGEKPYDCKECGKAFRLRLRLTQHQQIHT----GEKPYQC---------
610 620 630 640
280 290 300 310 320
pF1KE4 ETAGEGTAAEAGDAPLASDRRLLLGPAGGGVPKLGGLLPEGG--GEAPAPAAAAEPSEDT
. :.. .. .: :.. .:. : : : . . .. .. .:
CCDS59 QECGKAFVSVSG---LTQHHRIHTGEKPYECPDCGKAFRQRTYLNQHRRIHTGEKP----
650 660 670 680 690 700
330 340 350 360 370 380
pF1KE4 LYQC-DCGTFFASAAALASHLEAHSGPATYGCGHCGALYAALAALEEHRRVSHGEGGGEE
:.: .:: :. ..: .: . :. : .:: ... ..: .:... :: .
CCDS59 -YECKECGKSFTFCSGLIQHQQNHTDEKPYDGKECGKSFTSHSTLIQHQQIHTGEKPYDC
710 720 730 740 750
390 400 410 420 430 440
pF1KE4 AAAAAREREPASGEPPSGSGRGKKIFGCSECEKLFRSPRDLERHVLVHTGEKPFPCLECG
. .. . :.:.. :.:: : : : : .: .::::::. : :::
CCDS59 KECGKSFTSHSTLIQHQQIHTGEKLYDCKECGKSFTSHSTLIQHQPLHTGEKPYHCKECG
760 770 780 790 800 810
450 460 470 480 490
pF1KE4 KFFRHECYLKRHRLLHGTERPFPCHICGKGFITLSNLSRHLKLHRGMD
: : . : .:: .: :. . :. :::.: . :.: .: ..: :
CCDS59 KSFTLRSALIQHRPVHTGEKRYSCKECGKSFTSRSTLIEHQRIHTGEKPYHCKECGKSFA
820 830 840 850 860 870
CCDS59 FRSAIIQHRRIHTGEKPYDCKECGKAFRRRSKLTQHQRIHTGEKPYRCHECGKAFVRFSG
880 890 900 910 920 930
>>CCDS82391.1 ZNF160 gene_id:90338|Hs108|chr19 (782 aa)
initn: 728 init1: 372 opt: 657 Z-score: 428.4 bits: 89.4 E(32554): 1.5e-17
Smith-Waterman score: 820; 30.4% identity (50.9% similar) in 503 aa overlap (25-494:251-749)
10 20 30 40 50
pF1KE4 MDDVPAPTPAPAPPAAAAPRVPFHCSECGKSFRYRSDLRRHFARHTALKPHACP
::::::.: ::.: : . ::. ::. :
CCDS82 YKCNECGKAFTQNSNLTSHRRIHSGEKPYKCSECGKTFTVRSNLTIHQVIHTGEKPYKCH
230 240 250 260 270 280
60 70 80 90 100 110
pF1KE4 RCGKGFKHSFNLANHLRSHTGERPYRCSACPKGFRDSTGLLHHQVVHTGEKPYCCLVCEL
.::: :.:. ::.: : ::::.::.:. : :.:: ..: ::..::::::. : :
CCDS82 ECGKVFRHNSYLATHRRIHTGEKPYKCNECGKAFRGHSNLTTHQLIHTGEKPFKCNECGK
290 300 310 320 330 340
120 130 140 150 160
pF1KE4 RFSSRSSLGRHLKRQHRGVLPSPLQP-GPGLP---ALSAPCSVCCNVGP--CSVCG----
:.. : : : : : : : . : .. .:. .. . : :. ::
CCDS82 LFTQNSHLISHW-RIHTGEKPYKCNECGKAFSVRSSLAIHQTIHTGEKPYKCNECGKVFR
350 360 370 380 390
170 180 190 200 210
pF1KE4 -GSGAG------GGEGPEGAGAGLGSWGLAEAAAAAAA---SLPPFACGACARRFDHGRE
.: : :: : . .... :. . . :: :. :.. : .. .
CCDS82 YNSYLGRHRRVHTGEKPYKCNECGKAFSMHSNLATHQVIHTGTKPFKCNECSKVFTQNSQ
400 410 420 430 440 450
220 230 240 250 260
pF1KE4 LAAHWAAHTDVKPFKCPRCERDFNAPALLERHKLTHDLQGP------GAPPAQA------
:: : :: ::.:: .: . :.. . : :. :. . : : .:
CCDS82 LANHRRIHTGEKPYKCNECGKAFSVRSSLTTHQAIHSGEKPYKCIECGKSFTQKSHLRSH
460 470 480 490 500 510
270 280 290 300 310 320
pF1KE4 WAAGPGAGPETAGEGTAAEAGDAPLASDRRLLLGPAGGGVPKLGGLLPEGGGEAPAPAAA
. : : .: . : . :: :. : : . . ..
CCDS82 RGIHSGEKPYKCNECGKVFAQTSQLARHWRVHTGEKPYKCNDCGRAFSD---RSSLTFHQ
520 530 540 550 560 570
330 340 350 360 370 380
pF1KE4 AEPSEDTLYQC-DCGTFFASAAALASHLEAHSGPATYGCGHCGALYAALAALEEHRRVSH
: . . :.: .:: : . ::.: . :.: : :..:: .. . : :. .
CCDS82 AIHTGEKPYKCHECGKVFRHNSYLATHRRIHTGEKPYKCNECGKAFSMHSNLTTHKVIHT
580 590 600 610 620 630
390 400 410 420 430 440
pF1KE4 GEGGGEEAAAAAREREPASGEPPSGSGRGKKIFGCSECEKLFRSPRDLERHVLVHTGEKP
:: . . . . . . :.: . :.:: : : .: : .:::.::
CCDS82 GEKPYKCNQCGKVFTQNSHLANHQRTHTGEKPYRCNECGKAFSVRSSLTTHQAIHTGKKP
640 650 660 670 680 690
450 460 470 480 490
pF1KE4 FPCLECGKFFRHECYLKRHRLLHGTERPFPCHICGKGFITLSNLSRHLKLHRGMD
. : :::: : .. .: :: .: :.:. : :::.: . :.:. :. .: :
CCDS82 YKCNECGKVFTQNAHLANHRRIHTGEKPYRCTECGKAFRVRSSLTTHMAIHTGEKRYKCN
700 710 720 730 740 750
CCDS82 ECGKVFRQSSNLASHHRMHTGEKPYK
760 770 780
>>CCDS12859.1 ZNF160 gene_id:90338|Hs108|chr19 (818 aa)
initn: 728 init1: 372 opt: 657 Z-score: 428.2 bits: 89.4 E(32554): 1.6e-17
Smith-Waterman score: 820; 30.4% identity (50.9% similar) in 503 aa overlap (25-494:287-785)
10 20 30 40 50
pF1KE4 MDDVPAPTPAPAPPAAAAPRVPFHCSECGKSFRYRSDLRRHFARHTALKPHACP
::::::.: ::.: : . ::. ::. :
CCDS12 YKCNECGKAFTQNSNLTSHRRIHSGEKPYKCSECGKTFTVRSNLTIHQVIHTGEKPYKCH
260 270 280 290 300 310
60 70 80 90 100 110
pF1KE4 RCGKGFKHSFNLANHLRSHTGERPYRCSACPKGFRDSTGLLHHQVVHTGEKPYCCLVCEL
.::: :.:. ::.: : ::::.::.:. : :.:: ..: ::..::::::. : :
CCDS12 ECGKVFRHNSYLATHRRIHTGEKPYKCNECGKAFRGHSNLTTHQLIHTGEKPFKCNECGK
320 330 340 350 360 370
120 130 140 150 160
pF1KE4 RFSSRSSLGRHLKRQHRGVLPSPLQP-GPGLP---ALSAPCSVCCNVGP--CSVCG----
:.. : : : : : : : . : .. .:. .. . : :. ::
CCDS12 LFTQNSHLISHW-RIHTGEKPYKCNECGKAFSVRSSLAIHQTIHTGEKPYKCNECGKVFR
380 390 400 410 420 430
170 180 190 200 210
pF1KE4 -GSGAG------GGEGPEGAGAGLGSWGLAEAAAAAAA---SLPPFACGACARRFDHGRE
.: : :: : . .... :. . . :: :. :.. : .. .
CCDS12 YNSYLGRHRRVHTGEKPYKCNECGKAFSMHSNLATHQVIHTGTKPFKCNECSKVFTQNSQ
440 450 460 470 480 490
220 230 240 250 260
pF1KE4 LAAHWAAHTDVKPFKCPRCERDFNAPALLERHKLTHDLQGP------GAPPAQA------
:: : :: ::.:: .: . :.. . : :. :. . : : .:
CCDS12 LANHRRIHTGEKPYKCNECGKAFSVRSSLTTHQAIHSGEKPYKCIECGKSFTQKSHLRSH
500 510 520 530 540 550
270 280 290 300 310 320
pF1KE4 WAAGPGAGPETAGEGTAAEAGDAPLASDRRLLLGPAGGGVPKLGGLLPEGGGEAPAPAAA
. : : .: . : . :: :. : : . . ..
CCDS12 RGIHSGEKPYKCNECGKVFAQTSQLARHWRVHTGEKPYKCNDCGRAFSD---RSSLTFHQ
560 570 580 590 600 610
330 340 350 360 370 380
pF1KE4 AEPSEDTLYQC-DCGTFFASAAALASHLEAHSGPATYGCGHCGALYAALAALEEHRRVSH
: . . :.: .:: : . ::.: . :.: : :..:: .. . : :. .
CCDS12 AIHTGEKPYKCHECGKVFRHNSYLATHRRIHTGEKPYKCNECGKAFSMHSNLTTHKVIHT
620 630 640 650 660 670
390 400 410 420 430 440
pF1KE4 GEGGGEEAAAAAREREPASGEPPSGSGRGKKIFGCSECEKLFRSPRDLERHVLVHTGEKP
:: . . . . . . :.: . :.:: : : .: : .:::.::
CCDS12 GEKPYKCNQCGKVFTQNSHLANHQRTHTGEKPYRCNECGKAFSVRSSLTTHQAIHTGKKP
680 690 700 710 720 730
450 460 470 480 490
pF1KE4 FPCLECGKFFRHECYLKRHRLLHGTERPFPCHICGKGFITLSNLSRHLKLHRGMD
. : :::: : .. .: :: .: :.:. : :::.: . :.:. :. .: :
CCDS12 YKCNECGKVFTQNAHLANHRRIHTGEKPYRCTECGKAFRVRSSLTTHMAIHTGEKRYKCN
740 750 760 770 780 790
CCDS12 ECGKVFRQSSNLASHHRMHTGEKPYK
800 810
>>CCDS62706.1 ZNF229 gene_id:7772|Hs108|chr19 (819 aa)
initn: 463 init1: 463 opt: 642 Z-score: 418.8 bits: 87.7 E(32554): 5.2e-17
Smith-Waterman score: 804; 32.0% identity (51.3% similar) in 487 aa overlap (14-494:334-758)
10 20 30 40
pF1KE4 MDDVPAPTPAPAPPAAAAPRVPFHCSECGKSFRYRSDLRRHFA
: : . .:..:. :::.:::.: : : .
CCDS62 RHQRVPTGEKSVKSLERGRGVRQNTHIRNHPRAPVGDMPYRCDVCGKGFRYKSVLLIHQG
310 320 330 340 350 360
50 60 70 80 90 100
pF1KE4 RHTALKPHACPRCGKGFKHSFNLANHLRSHTGERPYRCSACPKGFRDSTGLLHHQVVHTG
::. .:. : .:::.: .: :: : : ::::.::.:: : ::: :. : :: .:::
CCDS62 VHTGRRPYKCEECGKAFGRSSNLLVHQRVHTGEKPYKCSECGKGFSYSSVLQVHQRLHTG
370 380 390 400 410 420
110 120 130 140 150 160
pF1KE4 EKPYCCLVCELRFSSRSSLGRHLKRQHRGVLPSPLQPGPGLPALSAPCSVCCNVGPCS--
:::: : : : ..:.: .: :: ..:: : :. : . ::
CCDS62 EKPYTCSECGKGFCAKSALHKH---QH-------IHPGEK-PY---SCGECGKGFSCSSH
430 440 450 460
170 180 190 200 210
pF1KE4 VCGGSGAGGGEGP---EGAGAGLGSWGLAEAAAAAAASLPPFACGACARRFDHGRELAAH
. . . . :: : . : :.. . .: . . . :..:.. :... : :
CCDS62 LSSHQKTHTGERPYQCDKCGKGFSHNSYLQAHQRVHMGQHLYKCNVCGKSFSYSSGLLMH
470 480 490 500 510 520
220 230 240 250 260 270
pF1KE4 WAAHTDVKPFKCPRCERDFNAPALLERHKLTHDLQGPGAPPAQAWAAGPGAGPETAGEGT
:: ::.:: .: ..:. . :. :. .: : : . : :
CCDS62 QRLHTGEKPYKC-ECGKSFGRSSDLHIHQRVHT----GEKPYKCSECGKGF---------
530 540 550 560 570
280 290 300 310 320 330
pF1KE4 AAEAGDAPLASDRRLLLGPAGGGVPKLGGLLPEGGGEAPAPAAAAEPSEDTLYQCD-CGT
.. : : .:. : : : : :: ::
CCDS62 ---RRNSDLHSHQRVHTG------------------ERP-------------YVCDVCGK
580 590 600
340 350 360 370 380 390
pF1KE4 FFASAAALASHLEAHSGPATYGCGHCGALYAALAALEEHRRVSHGEGGGEEAAAAARERE
: .. : : ..:.: : :..:: .. ..: :.:: :: . . :
CCDS62 GFIYSSDLLIHQRVHTGEKPYKCAECGKGFSYSSGLLIHQRVHTGEKPYRCQECGKGFRC
610 620 630 640 650 660
400 410 420 430 440 450
pF1KE4 PASGEPPSGSGRGKKIFGCSECEKLFRSPRDLERHVLVHTGEKPFPCLECGKFFRHECYL
.: . . ::: . :..: : : .:. : .::::::. : :::: ::. :
CCDS62 TSSLHKHQRVHTGKKPYTCDQCGKGFSYGSNLRTHQRLHTGEKPYTCCECGKGFRYGSGL
670 680 690 700 710 720
460 470 480 490
pF1KE4 KRHRLLHGTERPFPCHICGKGFITLSNLSRHLKLHRGMD
:. .: :.:. ::.::::. :.:. : ..: :
CCDS62 LSHKRVHTGEKPYRCHVCGKGYSQSSHLQGHQRVHTGEKPYKCEECGKGFGRNSCLHVHQ
730 740 750 760 770 780
CCDS62 RVHTGEKPYTCGVCGKGFSYTSGLRNHQRVHLGENPYK
790 800 810
>>CCDS42574.1 ZNF229 gene_id:7772|Hs108|chr19 (825 aa)
initn: 463 init1: 463 opt: 642 Z-score: 418.8 bits: 87.7 E(32554): 5.2e-17
Smith-Waterman score: 804; 32.0% identity (51.3% similar) in 487 aa overlap (14-494:340-764)
10 20 30 40
pF1KE4 MDDVPAPTPAPAPPAAAAPRVPFHCSECGKSFRYRSDLRRHFA
: : . .:..:. :::.:::.: : : .
CCDS42 RHQRVPTGEKSVKSLERGRGVRQNTHIRNHPRAPVGDMPYRCDVCGKGFRYKSVLLIHQG
310 320 330 340 350 360
50 60 70 80 90 100
pF1KE4 RHTALKPHACPRCGKGFKHSFNLANHLRSHTGERPYRCSACPKGFRDSTGLLHHQVVHTG
::. .:. : .:::.: .: :: : : ::::.::.:: : ::: :. : :: .:::
CCDS42 VHTGRRPYKCEECGKAFGRSSNLLVHQRVHTGEKPYKCSECGKGFSYSSVLQVHQRLHTG
370 380 390 400 410 420
110 120 130 140 150 160
pF1KE4 EKPYCCLVCELRFSSRSSLGRHLKRQHRGVLPSPLQPGPGLPALSAPCSVCCNVGPCS--
:::: : : : ..:.: .: :: ..:: : :. : . ::
CCDS42 EKPYTCSECGKGFCAKSALHKH---QH-------IHPGEK-PY---SCGECGKGFSCSSH
430 440 450 460 470
170 180 190 200 210
pF1KE4 VCGGSGAGGGEGP---EGAGAGLGSWGLAEAAAAAAASLPPFACGACARRFDHGRELAAH
. . . . :: : . : :.. . .: . . . :..:.. :... : :
CCDS42 LSSHQKTHTGERPYQCDKCGKGFSHNSYLQAHQRVHMGQHLYKCNVCGKSFSYSSGLLMH
480 490 500 510 520 530
220 230 240 250 260 270
pF1KE4 WAAHTDVKPFKCPRCERDFNAPALLERHKLTHDLQGPGAPPAQAWAAGPGAGPETAGEGT
:: ::.:: .: ..:. . :. :. .: : : . : :
CCDS42 QRLHTGEKPYKC-ECGKSFGRSSDLHIHQRVHT----GEKPYKCSECGKGF---------
540 550 560 570 580
280 290 300 310 320 330
pF1KE4 AAEAGDAPLASDRRLLLGPAGGGVPKLGGLLPEGGGEAPAPAAAAEPSEDTLYQCD-CGT
.. : : .:. : : : : :: ::
CCDS42 ---RRNSDLHSHQRVHTG------------------ERP-------------YVCDVCGK
590 600
340 350 360 370 380 390
pF1KE4 FFASAAALASHLEAHSGPATYGCGHCGALYAALAALEEHRRVSHGEGGGEEAAAAARERE
: .. : : ..:.: : :..:: .. ..: :.:: :: . . :
CCDS42 GFIYSSDLLIHQRVHTGEKPYKCAECGKGFSYSSGLLIHQRVHTGEKPYRCQECGKGFRC
610 620 630 640 650 660
400 410 420 430 440 450
pF1KE4 PASGEPPSGSGRGKKIFGCSECEKLFRSPRDLERHVLVHTGEKPFPCLECGKFFRHECYL
.: . . ::: . :..: : : .:. : .::::::. : :::: ::. :
CCDS42 TSSLHKHQRVHTGKKPYTCDQCGKGFSYGSNLRTHQRLHTGEKPYTCCECGKGFRYGSGL
670 680 690 700 710 720
460 470 480 490
pF1KE4 KRHRLLHGTERPFPCHICGKGFITLSNLSRHLKLHRGMD
:. .: :.:. ::.::::. :.:. : ..: :
CCDS42 LSHKRVHTGEKPYRCHVCGKGYSQSSHLQGHQRVHTGEKPYKCEECGKGFGRNSCLHVHQ
730 740 750 760 770 780
CCDS42 RVHTGEKPYTCGVCGKGFSYTSGLRNHQRVHLGENPYK
790 800 810 820
>>CCDS33122.1 ZNF470 gene_id:388566|Hs108|chr19 (717 aa)
initn: 1911 init1: 384 opt: 631 Z-score: 412.5 bits: 86.4 E(32554): 1.2e-16
Smith-Waterman score: 778; 30.8% identity (52.1% similar) in 480 aa overlap (22-494:255-701)
10 20 30 40 50
pF1KE4 MDDVPAPTPAPAPPAAAAPRVPFHCSECGKSFRYRSDLRRHFARHTALKPH
:..: ::::.: . : .: ::. ::
CCDS33 KKLLKCNDCEKIFSKISTLTLHQRIHTGEKPYECIECGKAFSQSAHLAQHQRIHTGEKPF
230 240 250 260 270 280
60 70 80 90 100 110
pF1KE4 ACPRCGKGFKHSFNLANHLRSHTGERPYRCSACPKGFRDSTGLLHHQVVHTGEKPYCCLV
: .:::.:... .:..: : ::::.::.:. : :.: . . : .:: :::::::: :.
CCDS33 ECTECGKAFSQNAHLVQHQRVHTGEKPYQCKQCNKAFSQLAHLAQHQRVHTGEKPYECIE
290 300 310 320 330 340
120 130 140 150 160 170
pF1KE4 CELRFSSRSSLGRHLKRQHRGVLPSPLQPGPGLPALSAPCSVCCNVGPCSVCGGSGAGGG
: ::. :::..: .: : : : :. . . :
CCDS33 CGKAFSDCSSLAHH-RRIHTGKRPYE----------CIDCGKAFRQNASLIRHRRYYHTG
350 360 370 380 390
180 190 200 210 220
pF1KE4 EGP----EGAGAGLGSWGLAEAAAAAAASLPPFACGACARRFDHGRELAAHWAAHTDVKP
: : . . : :: . . .. : . :..:.. :.:: :..: :: ::
CCDS33 EKPFDCIDCGKAFTDHIGLIQHKRTHTGERP-YKCNVCGKAFSHGSSLTVHQRIHTGEKP
400 410 420 430 440 450
230 240 250 260 270 280
pF1KE4 FKCPRCERDFNAPALLERHKLTHDLQGPGAPPAQAWAAGPGAGPETAGEGTAAEAGDAPL
..: ::. :. . : :. .: : : : : .. :
CCDS33 YECNICEKAFSHRGSLTLHQRVHT----------------GEKPYECKECGKAFRQSTHL
460 470 480 490
290 300 310 320 330 340
pF1KE4 ASDRRLLLGPAGGGVPKLGGLLPEGGGEAPAPAAAAEPSEDTLYQC-DCGTFFASAAALA
: .:. : . . . ... : . . :.: .:: :.. : :.
CCDS33 AHHQRIHTGEKPYECKECSKTFSQNAHLAQHQKI---HTGEKPYECKECGKAFSQIAHLV
500 510 520 530 540 550
350 360 370 380 390 400
pF1KE4 SHLEAHSGPATYGCGHCGALYAALAALEEHRRVSHGEGGGE--EAAAAAREREPASGEPP
.: ..:.: : : .:: .. . : .:.:. :. : : . : :.: ::
CCDS33 QHQRVHTGEKPYECIECGKAFSDGSYLVQHQRLHSGKRPYECLECGKAFRQR--ASLICH
560 570 580 590 600 610
410 420 430 440 450 460
pF1KE4 SGSGRGKKIFGCSECEKLFRSPRDLERHVLVHTGEKPFPCLECGKFFRHECYLKRHRLLH
. :.: . :. : : : ..: : .::::::. : ::.: : . .: :. .:
CCDS33 QRCHTGEKPYECNVCGKAFSHRKSLTLHQRIHTGEKPYECKECSKAFSQVAHLTLHKRIH
620 630 640 650 660 670
470 480 490
pF1KE4 GTERPFPCHICGKGFITLSNLSRHLKLHRGMD
:::. :. :::.: .:..: ..: :
CCDS33 TGERPYECKECGKAFRQSVHLAHHQRIHTGESSVILSSALPYHQVL
680 690 700 710
496 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 22:41:37 2016 done: Sat Nov 5 22:41:38 2016
Total Scan time: 3.330 Total Display time: 0.100
Function used was FASTA [36.3.4 Apr, 2011]