FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1388, 582 aa
1>>>pF1KSDA1388 582 - 582 aa - 582 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.0771+/-0.00104; mu= 4.7471+/- 0.063
mean_var=306.4331+/-60.358, 0's: 0 Z-trim(115.2): 915 B-trim: 0 in 0/51
Lambda= 0.073267
statistics sampled from 14796 (15787) to 14796 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.77), E-opt: 0.2 (0.485), width: 16
Scan time: 4.110
The best scores are: opt bits E(32554)
CCDS32462.1 ZNF319 gene_id:57567|Hs108|chr16 ( 582) 4259 463.8 2.6e-130
CCDS59367.1 ZNF43 gene_id:7594|Hs108|chr19 ( 803) 1167 137.1 7.9e-32
CCDS12413.2 ZNF43 gene_id:7594|Hs108|chr19 ( 809) 1167 137.1 7.9e-32
CCDS74321.1 ZNF43 gene_id:7594|Hs108|chr19 ( 818) 1167 137.2 8e-32
CCDS74322.1 ZNF91 gene_id:7644|Hs108|chr19 (1159) 1167 137.3 1e-31
CCDS42541.1 ZNF91 gene_id:7644|Hs108|chr19 (1191) 1167 137.3 1e-31
CCDS12632.1 ZNF45 gene_id:7596|Hs108|chr19 ( 682) 1153 135.6 2e-31
CCDS33122.1 ZNF470 gene_id:388566|Hs108|chr19 ( 717) 1123 132.4 1.8e-30
CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 1118 131.8 2.4e-30
CCDS46031.1 ZNF98 gene_id:148198|Hs108|chr19 ( 572) 1117 131.7 2.5e-30
CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 1118 131.9 2.5e-30
CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 1118 131.9 2.5e-30
CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 1118 131.9 2.6e-30
CCDS46167.1 ZNF808 gene_id:388558|Hs108|chr19 ( 903) 1113 131.5 4.5e-30
CCDS46032.1 ZNF492 gene_id:57615|Hs108|chr19 ( 531) 1108 130.7 4.5e-30
CCDS11067.1 ZFP3 gene_id:124961|Hs108|chr17 ( 502) 1104 130.3 5.8e-30
CCDS82388.1 ZNF841 gene_id:284371|Hs108|chr19 ( 808) 1105 130.6 7.4e-30
CCDS46101.1 ZNF234 gene_id:10780|Hs108|chr19 ( 700) 1103 130.3 7.8e-30
CCDS46161.1 ZNF841 gene_id:284371|Hs108|chr19 ( 924) 1105 130.7 8.1e-30
CCDS32973.1 ZNF93 gene_id:81931|Hs108|chr19 ( 620) 1100 129.9 9e-30
CCDS6354.1 ZNF572 gene_id:137209|Hs108|chr8 ( 529) 1098 129.7 9.4e-30
CCDS75846.1 ZNF658 gene_id:26149|Hs108|chr9 (1059) 1099 130.1 1.4e-29
CCDS54239.1 ZNF714 gene_id:148206|Hs108|chr19 ( 555) 1089 128.7 1.9e-29
CCDS12943.1 ZNF583 gene_id:147949|Hs108|chr19 ( 569) 1089 128.7 1.9e-29
CCDS46162.1 ZNF836 gene_id:162962|Hs108|chr19 ( 936) 1093 129.4 2e-29
CCDS62706.1 ZNF229 gene_id:7772|Hs108|chr19 ( 819) 1085 128.5 3.3e-29
CCDS42574.1 ZNF229 gene_id:7772|Hs108|chr19 ( 825) 1085 128.5 3.3e-29
CCDS31940.1 ZNF84 gene_id:7637|Hs108|chr12 ( 738) 1081 128.0 4.1e-29
CCDS12980.1 ZNF132 gene_id:7691|Hs108|chr19 ( 706) 1076 127.5 5.7e-29
CCDS12856.1 ZNF600 gene_id:162966|Hs108|chr19 ( 722) 1074 127.3 6.7e-29
CCDS6787.1 ZFP37 gene_id:7539|Hs108|chr9 ( 630) 1072 127.0 7.1e-29
CCDS65109.1 ZFP37 gene_id:7539|Hs108|chr9 ( 631) 1072 127.0 7.1e-29
CCDS65110.1 ZFP37 gene_id:7539|Hs108|chr9 ( 645) 1072 127.0 7.2e-29
CCDS54240.1 ZNF208 gene_id:7757|Hs108|chr19 (1280) 1078 128.0 7.3e-29
CCDS74388.1 ZNF227 gene_id:7770|Hs108|chr19 ( 748) 1072 127.1 7.9e-29
CCDS12636.1 ZNF227 gene_id:7770|Hs108|chr19 ( 799) 1072 127.1 8.3e-29
CCDS233.1 ZNF436 gene_id:80818|Hs108|chr1 ( 470) 1063 125.9 1.1e-28
CCDS46030.1 ZNF257 gene_id:113835|Hs108|chr19 ( 563) 1064 126.1 1.2e-28
CCDS33026.2 ZNF780A gene_id:284323|Hs108|chr19 ( 641) 1060 125.7 1.7e-28
CCDS46079.1 ZNF780A gene_id:284323|Hs108|chr19 ( 642) 1060 125.7 1.7e-28
CCDS82409.1 ZNF418 gene_id:147686|Hs108|chr19 ( 591) 1055 125.2 2.4e-28
CCDS33097.1 ZNF347 gene_id:84671|Hs108|chr19 ( 839) 1058 125.6 2.4e-28
CCDS54314.1 ZNF347 gene_id:84671|Hs108|chr19 ( 840) 1058 125.6 2.4e-28
CCDS42642.1 ZNF418 gene_id:147686|Hs108|chr19 ( 676) 1055 125.2 2.6e-28
CCDS82410.1 ZNF418 gene_id:147686|Hs108|chr19 ( 697) 1055 125.2 2.6e-28
CCDS12500.1 ZNF585B gene_id:92285|Hs108|chr19 ( 769) 1054 125.2 3e-28
CCDS59370.1 ZNF728 gene_id:388523|Hs108|chr19 ( 622) 1051 124.8 3.3e-28
CCDS6755.1 ZNF189 gene_id:7743|Hs108|chr9 ( 584) 1050 124.6 3.4e-28
CCDS65096.1 ZNF189 gene_id:7743|Hs108|chr9 ( 612) 1050 124.6 3.5e-28
CCDS6754.1 ZNF189 gene_id:7743|Hs108|chr9 ( 626) 1050 124.7 3.5e-28
>>CCDS32462.1 ZNF319 gene_id:57567|Hs108|chr16 (582 aa)
initn: 4259 init1: 4259 opt: 4259 Z-score: 2452.9 bits: 463.8 E(32554): 2.6e-130
Smith-Waterman score: 4259; 100.0% identity (100.0% similar) in 582 aa overlap (1-582:1-582)
10 20 30 40 50 60
pF1KSD MSESWQQPPQTQPQQPQPPQPQHHAEPPPALAEHTLPPGTAENPLGCAVYGILLQPDPGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MSESWQQPPQTQPQQPQPPQPQHHAEPPPALAEHTLPPGTAENPLGCAVYGILLQPDPGL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD QPPQHAPLQAAGEPGPKCGVCGHDLAHLSSPHEHQCLAGHDRSFQCTQCLKIFHQATDLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 QPPQHAPLQAAGEPGPKCGVCGHDLAHLSSPHEHQCLAGHDRSFQCTQCLKIFHQATDLL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD EHQCVQAEQKPFVCGVCKMGFSLLTSLAQHHSSHSGLVKCSICEKTYKPAEAAEPATTAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 EHQCVQAEQKPFVCGVCKMGFSLLTSLAQHHSSHSGLVKCSICEKTYKPAEAAEPATTAA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD PSLPAAPAPSTVTPAEQADKPYSCPICQKPFKHLSELSRHERIHTGEKPYKCTLCDKSFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 PSLPAAPAPSTVTPAEQADKPYSCPICQKPFKHLSELSRHERIHTGEKPYKCTLCDKSFS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD QSSHLVHHKRTHSSERPYKCAVCEKTFKHRSHLVRHMYAHSGEHHLFRCNVCELHFKESS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 QSSHLVHHKRTHSSERPYKCAVCEKTFKHRSHLVRHMYAHSGEHHLFRCNVCELHFKESS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD ELLQHPCTPSGERPFRCGECQKAFKRPSDLRQHERTHSAERPFKCDLCPMGFKQQYALMR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 ELLQHPCTPSGERPFRCGECQKAFKRPSDLRQHERTHSAERPFKCDLCPMGFKQQYALMR
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD HRRTHKTEEPFKCGLCEKGFGQPSHLLYHQHVHTLETLFKCPVCQKGFDQSAELLRHKCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 HRRTHKTEEPFKCGLCEKGFGQPSHLLYHQHVHTLETLFKCPVCQKGFDQSAELLRHKCL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD PGAAERPFKCPVCNKAYKRASALQKHQLAHCAAAEKPLRCTLCERRFFSSSEFVQHRCDP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 PGAAERPFKCPVCNKAYKRASALQKHQLAHCAAAEKPLRCTLCERRFFSSSEFVQHRCDP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD AREKPLKCPDCEKRFKYASDLQRHRRVHTGEKPYKCPNCDKAFKQREHLNKHQGVHAREQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 AREKPLKCPDCEKRFKYASDLQRHRRVHTGEKPYKCPNCDKAFKQREHLNKHQGVHAREQ
490 500 510 520 530 540
550 560 570 580
pF1KSD QFKCVWCGERFLDVALLQEHSAQHSAAAAAAEGAYQVAACLP
::::::::::::::::::::::::::::::::::::::::::
CCDS32 QFKCVWCGERFLDVALLQEHSAQHSAAAAAAEGAYQVAACLP
550 560 570 580
>>CCDS59367.1 ZNF43 gene_id:7594|Hs108|chr19 (803 aa)
initn: 1595 init1: 342 opt: 1167 Z-score: 684.9 bits: 137.1 E(32554): 7.9e-32
Smith-Waterman score: 1301; 36.8% identity (64.4% similar) in 508 aa overlap (72-565:276-779)
50 60 70 80 90 100
pF1KSD ENPLGCAVYGILLQPDPGLQPPQHAPLQAAGEPGPKCGVCGHDLAHLSSPHEHQCLAGHD
:: :: :.. . . :. ::. . .
CCDS59 YTRYKLYKCEECGKAFNKSSILTTHKIIRTGEKFYKCKECAKAFNQSSNLTEHKKIHPGE
250 260 270 280 290 300
110 120 130 140 150
pF1KSD RSFQCTQCLKIFHQATDLLEHQCVQAEQKPFVCGVCKMGFSLLTSLAQHHSSHSG--LVK
. ..: .: : :. . : .:. ... .::..: : .:. ...:. :. :.. . :
CCDS59 KPYKCEECGKAFNWPSTLTKHKRIHTGEKPYTCEECGKAFNQFSNLTTHKRIHTAEKFYK
310 320 330 340 350 360
160 170 180 190 200
pF1KSD CSICEKTY-KPAEAAEPATTAAPSLP--------AAPAPSTVTP---AEQADKPYSCPIC
:. : ... . .. .. . . : : : .: .. ..:::.: :
CCDS59 CTECGEAFSRSSNLTKHKKIHTEKKPYKCEECGKAFKWSSKLTEHKLTHTGEKPYKCEEC
370 380 390 400 410 420
210 220 230 240 250 260
pF1KSD QKPFKHLSELSRHERIHTGEKPYKCTLCDKSFSQSSHLVHHKRTHSSERPYKCAVCEKTF
: :. : :..:.::::::::::: .: :.:.: :.:. ::: :..:.:::: : :.:
CCDS59 GKAFNWPSTLTKHNRIHTGEKPYKCEVCGKAFNQFSNLTTHKRIHTAEKPYKCEECGKAF
430 440 450 460 470 480
270 280 290 300 310 320
pF1KSD KHRSHLVRHMYAHSGEHHLFRCNVCELHFKESSELLQHPCTPSGERPFRCGECQKAFKRP
.. :.:..: : :.. ..:. : :: ::.: .: : .::.:..: :: :::..
CCDS59 SRSSNLTKHKKIHI-EKKPYKCEECGKAFKWSSKLTEHKITHTGEKPYKCEECGKAFNHF
490 500 510 520 530 540
330 340 350 360 370 380
pF1KSD SDLRQHERTHSAERPFKCDLCPMGFKQQYALMRHRRTHKTEEPFKCGLCEKGFGQPSHLL
: : .:.: :..:.:.::. : .: :. : :.. : :. .:: : :.: : :.:
CCDS59 SILTKHKRIHTGEKPYKCEECGKAFTQSSNLTTHKKIHTGEKFYKCEECGKAFTQSSNLT
550 560 570 580 590 600
390 400 410 420 430 440
pF1KSD YHQHVHTLETLFKCPVCQKGFDQSAELLRHKCLPGAAERPFKCPVCNKAYKRASALQKHQ
:...:: .:: : :.:.: . : .:: . . :.:.:: :.::.: .:.: ::.
CCDS59 THKKIHTGGKPYKCEECGKAFNQFSTLTKHKIIH-TEEKPYKCEECGKAFKWSSTLTKHK
610 620 630 640 650 660
450 460 470 480 490 500
pF1KSD LAHCAAAEKPLRCTLCERRFFSSSEFVQHRCDPAREKPLKCPDCEKRFKYASDLQRHRRV
. : ..::: .: : . : :: . :. . ::: :: : : :. .:.: .:...
CCDS59 IIH--TGEKPYKCEECGKAFKLSSTLSTHKIIHTGEKPYKCEKCGKAFNRSSNLIEHKKI
670 680 690 700 710 720
510 520 530 540 550 560
pF1KSD HTGEKPYKCPNCDKAFKQREHLNKHQGVHAREQQFKCVWCGERFLDVALLQEHSAQHSAA
::::.:::: .: :::. ::: :. .:..:: .:: ::. : . . : :. :.
CCDS59 HTGEQPYKCEECGKAFNYSSHLNTHKRIHTKEQPYKCKECGKAFNQYSNLTTHNKIHTGE
730 740 750 760 770 780
570 580
pF1KSD AAAAEGAYQVAACLP
CCDS59 KLYKPEDVTVILTTPQTFSNIK
790 800
>>CCDS12413.2 ZNF43 gene_id:7594|Hs108|chr19 (809 aa)
initn: 1595 init1: 342 opt: 1167 Z-score: 684.9 bits: 137.1 E(32554): 7.9e-32
Smith-Waterman score: 1301; 36.8% identity (64.4% similar) in 508 aa overlap (72-565:282-785)
50 60 70 80 90 100
pF1KSD ENPLGCAVYGILLQPDPGLQPPQHAPLQAAGEPGPKCGVCGHDLAHLSSPHEHQCLAGHD
:: :: :.. . . :. ::. . .
CCDS12 YTRYKLYKCEECGKAFNKSSILTTHKIIRTGEKFYKCKECAKAFNQSSNLTEHKKIHPGE
260 270 280 290 300 310
110 120 130 140 150
pF1KSD RSFQCTQCLKIFHQATDLLEHQCVQAEQKPFVCGVCKMGFSLLTSLAQHHSSHSG--LVK
. ..: .: : :. . : .:. ... .::..: : .:. ...:. :. :.. . :
CCDS12 KPYKCEECGKAFNWPSTLTKHKRIHTGEKPYTCEECGKAFNQFSNLTTHKRIHTAEKFYK
320 330 340 350 360 370
160 170 180 190 200
pF1KSD CSICEKTY-KPAEAAEPATTAAPSLP--------AAPAPSTVTP---AEQADKPYSCPIC
:. : ... . .. .. . . : : : .: .. ..:::.: :
CCDS12 CTECGEAFSRSSNLTKHKKIHTEKKPYKCEECGKAFKWSSKLTEHKLTHTGEKPYKCEEC
380 390 400 410 420 430
210 220 230 240 250 260
pF1KSD QKPFKHLSELSRHERIHTGEKPYKCTLCDKSFSQSSHLVHHKRTHSSERPYKCAVCEKTF
: :. : :..:.::::::::::: .: :.:.: :.:. ::: :..:.:::: : :.:
CCDS12 GKAFNWPSTLTKHNRIHTGEKPYKCEVCGKAFNQFSNLTTHKRIHTAEKPYKCEECGKAF
440 450 460 470 480 490
270 280 290 300 310 320
pF1KSD KHRSHLVRHMYAHSGEHHLFRCNVCELHFKESSELLQHPCTPSGERPFRCGECQKAFKRP
.. :.:..: : :.. ..:. : :: ::.: .: : .::.:..: :: :::..
CCDS12 SRSSNLTKHKKIHI-EKKPYKCEECGKAFKWSSKLTEHKITHTGEKPYKCEECGKAFNHF
500 510 520 530 540 550
330 340 350 360 370 380
pF1KSD SDLRQHERTHSAERPFKCDLCPMGFKQQYALMRHRRTHKTEEPFKCGLCEKGFGQPSHLL
: : .:.: :..:.:.::. : .: :. : :.. : :. .:: : :.: : :.:
CCDS12 SILTKHKRIHTGEKPYKCEECGKAFTQSSNLTTHKKIHTGEKFYKCEECGKAFTQSSNLT
560 570 580 590 600 610
390 400 410 420 430 440
pF1KSD YHQHVHTLETLFKCPVCQKGFDQSAELLRHKCLPGAAERPFKCPVCNKAYKRASALQKHQ
:...:: .:: : :.:.: . : .:: . . :.:.:: :.::.: .:.: ::.
CCDS12 THKKIHTGGKPYKCEECGKAFNQFSTLTKHKIIH-TEEKPYKCEECGKAFKWSSTLTKHK
620 630 640 650 660
450 460 470 480 490 500
pF1KSD LAHCAAAEKPLRCTLCERRFFSSSEFVQHRCDPAREKPLKCPDCEKRFKYASDLQRHRRV
. : ..::: .: : . : :: . :. . ::: :: : : :. .:.: .:...
CCDS12 IIH--TGEKPYKCEECGKAFKLSSTLSTHKIIHTGEKPYKCEKCGKAFNRSSNLIEHKKI
670 680 690 700 710 720
510 520 530 540 550 560
pF1KSD HTGEKPYKCPNCDKAFKQREHLNKHQGVHAREQQFKCVWCGERFLDVALLQEHSAQHSAA
::::.:::: .: :::. ::: :. .:..:: .:: ::. : . . : :. :.
CCDS12 HTGEQPYKCEECGKAFNYSSHLNTHKRIHTKEQPYKCKECGKAFNQYSNLTTHNKIHTGE
730 740 750 760 770 780
570 580
pF1KSD AAAAEGAYQVAACLP
CCDS12 KLYKPEDVTVILTTPQTFSNIK
790 800
>>CCDS74321.1 ZNF43 gene_id:7594|Hs108|chr19 (818 aa)
initn: 1595 init1: 342 opt: 1167 Z-score: 684.8 bits: 137.2 E(32554): 8e-32
Smith-Waterman score: 1301; 36.8% identity (64.4% similar) in 508 aa overlap (72-565:291-794)
50 60 70 80 90 100
pF1KSD ENPLGCAVYGILLQPDPGLQPPQHAPLQAAGEPGPKCGVCGHDLAHLSSPHEHQCLAGHD
:: :: :.. . . :. ::. . .
CCDS74 YTRYKLYKCEECGKAFNKSSILTTHKIIRTGEKFYKCKECAKAFNQSSNLTEHKKIHPGE
270 280 290 300 310 320
110 120 130 140 150
pF1KSD RSFQCTQCLKIFHQATDLLEHQCVQAEQKPFVCGVCKMGFSLLTSLAQHHSSHSG--LVK
. ..: .: : :. . : .:. ... .::..: : .:. ...:. :. :.. . :
CCDS74 KPYKCEECGKAFNWPSTLTKHKRIHTGEKPYTCEECGKAFNQFSNLTTHKRIHTAEKFYK
330 340 350 360 370 380
160 170 180 190 200
pF1KSD CSICEKTY-KPAEAAEPATTAAPSLP--------AAPAPSTVTP---AEQADKPYSCPIC
:. : ... . .. .. . . : : : .: .. ..:::.: :
CCDS74 CTECGEAFSRSSNLTKHKKIHTEKKPYKCEECGKAFKWSSKLTEHKLTHTGEKPYKCEEC
390 400 410 420 430 440
210 220 230 240 250 260
pF1KSD QKPFKHLSELSRHERIHTGEKPYKCTLCDKSFSQSSHLVHHKRTHSSERPYKCAVCEKTF
: :. : :..:.::::::::::: .: :.:.: :.:. ::: :..:.:::: : :.:
CCDS74 GKAFNWPSTLTKHNRIHTGEKPYKCEVCGKAFNQFSNLTTHKRIHTAEKPYKCEECGKAF
450 460 470 480 490 500
270 280 290 300 310 320
pF1KSD KHRSHLVRHMYAHSGEHHLFRCNVCELHFKESSELLQHPCTPSGERPFRCGECQKAFKRP
.. :.:..: : :.. ..:. : :: ::.: .: : .::.:..: :: :::..
CCDS74 SRSSNLTKHKKIHI-EKKPYKCEECGKAFKWSSKLTEHKITHTGEKPYKCEECGKAFNHF
510 520 530 540 550
330 340 350 360 370 380
pF1KSD SDLRQHERTHSAERPFKCDLCPMGFKQQYALMRHRRTHKTEEPFKCGLCEKGFGQPSHLL
: : .:.: :..:.:.::. : .: :. : :.. : :. .:: : :.: : :.:
CCDS74 SILTKHKRIHTGEKPYKCEECGKAFTQSSNLTTHKKIHTGEKFYKCEECGKAFTQSSNLT
560 570 580 590 600 610
390 400 410 420 430 440
pF1KSD YHQHVHTLETLFKCPVCQKGFDQSAELLRHKCLPGAAERPFKCPVCNKAYKRASALQKHQ
:...:: .:: : :.:.: . : .:: . . :.:.:: :.::.: .:.: ::.
CCDS74 THKKIHTGGKPYKCEECGKAFNQFSTLTKHKIIH-TEEKPYKCEECGKAFKWSSTLTKHK
620 630 640 650 660 670
450 460 470 480 490 500
pF1KSD LAHCAAAEKPLRCTLCERRFFSSSEFVQHRCDPAREKPLKCPDCEKRFKYASDLQRHRRV
. : ..::: .: : . : :: . :. . ::: :: : : :. .:.: .:...
CCDS74 IIH--TGEKPYKCEECGKAFKLSSTLSTHKIIHTGEKPYKCEKCGKAFNRSSNLIEHKKI
680 690 700 710 720 730
510 520 530 540 550 560
pF1KSD HTGEKPYKCPNCDKAFKQREHLNKHQGVHAREQQFKCVWCGERFLDVALLQEHSAQHSAA
::::.:::: .: :::. ::: :. .:..:: .:: ::. : . . : :. :.
CCDS74 HTGEQPYKCEECGKAFNYSSHLNTHKRIHTKEQPYKCKECGKAFNQYSNLTTHNKIHTGE
740 750 760 770 780 790
570 580
pF1KSD AAAAEGAYQVAACLP
CCDS74 KLYKPEDVTVILTTPQTFSNIK
800 810
>>CCDS74322.1 ZNF91 gene_id:7644|Hs108|chr19 (1159 aa)
initn: 2320 init1: 364 opt: 1167 Z-score: 683.0 bits: 137.3 E(32554): 1e-31
Smith-Waterman score: 1330; 37.3% identity (61.8% similar) in 555 aa overlap (40-580:425-967)
10 20 30 40 50 60
pF1KSD QTQPQQPQPPQPQHHAEPPPALAEHTLPPGTAENPLGCAVYGILLQPDPGLQPPQHAPLQ
: :.:. : : . . : .: ..
CCDS74 IHTGEKPYKCEECGKAFNWSSSLTKHKRFHTREKPFKCKECGKAFIWSSTLT--RHKRIH
400 410 420 430 440 450
70 80 90 100 110 120
pF1KSD AAGEPGPKCGVCGHDLAHLSSPHEHQCLAGHDRSFQCTQCLKIFHQATDLLEHQCVQAEQ
. :: :: ::. . . :. .:. . .. .. .: : :.:. : .:. .....
CCDS74 T-GEKPYKCEECGKAFRQSSTLTKHKIIHTGEKPYKFEECGKAFRQSLTLNKHKIIHSRE
460 470 480 490 500 510
130 140 150 160 170
pF1KSD KPFVCGVCKMGFSLLTSLAQHHSSHSG--LVKCSICEK---------TYKPAEAAEPATT
::. : : .:. ...:. :. :.: : :: : : :.: ...: .
CCDS74 KPYKCKECGKAFKQFSTLTTHKIIHAGKKLYKCEECGKAFNHSSSLSTHKIIHTGEKSYK
520 530 540 550 560 570
180 190 200 210 220 230
pF1KSD AAPSLPAAPAPSTVTPAEQ---ADKPYSCPICQKPFKHLSELSRHERIHTGEKPYKCTLC
: ::. .. ..:::.: : : :.: : :..:.::::::::::: :
CCDS74 CEECGKAFLWSSTLRRHKRIHTGEKPYKCEECGKAFSHSSALAKHKRIHTGEKPYKCKEC
580 590 600 610 620 630
240 250 260 270 280 290
pF1KSD DKSFSQSSHLVHHKRTHSSERPYKCAVCEKTFKHRSHLVRHMYAHSGEHHLFRCNVCELH
:.::.:: :..:: ::. :.:::: :.::::. : :..: :.::. :..:. :
CCDS74 GKAFSNSSTLANHKITHTEEKPYKCKECDKTFKRLSTLTKHKIIHAGEK-LYKCEECGKA
640 650 660 670 680 690
300 310 320 330 340 350
pF1KSD FKESSELLQHPCTPSGERPFRCGECQKAFKRPSDLRQHERTHSAERPFKCDLCPMGFKQQ
:..::.: : .::.:..: :: :::. :.: .:.: :. :.:::: : .: .
CCDS74 FNRSSNLTIHKFIHTGEKPYKCEECGKAFNWSSSLTKHKRIHTREKPFKCKECGKAFIWS
700 710 720 730 740 750
360 370 380 390 400 410
pF1KSD YALMRHRRTHKTEEPFKCGLCEKGFGQPSHLLYHQHVHTLETLFKCPVCQKGFDQSAELL
.: ::.: : :.:.:: : :.:.. : : :. .:: : .:: : :.: .:. :
CCDS74 STLTRHKRIHTGEKPYKCEECGKAFSRSSTLTKHKTIHTGEKPYKCKECGKAFKHSSALA
760 770 780 790 800 810
420 430 440 450 460 470
pF1KSD RHKCLPGAAERPFKCPVCNKAYKRASALQKHQLAHCAAAEKPLRCTLCERRFFSSSEFVQ
.:: . :.:. .:: :.::....: : :.. : . ::: . :.. :. :: ...
CCDS74 KHKIIH-AGEKLYKCEECGKAFNQSSNLTTHKIIH--TKEKPSKSEECDKAFIWSSTLTE
820 830 840 850 860
480 490 500 510 520 530
pF1KSD HRCDPAREKPLKCPDCEKRFKYASDLQRHRRVHTGEKPYKCPNCDKAFKQREHLNKHQGV
:. .::: :: .: : :. : : :.:.::::::::: .: :::.: :. :. .
CCDS74 HKRIHTREKTYKCEECGKAFSQPSHLTTHKRMHTGEKPYKCEECGKAFSQSSTLTTHKII
870 880 890 900 910 920
540 550 560 570 580
pF1KSD HAREQQFKCVWCGERFLDVALLQEHSAQHSAAAAAAEGAYQVAACLP
:. :. .:: ::. : . : ::. :.. : :. :
CCDS74 HTGEKPYKCEECGKAFRKSSTLTEHKIIHTG-----EKPYKCEECGKAFSQSSTLTRHTR
930 940 950 960 970 980
CCDS74 MHTGEKPYKCEECGKAFNRSSKLTTHKIIHTGEKPYKCEECGKAFISSSTLNGHKRIHTR
990 1000 1010 1020 1030 1040
>--
initn: 1276 init1: 350 opt: 560 Z-score: 336.3 bits: 73.2 E(32554): 2.1e-12
Smith-Waterman score: 700; 33.5% identity (61.2% similar) in 322 aa overlap (208-529:73-389)
180 190 200 210 220 230
pF1KSD TAAPSLPAAPAPSTVTPAEQADKPYSCPICQKPFKHLSELSRHERIHTGEKPYKCTLCDK
:: . . : :: .. . . : :
CCDS74 LENYRNLAFLGICPHFPQDFWPEQSMEDSFQKVLLRKYEKCGHENLQLRKGCKSVDEC-K
50 60 70 80 90 100
240 250 260 270 280 290
pF1KSD SFSQSSHLVHHKRTHSSERPYKCAVCEKTFKHRSHLVRHMYAHSGEHHLFRCNVCELHFK
... . ... : .. . ..:. :.: . . :: :.:.. :.:. : :
CCDS74 VHKEGYNKLNQCLTTAQSKVFQCGKYLKVFYKFLNSNRHTIRHTGKK-CFKCKKCVKSFC
110 120 130 140 150 160
300 310 320 330 340 350
pF1KSD ESSELLQHPCTPSGERPFRCGECQKAFKRPSDLRQHERTHSAERPFKCDLCPMGFKQQYA
. :: :. :. .: ::.:.:. : : .:.. :. ..:.::. : .::: .
CCDS74 IRLHKTQHKCVYITEKSCKCKECEKTFHWSSTLTNHKEIHTEDKPYKCEECGKAFKQLST
170 180 190 200 210 220
360 370 380 390 400 410
pF1KSD LMRHRRTHKTEEPFKCGLCEKGFGQPSHLLYHQHVHTLETLFKCPVCQKGFDQSAELLRH
: :. :. .:: : :.: : : :...:: : .:: : :.:..:. : .:
CCDS74 LTTHKIICAKEKIYKCEECGKAFLWSSTLTRHKRIHTGEKPYKCEECGKAFSHSSTLAKH
230 240 250 260 270 280
420 430 440 450 460 470
pF1KSD KCLPGAAERPFKCPVCNKAYKRASALQKHQLAHCAAAEKPLRCTLCERRFFSSSEFVQHR
: . ..:.:.:: :.::..:.:.: ::. : ..::: .: : . : .:: ...:.
CCDS74 KRIH-TGEKPYKCEECGKAFSRSSTLAKHKRIH--TGEKPYKCKECGKAFSNSSTLANHK
290 300 310 320 330
480 490 500 510 520 530
pF1KSD CDPAREKPLKCPDCEKRFKYASDLQRHRRVHTGEKPYKCPNCDKAFKQREHLNKHQGVHA
..::: :: .:.: :: : : .:. .:.::: ::: .: :::.. .:
CCDS74 ITHTEEKPYKCKECDKAFKRLSTLTKHKIIHAGEKLYKCEECGKAFNRSSNLTIHKFIHT
340 350 360 370 380 390
540 550 560 570 580
pF1KSD REQQFKCVWCGERFLDVALLQEHSAQHSAAAAAAEGAYQVAACLP
CCDS74 GEKPYKCEECGKAFNWSSSLTKHKRFHTREKPFKCKECGKAFIWSSTLTRHKRIHTGEKP
400 410 420 430 440 450
>>CCDS42541.1 ZNF91 gene_id:7644|Hs108|chr19 (1191 aa)
initn: 2320 init1: 364 opt: 1167 Z-score: 682.9 bits: 137.3 E(32554): 1e-31
Smith-Waterman score: 1330; 37.3% identity (61.8% similar) in 555 aa overlap (40-580:457-999)
10 20 30 40 50 60
pF1KSD QTQPQQPQPPQPQHHAEPPPALAEHTLPPGTAENPLGCAVYGILLQPDPGLQPPQHAPLQ
: :.:. : : . . : .: ..
CCDS42 IHTGEKPYKCEECGKAFNWSSSLTKHKRFHTREKPFKCKECGKAFIWSSTLT--RHKRIH
430 440 450 460 470 480
70 80 90 100 110 120
pF1KSD AAGEPGPKCGVCGHDLAHLSSPHEHQCLAGHDRSFQCTQCLKIFHQATDLLEHQCVQAEQ
. :: :: ::. . . :. .:. . .. .. .: : :.:. : .:. .....
CCDS42 T-GEKPYKCEECGKAFRQSSTLTKHKIIHTGEKPYKFEECGKAFRQSLTLNKHKIIHSRE
490 500 510 520 530 540
130 140 150 160 170
pF1KSD KPFVCGVCKMGFSLLTSLAQHHSSHSG--LVKCSICEK---------TYKPAEAAEPATT
::. : : .:. ...:. :. :.: : :: : : :.: ...: .
CCDS42 KPYKCKECGKAFKQFSTLTTHKIIHAGKKLYKCEECGKAFNHSSSLSTHKIIHTGEKSYK
550 560 570 580 590 600
180 190 200 210 220 230
pF1KSD AAPSLPAAPAPSTVTPAEQ---ADKPYSCPICQKPFKHLSELSRHERIHTGEKPYKCTLC
: ::. .. ..:::.: : : :.: : :..:.::::::::::: :
CCDS42 CEECGKAFLWSSTLRRHKRIHTGEKPYKCEECGKAFSHSSALAKHKRIHTGEKPYKCKEC
610 620 630 640 650 660
240 250 260 270 280 290
pF1KSD DKSFSQSSHLVHHKRTHSSERPYKCAVCEKTFKHRSHLVRHMYAHSGEHHLFRCNVCELH
:.::.:: :..:: ::. :.:::: :.::::. : :..: :.::. :..:. :
CCDS42 GKAFSNSSTLANHKITHTEEKPYKCKECDKTFKRLSTLTKHKIIHAGEK-LYKCEECGKA
670 680 690 700 710 720
300 310 320 330 340 350
pF1KSD FKESSELLQHPCTPSGERPFRCGECQKAFKRPSDLRQHERTHSAERPFKCDLCPMGFKQQ
:..::.: : .::.:..: :: :::. :.: .:.: :. :.:::: : .: .
CCDS42 FNRSSNLTIHKFIHTGEKPYKCEECGKAFNWSSSLTKHKRIHTREKPFKCKECGKAFIWS
730 740 750 760 770 780
360 370 380 390 400 410
pF1KSD YALMRHRRTHKTEEPFKCGLCEKGFGQPSHLLYHQHVHTLETLFKCPVCQKGFDQSAELL
.: ::.: : :.:.:: : :.:.. : : :. .:: : .:: : :.: .:. :
CCDS42 STLTRHKRIHTGEKPYKCEECGKAFSRSSTLTKHKTIHTGEKPYKCKECGKAFKHSSALA
790 800 810 820 830 840
420 430 440 450 460 470
pF1KSD RHKCLPGAAERPFKCPVCNKAYKRASALQKHQLAHCAAAEKPLRCTLCERRFFSSSEFVQ
.:: . :.:. .:: :.::....: : :.. : . ::: . :.. :. :: ...
CCDS42 KHKIIH-AGEKLYKCEECGKAFNQSSNLTTHKIIH--TKEKPSKSEECDKAFIWSSTLTE
850 860 870 880 890
480 490 500 510 520 530
pF1KSD HRCDPAREKPLKCPDCEKRFKYASDLQRHRRVHTGEKPYKCPNCDKAFKQREHLNKHQGV
:. .::: :: .: : :. : : :.:.::::::::: .: :::.: :. :. .
CCDS42 HKRIHTREKTYKCEECGKAFSQPSHLTTHKRMHTGEKPYKCEECGKAFSQSSTLTTHKII
900 910 920 930 940 950
540 550 560 570 580
pF1KSD HAREQQFKCVWCGERFLDVALLQEHSAQHSAAAAAAEGAYQVAACLP
:. :. .:: ::. : . : ::. :.. : :. :
CCDS42 HTGEKPYKCEECGKAFRKSSTLTEHKIIHTG-----EKPYKCEECGKAFSQSSTLTRHTR
960 970 980 990 1000 1010
CCDS42 MHTGEKPYKCEECGKAFNRSSKLTTHKIIHTGEKPYKCEECGKAFISSSTLNGHKRIHTR
1020 1030 1040 1050 1060 1070
>--
initn: 1276 init1: 350 opt: 560 Z-score: 336.1 bits: 73.2 E(32554): 2.1e-12
Smith-Waterman score: 709; 29.8% identity (57.5% similar) in 409 aa overlap (121-529:26-421)
100 110 120 130 140 150
pF1KSD PHEHQCLAGHDRSFQCTQCLKIFHQATDLLEHQCVQAEQKPFVCGVCKMGFSLLTSLAQH
: ::... :. . .: .. :. :.
CCDS42 MPGTPGSLEMGLLTFRDVAIEFSPEEWQCLDTAQQNLYRNVMLENYRNLAFLGIA
10 20 30 40 50
160 170 180 190 200 210
pF1KSD HSSHSGLVKCSICEKTYKPAEAAEPATTAAPSLPAAPAPSTVTPAEQADKPYSCPICQKP
:. :. . :. .: . . . :. :. : .. . . ::
CCDS42 LSK-PDLI--TYLEQGKEPWNMKQHEMVDEPTGICPHFPQDFWPEQSMEDSF-----QKV
60 70 80 90 100
220 230 240 250 260 270
pF1KSD FKHLSELSRHERIHTGEKPYKCTLCDKSFSQSSHLVHHKRTHSSERPYKCAVCEKTFKHR
. . : :: .. . . : : ... . ... : .. . ..:. :.: .
CCDS42 LLRKYEKCGHENLQLRKGCKSVDEC-KVHKEGYNKLNQCLTTAQSKVFQCGKYLKVFYKF
110 120 130 140 150 160
280 290 300 310 320 330
pF1KSD SHLVRHMYAHSGEHHLFRCNVCELHFKESSELLQHPCTPSGERPFRCGECQKAFKRPSDL
. :: :.:.. :.:. : : . :: :. :. .: ::.:.:. : :
CCDS42 LNSNRHTIRHTGKK-CFKCKKCVKSFCIRLHKTQHKCVYITEKSCKCKECEKTFHWSSTL
170 180 190 200 210 220
340 350 360 370 380 390
pF1KSD RQHERTHSAERPFKCDLCPMGFKQQYALMRHRRTHKTEEPFKCGLCEKGFGQPSHLLYHQ
.:.. :. ..:.::. : .::: .: :. :. .:: : :.: : : :.
CCDS42 TNHKEIHTEDKPYKCEECGKAFKQLSTLTTHKIICAKEKIYKCEECGKAFLWSSTLTRHK
230 240 250 260 270 280
400 410 420 430 440 450
pF1KSD HVHTLETLFKCPVCQKGFDQSAELLRHKCLPGAAERPFKCPVCNKAYKRASALQKHQLAH
..:: : .:: : :.:..:. : .:: . ..:.:.:: :.::..:.:.: ::. :
CCDS42 RIHTGEKPYKCEECGKAFSHSSTLAKHKRIH-TGEKPYKCEECGKAFSRSSTLAKHKRIH
290 300 310 320 330 340
460 470 480 490 500 510
pF1KSD CAAAEKPLRCTLCERRFFSSSEFVQHRCDPAREKPLKCPDCEKRFKYASDLQRHRRVHTG
..::: .: : . : .:: ...:. ..::: :: .:.: :: : : .:. .:.:
CCDS42 --TGEKPYKCKECGKAFSNSSTLANHKITHTEEKPYKCKECDKAFKRLSTLTKHKIIHAG
350 360 370 380 390 400
520 530 540 550 560 570
pF1KSD EKPYKCPNCDKAFKQREHLNKHQGVHAREQQFKCVWCGERFLDVALLQEHSAQHSAAAAA
:: ::: .: :::.. .:
CCDS42 EKLYKCEECGKAFNRSSNLTIHKFIHTGEKPYKCEECGKAFNWSSSLTKHKRFHTREKPF
410 420 430 440 450 460
>>CCDS12632.1 ZNF45 gene_id:7596|Hs108|chr19 (682 aa)
initn: 1558 init1: 342 opt: 1153 Z-score: 677.8 bits: 135.6 E(32554): 2e-31
Smith-Waterman score: 1217; 36.9% identity (61.1% similar) in 542 aa overlap (46-580:129-645)
20 30 40 50 60 70
pF1KSD PQPPQPQHHAEPPPALAEHTLPPGTAENPLGCAV--YGILLQPDPGLQPPQHAPLQA---
:: . : : :.. : . ::.
CCDS12 HEELFCSQIWQQITRELIKYQDSVVNIQRTGCQLEKRDDLHYKDEGFSN-QSSHLQVHRV
100 110 120 130 140 150
80 90 100 110 120
pF1KSD -AGEPGPKCGVCGHDLAHLSSPHEHQCLAGHDRSFQCTQCLKIFHQATDLLEHQCVQAEQ
.:: : : .... : . .: . .. ..: .: . :.. ..: :: :...
CCDS12 HTGEKPYKGEHCVKSFSWSSHLQINQRAHAGEKPYKCEKCDNAFRRFSSLQAHQRVHSRA
160 170 180 190 200 210
130 140 150 160 170 180
pF1KSD KPFVCGVCKMGFSLLTSLAQHHSSHSGLVKCSICEKTYKPAEAAEPATTAAPSLPAAPAP
: .. . .:: . : .:. .: :. :: : .. . .. ::
CCDS12 KSYTNDASYRSFSQRSHLPHHQRVPTG-------ENPYKYEECGRNVGKSSHC----QAP
220 230 240 250 260
190 200 210 220 230 240
pF1KSD STVTPAEQADKPYSCPICQKPFKHLSELSRHERIHTGEKPYKCTLCDKSFSQSSHLVHHK
: .: :::.: : :.. : :. : ..:::.::::: : :::: :.: :.
CCDS12 LIVHTGE---KPYKCEECGVGFSQRSYLQVHLKVHTGKKPYKCEECGKSFSWRSRLQAHE
270 280 290 300 310 320
250 260 270 280 290 300
pF1KSD RTHSSERPYKCAVCEKTFKHRSHLVRHMYAHSGEHHLFRCNVCELHFKESSELLQHPCTP
: :..:.:::: .: :.:.. ::: : :.::. ..:. : :. .:.: : .
CCDS12 RIHTGEKPYKCNACGKSFSYSSHLNIHCRIHTGEKP-YKCEECGKGFSVGSHLQAHQISH
330 340 350 360 370 380
310 320 330 340 350 360
pF1KSD SGERPFRCGECQKAFKRPSDLRQHERTHSAERPFKCDLCPMGFKQQYALMRHRRTHKTEE
.::.:..: :: :.: : :.: .:.: :..:.:..:: : ::... . : :.: :.
CCDS12 TGEKPYKCEECGKGFCRASNLLDHQRGHTGEKPYQCDACGKGFSRSSDFNIHFRVHTGEK
390 400 410 420 430 440
370 380 390 400 410 420
pF1KSD PFKCGLCEKGFGQPSHLLYHQHVHTLETLFKCPVCQKGFDQSAELLRHKCLPGAAERPFK
:.:: : :::.: :.:: ::. :: : .:: .: :::..:..: : : ..:.:.:
CCDS12 PYKCEECGKGFSQASNLLAHQRGHTGEKPYKCGTCGKGFSRSSDLNVH-CRIHTGEKPYK
450 460 470 480 490 500
430 440 450 460 470 480
pF1KSD CPVCNKAYKRASALQKHQLAHCAAAEKPLRCTLCERRFFSSSEFVQH-RCDPAREKPLKC
: :.::... :.:: :: .: ..::: .:. : . : .:.. : :: . ::: .:
CCDS12 CERCGKAFSQFSSLQVHQRVH--TGEKPYQCAECGKGFSVGSQLQAHQRCHTG-EKPYQC
510 520 530 540 550
490 500 510 520 530 540
pF1KSD PDCEKRFKYASDLQRHRRVHTGEKPYKCPNCDKAFKQREHLNKHQGVHAREQQFKCVWCG
.: : : ::.. :: ::::::::.: : : :.:: .:. :: ::. :. .:: ::
CCDS12 EECGKGFCRASNFLAHRGVHTGEKPYRCDVCGKRFRQRSYLQAHQRVHTGERPYKCEECG
560 570 580 590 600 610
550 560 570 580
pF1KSD ERFLDVALLQEHSAQHSAAAAAAEGAYQVAACLP
. : . :: :. :.. : :. :
CCDS12 KVFSWSSYLQAHQRVHTG-----EKPYKCEECGKGFSWSSSLIIHQRVHADDEGDKDFPS
620 630 640 650 660 670
CCDS12 SEDSHRKTR
680
>>CCDS33122.1 ZNF470 gene_id:388566|Hs108|chr19 (717 aa)
initn: 910 init1: 667 opt: 1123 Z-score: 660.4 bits: 132.4 E(32554): 1.8e-30
Smith-Waterman score: 1241; 36.6% identity (65.8% similar) in 489 aa overlap (93-580:217-682)
70 80 90 100 110 120
pF1KSD PQHAPLQAAGEPGPKCGVCGHDLAHLSSPHEHQCLAGHDRSFQCTQCLKIFHQATDLLEH
.:. :. . ..:..: ::: . . : :
CCDS33 SYIKQIFPMEERIFNFHTDKKSLKTHSVVKKHKQDRGEKKLLKCNDCEKIFSKISTLTLH
190 200 210 220 230 240
130 140 150 160 170 180
pF1KSD QCVQAEQKPFVCGVCKMGFSLLTSLAQHHSSHSGLVKCSICEKTYKPAEAAEPATTAAPS
: ... .::. : : .:: . ::::. :.: :: .. .: .. . :
CCDS33 QRIHTGEKPYECIECGKAFSQSAHLAQHQRIHTG-------EKPFECTECGKAFSQNAHL
250 260 270 280 290
190 200 210 220 230 240
pF1KSD LPAAPAPSTVTPAEQADKPYSCPICQKPFKHLSELSRHERIHTGEKPYKCTLCDKSFSQS
. . . ..:::.: :.: :..:..:..:.:.:::::::.: : :.::.
CCDS33 VQHQRVHT-------GEKPYQCKQCNKAFSQLAHLAQHQRVHTGEKPYECIECGKAFSDC
300 310 320 330 340 350
250 260 270 280 290 300
pF1KSD SHLVHHKRTHSSERPYKCAVCEKTFKHRSHLVRHM-YAHSGEHHLFRCNVCELHFKESSE
: :.::.: :...:::.: : :.:.. . :.:: : :.::. : : : : .
CCDS33 SSLAHHRRIHTGKRPYECIDCGKAFRQNASLIRHRRYYHTGEKP-FDCIDCGKAFTDHIG
360 370 380 390 400 410
310 320 330 340 350 360
pF1KSD LLQHPCTPSGERPFRCGECQKAFKRPSDLRQHERTHSAERPFKCDLCPMGFKQQYALMRH
:.:: : .::::..:. : :::.. :.: :.: :..:.:..:..: .:... .: :
CCDS33 LIQHKRTHTGERPYKCNVCGKAFSHGSSLTVHQRIHTGEKPYECNICEKAFSHRGSLTLH
420 430 440 450 460 470
370 380 390 400 410 420
pF1KSD RRTHKTEEPFKCGLCEKGFGQPSHLLYHQHVHTLETLFKCPVCQKGFDQSAELLRHKCLP
.:.: :.:..: : :.: : .:: .::..:: : ..: :.: :.:.:.: .:. .
CCDS33 QRVHTGEKPYECKECGKAFRQSTHLAHHQRIHTGEKPYECKECSKTFSQNAHLAQHQKIH
480 490 500 510 520 530
430 440 450 460 470 480
pF1KSD GAAERPFKCPVCNKAYKRASALQKHQLAHCAAAEKPLRCTLCERRFFSSSEFVQHRCDPA
..:.:..: :.::... . : .:: .: ..::: .: : . : ..: .:::. .
CCDS33 -TGEKPYECKECGKAFSQIAHLVQHQRVH--TGEKPYECIECGKAFSDGSYLVQHQRLHS
540 550 560 570 580
490 500 510 520 530 540
pF1KSD REKPLKCPDCEKRFKYASDLQRHRRVHTGEKPYKCPNCDKAFKQREHLNKHQGVHAREQQ
..: .: .: : :. ..: :.: :::::::.: : :::..:. :. :: .:. :.
CCDS33 GKRPYECLECGKAFRQRASLICHQRCHTGEKPYECNVCGKAFSHRKSLTLHQRIHTGEKP
590 600 610 620 630 640
550 560 570 580
pF1KSD FKCVWCGERFLDVALLQEHSAQHSAAAAAAEGAYQVAACLP
..: :.. : .:: : :. :.. : :. :
CCDS33 YECKECSKAFSQVAHLTLHKRIHTG-----ERPYECKECGKAFRQSVHLAHHQRIHTGES
650 660 670 680 690 700
CCDS33 SVILSSALPYHQVL
710
>>CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 (616 aa)
initn: 1317 init1: 353 opt: 1118 Z-score: 658.3 bits: 131.8 E(32554): 2.4e-30
Smith-Waterman score: 1207; 36.5% identity (64.9% similar) in 482 aa overlap (52-529:127-579)
30 40 50 60 70
pF1KSD QHHAEPPPALAEHTLPPGTAENPLGCAVYGILLQPDPGLQP--PQHAPLQAAGEPGPKCG
: :.:: :: :.. .. : : .
CCDS74 SLESLAVPVAFTPVKTPVLEQWQRNGFGENISLNPDLPHQPMTPERQSPHTWGTRGKR--
100 110 120 130 140 150
80 90 100 110 120 130
pF1KSD VCGHDLAHLSSPHEHQCLAGHDRSFQCTQCLKIFHQATDLLEHQCVQAEQKPFVCGVCKM
:: : .. :. ... ..: .: : : ... :.::. ... ..:. : :
CCDS74 -EKPDLNVL----QKTCV--KEKPYKCQECGKAFSHSSALIEHHRTHTGERPYECHECLK
160 170 180 190 200
140 150 160 170 180 190
pF1KSD GFSLLTSLAQHHSSHSGL--VKCSICEKTYKPAEAAEPATTAAPSLPAAPAPSTVTPAEQ
:: ..:..:. :.: ::. : .:.. : : :
CCDS74 GFRNSSALTKHQRIHTGEKPYKCTQCGRTFNQIA------------PLIQHQRTHT----
210 220 230 240 250
200 210 220 230 240 250
pF1KSD ADKPYSCPICQKPFKHLSELSRHERIHTGEKPYKCTLCDKSFSQSSHLVHHKRTHSSERP
..::: : : : :. : .:.::: :::::::.:. : :.: :: ::..: : :..:.:
CCDS74 GEKPYECSECGKSFSFRSSFSQHERTHTGEKPYECSECGKAFRQSIHLTQHLRIHTGEKP
260 270 280 290 300 310
260 270 280 290 300 310
pF1KSD YKCAVCEKTFKHRSHLVRHMYAHSGEHHLFRCNVCELHFKESSELLQHPCTPSGERPFRC
:.:. : :.:.: : :..:. :.::. ..:. : : . . :.:: : .::.:..:
CCDS74 YQCGECGKAFSHSSSLTKHQRIHTGEKP-YECHECGKAFTQITPLIQHQRTHTGEKPYEC
320 330 340 350 360 370
320 330 340 350 360 370
pF1KSD GECQKAFKRPSDLRQHERTHSAERPFKCDLCPMGFKQQYALMRHRRTHKTEEPFKCGLCE
::: :::.. . : .:.: :..:.:. :. : :... .: .:.::: :.:..:. :
CCDS74 GECGKAFSQSTLLTEHRRIHTGEKPYGCNECGKTFSHSSSLSQHERTHTGEKPYECSQCG
380 390 400 410 420 430
380 390 400 410 420 430
pF1KSD KGFGQPSHLLYHQHVHTLETLFKCPVCQKGFDQSAELLRHKCLPGAAERPFKCPVCNKAY
:.: : .:: ::..:: : ..: : :.:..:. : .:. . ..:.:..: :..:.
CCDS74 KAFRQSTHLTQHQRIHTGEKPYECNDCGKAFSHSSSLTKHQRIH-TGEKPYECNQCGRAF
440 450 460 470 480
440 450 460 470 480 490
pF1KSD KRASALQKHQLAHCAAAEKPLRCTLCERRFFSSSEFVQHRCDPAREKPLKCPDCEKRFKY
.. . : .:: : ..::: .:. : : : .:: ...:. ..::: : .: : :..
CCDS74 SQLAPLIQHQRIH--TGEKPYECNQCGRAFSQSSLLIEHQRIHTKEKPYGCNECGKSFSH
490 500 510 520 530 540
500 510 520 530 540 550
pF1KSD ASDLQRHRRVHTGEKPYKCPNCDKAFKQREHLNKHQGVHAREQQFKCVWCGERFLDVALL
.:.:..:.:.:::::::.: .: :.:.: ::
CCDS74 SSSLSQHERTHTGEKPYECHDCGKSFRQSTHLTQHRRIHTGEKPYACRDCGKAFTHSSSL
550 560 570 580 590 600
560 570 580
pF1KSD QEHSAQHSAAAAAAEGAYQVAACLP
CCDS74 TKHQRTHTG
610
>>CCDS46031.1 ZNF98 gene_id:148198|Hs108|chr19 (572 aa)
initn: 985 init1: 363 opt: 1117 Z-score: 658.1 bits: 131.7 E(32554): 2.5e-30
Smith-Waterman score: 1153; 39.3% identity (66.5% similar) in 448 aa overlap (94-540:143-572)
70 80 90 100 110 120
pF1KSD QHAPLQAAGEPGPKCGVCGHDLAHLSSPHEHQCLAG-HDRSFQCTQCLKIFHQATDLLEH
.:::. ... :: . .:.::. .. .:
CCDS46 KKCGRENLQLRKYCKSMDECKVHKECYNGLNQCLTTTQNKIFQYDKYVKVFHKFSNSNRH
120 130 140 150 160 170
130 140 150 160 170 180
pF1KSD QCVQAEQKPFVCGVCKMGFSLLTSLAQHHSSHSGLVKCSICEKTYKPAEAAEPATTAAPS
. .. .: : : :. .: .:. ::::. ::: :: :: : .. : . : .
CCDS46 KIGHTGKKSFKCKECEKSFCMLSHLAQHKRIHSG-------EKPYKCKECGK-AYNEASN
180 190 200 210 220
190 200 210 220 230 240
pF1KSD LPAAPAPSTVTPAEQADKPYSCPICQKPFKHLSELSRHERIHTGEKPYKCTLCDKSFSQS
: :: . . :::.: : : :..::.:. :. ::::.::::: : :.:.::
CCDS46 L------STHKRIHTGKKPYKCEECGKAFNRLSHLTTHKIIHTGKKPYKCEECGKAFNQS
230 240 250 260 270
250 260 270 280 290 300
pF1KSD SHLVHHKRTHSSERPYKCAVCEKTFKHRSHLVRHMYAHSGEHHLFRCNVCELHFKESSEL
..:. ::: :..:.:::: : ..:.. : :. : :.::. ..:. : :..:: :
CCDS46 ANLTTHKRIHTGEKPYKCEECGRAFSQSSTLTAHKIIHAGEKP-YKCEECGKAFSQSSTL
280 290 300 310 320 330
310 320 330 340 350 360
pF1KSD LQHPCTPSGERPFRCGECQKAFKRPSDLRQHERTHSAERPFKCDLCPMGFKQQYALMRHR
: .::. ..: :: :::.: : : :.: ::.:.:.::. : .:::. .: :.
CCDS46 TTHKIIHTGEKFYKCEECGKAFSRLSHLTTHKRIHSGEKPYKCEECGKAFKQSSTLTTHK
340 350 360 370 380 390
370 380 390 400 410 420
pF1KSD RTHKTEEPFKCGLCEKGFGQPSHLLYHQHVHTLETLFKCPVCQKGFDQSAELLRHKCLPG
: : :. .:: .: :.:.. ::: :...:: : .:: : :.:. :..: :: .
CCDS46 RIHAGEKFYKCEVCSKAFSRFSHLTTHKRIHTGEKPYKCEECGKAFNLSSQLTTHKIIH-
400 410 420 430 440 450
430 440 450 460 470 480
pF1KSD AAERPFKCPVCNKAYKRASALQKHQLAHCAAAEKPLRCTLCERRFFSSSEFVQHRCDPAR
..:.:.:: :.::....:.:.::.. : ..::: .: : . : .::... :. .
CCDS46 TGEKPYKCEECGKAFNQSSTLSKHKVIH--TGEKPYKCEECGKAFNQSSHLTTHKMIHTG
460 470 480 490 500 510
490 500 510 520 530 540
pF1KSD EKPLKCPDCEKRFKYASDLQRHRRVHTGEKPYKCPNCDKAFKQREHLNKHQGVHAREQQF
::: :: .: : :. .: :.::. .::::: :: .:..: . ...:.. : :.
CCDS46 EKPYKCEECGKAFNNSSILNRHKMIHTGEKLYKPESCNNACDNIAKISKYKRNCAGEK
520 530 540 550 560 570
550 560 570 580
pF1KSD KCVWCGERFLDVALLQEHSAQHSAAAAAAEGAYQVAACLP
582 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 06:04:56 2016 done: Thu Nov 3 06:04:57 2016
Total Scan time: 4.110 Total Display time: 0.140
Function used was FASTA [36.3.4 Apr, 2011]