FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1852, 792 aa
1>>>pF1KSDA1852 792 - 792 aa - 792 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.9288+/-0.00208; mu= 14.3110+/- 0.122
mean_var=280.9348+/-53.224, 0's: 0 Z-trim(103.5): 996 B-trim: 9 in 1/50
Lambda= 0.076519
statistics sampled from 6349 (7423) to 6349 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.54), E-opt: 0.2 (0.228), width: 16
Scan time: 3.770
The best scores are: opt bits E(32554)
CCDS12968.1 ZNF606 gene_id:80095|Hs108|chr19 ( 792) 5674 641.9 1.2e-183
CCDS11180.1 ZNF624 gene_id:57547|Hs108|chr17 ( 865) 2234 262.2 2.6e-69
CCDS7198.1 ZNF33B gene_id:7582|Hs108|chr10 ( 778) 2138 251.5 3.8e-66
CCDS12973.1 ZNF544 gene_id:27300|Hs108|chr19 ( 715) 2115 249.0 2.1e-65
CCDS60514.1 ZNF33A gene_id:7581|Hs108|chr10 ( 817) 2101 247.5 6.6e-65
CCDS33097.1 ZNF347 gene_id:84671|Hs108|chr19 ( 839) 2098 247.2 8.4e-65
CCDS31182.1 ZNF33A gene_id:7581|Hs108|chr10 ( 810) 2090 246.3 1.5e-64
CCDS44372.1 ZNF33A gene_id:7581|Hs108|chr10 ( 811) 2087 245.9 1.9e-64
CCDS73088.1 ZNF33A gene_id:7581|Hs108|chr10 ( 829) 2087 246.0 1.9e-64
CCDS54314.1 ZNF347 gene_id:84671|Hs108|chr19 ( 840) 2086 245.9 2.1e-64
CCDS33122.1 ZNF470 gene_id:388566|Hs108|chr19 ( 717) 2081 245.2 2.8e-64
CCDS12503.1 ZNF569 gene_id:148266|Hs108|chr19 ( 686) 2038 240.4 7.5e-63
CCDS74350.1 ZNF850 gene_id:342892|Hs108|chr19 (1058) 1996 236.1 2.3e-61
CCDS59379.1 ZNF850 gene_id:342892|Hs108|chr19 (1090) 1996 236.1 2.4e-61
CCDS82341.1 ZNF569 gene_id:148266|Hs108|chr19 ( 527) 1981 234.0 5.1e-61
CCDS59367.1 ZNF43 gene_id:7594|Hs108|chr19 ( 803) 1980 234.1 6.9e-61
CCDS12413.2 ZNF43 gene_id:7594|Hs108|chr19 ( 809) 1980 234.1 6.9e-61
CCDS74321.1 ZNF43 gene_id:7594|Hs108|chr19 ( 818) 1980 234.1 6.9e-61
CCDS31940.1 ZNF84 gene_id:7637|Hs108|chr12 ( 738) 1967 232.6 1.8e-60
CCDS45012.1 ZNF268 gene_id:10795|Hs108|chr12 ( 947) 1944 230.3 1.2e-59
CCDS4624.1 ZNF184 gene_id:7738|Hs108|chr6 ( 751) 1937 229.3 1.8e-59
CCDS74322.1 ZNF91 gene_id:7644|Hs108|chr19 (1159) 1932 229.1 3.3e-59
CCDS42541.1 ZNF91 gene_id:7644|Hs108|chr19 (1191) 1932 229.1 3.3e-59
CCDS12498.1 ZNF420 gene_id:147923|Hs108|chr19 ( 688) 1926 228.1 3.9e-59
CCDS82388.1 ZNF841 gene_id:284371|Hs108|chr19 ( 808) 1925 228.1 4.6e-59
CCDS46161.1 ZNF841 gene_id:284371|Hs108|chr19 ( 924) 1925 228.2 5e-59
CCDS14279.1 ZNF41 gene_id:7592|Hs108|chrX ( 779) 1917 227.2 8.4e-59
CCDS46162.1 ZNF836 gene_id:162962|Hs108|chr19 ( 936) 1910 226.5 1.6e-58
CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 1907 225.9 1.6e-58
CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 1907 225.9 1.6e-58
CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 1907 225.9 1.7e-58
CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 1907 226.0 1.7e-58
CCDS46212.1 ZNF814 gene_id:730051|Hs108|chr19 ( 855) 1901 225.5 3e-58
CCDS82413.1 ZNF544 gene_id:27300|Hs108|chr19 ( 687) 1892 224.3 5.3e-58
CCDS59368.1 ZNF729 gene_id:100287226|Hs108|chr19 (1252) 1896 225.2 5.4e-58
CCDS33090.1 ZNF616 gene_id:90317|Hs108|chr19 ( 781) 1892 224.4 5.7e-58
CCDS12632.1 ZNF45 gene_id:7596|Hs108|chr19 ( 682) 1887 223.8 7.7e-58
CCDS54240.1 ZNF208 gene_id:7757|Hs108|chr19 (1280) 1886 224.1 1.2e-57
CCDS46170.1 ZNF845 gene_id:91664|Hs108|chr19 ( 970) 1876 222.8 2.2e-57
CCDS12637.1 ZNF112 gene_id:7771|Hs108|chr19 ( 907) 1875 222.6 2.3e-57
CCDS54276.1 ZNF112 gene_id:7771|Hs108|chr19 ( 913) 1875 222.6 2.3e-57
CCDS46991.1 ZNF721 gene_id:170960|Hs108|chr4 ( 923) 1872 222.3 2.9e-57
CCDS12499.1 ZNF585A gene_id:199704|Hs108|chr19 ( 714) 1862 221.0 5.4e-57
CCDS74353.1 ZNF585A gene_id:199704|Hs108|chr19 ( 769) 1862 221.1 5.6e-57
CCDS6437.1 ZNF16 gene_id:7564|Hs108|chr8 ( 682) 1859 220.7 6.6e-57
CCDS12500.1 ZNF585B gene_id:92285|Hs108|chr19 ( 769) 1856 220.4 8.9e-57
CCDS46102.1 ZNF226 gene_id:7769|Hs108|chr19 ( 803) 1854 220.2 1.1e-56
CCDS75846.1 ZNF658 gene_id:26149|Hs108|chr9 (1059) 1852 220.2 1.4e-56
CCDS46101.1 ZNF234 gene_id:10780|Hs108|chr19 ( 700) 1848 219.5 1.6e-56
CCDS77297.1 ZNF546 gene_id:339327|Hs108|chr19 ( 810) 1846 219.3 2e-56
>>CCDS12968.1 ZNF606 gene_id:80095|Hs108|chr19 (792 aa)
initn: 5674 init1: 5674 opt: 5674 Z-score: 3410.6 bits: 641.9 E(32554): 1.2e-183
Smith-Waterman score: 5674; 100.0% identity (100.0% similar) in 792 aa overlap (1-792:1-792)
10 20 30 40 50 60
pF1KSD MAAINPWASWGALTDQSWGMTAVDPWASWALCPQYPAWHVEGSLEEGRRATGLPAAQVQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MAAINPWASWGALTDQSWGMTAVDPWASWALCPQYPAWHVEGSLEEGRRATGLPAAQVQE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD PVTFKDVAVDFTQEEWGQLDLVQRTLYRDVMLETYGHLLSVGNQIAKPEVISLLEQGEEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 PVTFKDVAVDFTQEEWGQLDLVQRTLYRDVMLETYGHLLSVGNQIAKPEVISLLEQGEEP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD WSVEQACPQRTCPEWVRNLESKALIPAQSIFEEEQSHGMKLERYIWDDPWFSRLEVLGCK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 WSVEQACPQRTCPEWVRNLESKALIPAQSIFEEEQSHGMKLERYIWDDPWFSRLEVLGCK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD DQLEMYHMNQSTAMRQMVFMQKQVLSQRSSEFCGLGAEFSQNLNFVPSQRVSQIEHFYKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DQLEMYHMNQSTAMRQMVFMQKQVLSQRSSEFCGLGAEFSQNLNFVPSQRVSQIEHFYKP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD DTHAQSWRCDSAIMYADKVTCENNDYDKTVYQSIQPIYPARIQTGDNLFKCTDAVKSFNH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DTHAQSWRCDSAIMYADKVTCENNDYDKTVYQSIQPIYPARIQTGDNLFKCTDAVKSFNH
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD IIHFGDHKGIHTGEKLYEYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYENIFYFSSFM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 IIHFGDHKGIHTGEKLYEYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYENIFYFSSFM
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD EHQKIGTVEKAYKYNEWEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIWSSYLIQHKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 EHQKIGTVEKAYKYNEWEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIWSSYLIQHKK
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD THTGEKPYECDKCGKVFRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHLIVHKRIHTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 THTGEKPYECDKCGKVFRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHLIVHKRIHTG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD EKPYVCNECGKSFNWNSHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHMRMHTGEKPF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 EKPYVCNECGKSFNWNSHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHMRMHTGEKPF
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD KCDECEKAFRDYSALSKHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHTGEKPYNCQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 KCDECEKAFRDYSALSKHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHTGEKPYNCQE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD CGKAFRERSALTKHEIIHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKPYECNKCGKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 CGKAFRERSALTKHEIIHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKPYECNKCGKS
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD FSQSCHLVAHRRIHTGEKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCNECGKAFNES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 FSQSCHLVAHRRIHTGEKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCNECGKAFNES
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD SSLIVHLRNHTGEKPYKCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGKAFSGHSALL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 SSLIVHLRNHTGEKPYKCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGKAFSGHSALL
730 740 750 760 770 780
790
pF1KSD QHQRNHSEEKLN
::::::::::::
CCDS12 QHQRNHSEEKLN
790
>>CCDS11180.1 ZNF624 gene_id:57547|Hs108|chr17 (865 aa)
initn: 3501 init1: 1806 opt: 2234 Z-score: 1357.9 bits: 262.2 E(32554): 2.6e-69
Smith-Waterman score: 2234; 44.7% identity (70.5% similar) in 739 aa overlap (58-790:50-778)
30 40 50 60 70 80
pF1KSD SWALCPQYPAWHVEGSLEEGRRATGLPAAQVQEPVTFKDVAVDFTQEEWGQLDLVQRTLY
:.: :::::::.::: ::: .: .::.:.
CCDS11 AAVFFSVGRLSPEVTQPDEDLHLQAEETQLVKESVTFKDVAIDFTLEEWRLMDPTQRNLH
20 30 40 50 60 70
90 100 110 120 130 140
pF1KSD RDVMLETYGHLLSVGNQIAKPEVISLLEQGEEPWSVEQACPQRTCPEWVRNLESKALIPA
.:::::.: .:.:.: ..::..:: ::.:. :: . . . :. . .: .
CCDS11 KDVMLENYRNLVSLGLAVSKPDMISHLENGKGPWVTVREISRIPYPDMEPKPATKKATRT
80 90 100 110 120 130
150 160 170 180 190 200
pF1KSD QSIFEEEQSHGMKLERYIWDDPWFSRLEVLGC-KDQLEMYHMNQSTAMRQMVF-MQKQVL
..: :. ..... ::. . : ::.: : .:.. . :: . . : .. ..:
CCDS11 KAISEDLSQEAI-LEKLTENGLWDSRMEGLWKWNDRILRLQNNQENHLSQRIIPLKKTPT
140 150 160 170 180 190
210 220 230 240 250 260
pF1KSD SQRSSEFCGLGAEFSQNLNFVPSQRVSQIEHFYKPDTHAQSWRCDSAIM---YADKVTCE
:::. .: .. ..: .. : . .:. ... . .. . :. :.
CCDS11 SQRGFRFESI---------LIPEPGIATEELHSRCQTQEENFTENLNLITDTHLGKIICK
200 210 220 230 240
270 280 290 300 310 320
pF1KSD NNDYDKTVYQSIQPIYPARIQTGDNLFKCTDAVKSFNHIIHFGDHKGIHTGEKLYEYKEC
. .:.. :. . . .. .. .::. :.:.. . .:. :: :: :: .::
CCDS11 EMKGSKAIRQTSELTLGKKSNNKEKPYKCSTCEKAFHYRSLLIQHQRTHTKEKPYECNEC
250 260 270 280 290 300
330 340 350 360 370 380
pF1KSD HQIFNQSPSFNEHPRLHVGENQYNYKEYENIFYFSS-FMEHQKIGTVEKAYKYNEWEKVF
. :.: ...: ..:.::. :. .: . : :: .: ::.: : :: :. : : :
CCDS11 GKTFSQPSYLSQHKKIHTGEKPYKCNECGKAFIASSSLMVHQRIHTKEKPYQCNVCGKSF
310 320 330 340 350 360
390 400 410 420 430 440
pF1KSD GYDSFLTQHTSTYTAEKPYDYNECGTSFIWSSYLIQHKKTHTGEKPYECDKCGKVFRNRS
. . :.:: :.:::: .::: .: .: : .:..::.:::::.:: :::.:::.:
CCDS11 SQCARLNQHQRIQTGEKPYKCSECGKAFSDKSKLARHQETHNGEKPYKCDDCGKAFRNKS
370 380 390 400 410 420
450 460 470 480 490 500
pF1KSD ALTKHERTHTGIKPYECNKCGKAFSWNSHLIVHKRIHTGEKPYVCNECGKSFNWNSHLIG
:. :..::: :::.::.:::.:. .. . ::.::::::::. ::::::.. :: ::
CCDS11 YLSVHQKTHTEEKPYQCNECGKSFKNTTIFNVHQRIHTGEKPFRCNECGKAYRSNSSLIV
430 440 450 460 470 480
510 520 530 540 550 560
pF1KSD HQRTHTGEKPFECTECGKSFSWSSHLIAHMRMHTGEKPFKCDECEKAFRDYSALSKHERT
: ::::::::.::.::::.:. ... :.:.::::::.::.:: ::: .:: :. :.:
CCDS11 HIRTHTGEKPYECNECGKAFNRIANFTEHQRIHTGEKPYKCNECGKAFINYSCLTVHHRM
490 500 510 520 530 540
570 580 590 600 610 620
pF1KSD HSGAKPYKCTECGKSFSWSSHLIAHQRTHTGEKPYNCQECGKAFRERSALTKHEIIHSGI
:.: ::::::::::.: :: :: ::: :: :::: :.:::..:: .: :: :. ::.:
CCDS11 HTGEKPYKCTECGKAFMRSSSLIIHQRIHTEEKPYLCNECGESFRIKSHLTVHQRIHTGE
550 560 570 580 590 600
630 640 650 660 670 680
pF1KSD KPYECNKCGKSCSQMAHLVRHQRTHTGEKPYECNKCGKSFSQSCHLVAHRRIHTGEKPYK
:::.:. : .. ..:..: .::. ::: :::.: ::::: . .:..:.: ::::::::
CCDS11 KPYKCTDCERAFTKMVNLKEHQKIHTGVKPYKCYDCGKSFRTKSYLIVHQRTHTGEKPYK
610 620 630 640 650 660
690 700 710 720 730 740
pF1KSD CNQCERSFNCSSHLIAHRRTHTGEKPYRCNECGKAFNESSSLIVHLRNHTGEKPYKCNHC
::.::..:. .:.: .:.: :::::::.::::::.:. .:.. .: :.::::::.::: :
CCDS11 CNECEKAFTNTSQLTVHQRRHTGEKPYKCNECGKVFTSNSGFNTHQRTHTGEKPFKCNDC
670 680 690 700 710 720
750 760 770 780 790
pF1KSD EKAFCKNSSLIIHQRMHSGEKRFICSECGKAFSGHSALLQHQRNHSEEKLN
::: . . ::..::::: . :. ::::: : : : :.:. ::
CCDS11 GKAFSQMVHVTEHQKIHSGEKPYKCDVCGKAFRRGSYLTVHWRTHTGEKPYTCKECGKGC
730 740 750 760 770 780
CCDS11 ITLSQLTLHQRIHTGERPYKCEECGKAFRTNSDFTVHLRMHTGEKPYKCNECGKAFRSSS
790 800 810 820 830 840
>>CCDS7198.1 ZNF33B gene_id:7582|Hs108|chr10 (778 aa)
initn: 1820 init1: 1820 opt: 2138 Z-score: 1301.0 bits: 251.5 E(32554): 3.8e-66
Smith-Waterman score: 2138; 43.3% identity (69.3% similar) in 753 aa overlap (57-790:7-747)
30 40 50 60 70 80
pF1KSD ASWALCPQYPAWHVEGSLEEGRRATGLPAAQVQEPVTFKDVAVDFTQEEWGQLDLVQRTL
. : :.::::.: :::::: .:: ::.:
CCDS71 MNKVDQKFQGSVSFKDVTVGFTQEEWQHLDPSQRAL
10 20 30
90 100 110 120 130
pF1KSD YRDVMLETYGHLLSVGNQIAKPEVISLLEQGEEPWSVEQACPQRTCPE-WV------RNL
:::::::.:..:.::: ::::: :::::::: .:. :... :: :. :.
CCDS71 YRDVMLENYSNLVSVGYCAHKPEVIFRLEQGEEPWRLEEEFPSQSFPEVWTADHLKERSQ
40 50 60 70 80 90
140 150 160 170 180 190
pF1KSD ESKA------LIPAQSIFEEEQSHGMKLERYIWDDPWFSRLEVLGCKDQLEMYHMNQSTA
:... .. . .. .::.. . . . : : ... : : . :. .:
CCDS71 ENQSKHLWEVVFINNEMLTKEQGNVIGIP-FNMDVSSFPSRKMF-C--QYDSRGMSFNT-
100 110 120 130 140 150
200 210 220 230 240 250
pF1KSD MRQMVFMQKQVLSQRSSEFCGLGAEFSQNLNFVPSQRVSQIEHFYKPDTHAQSWRCDSAI
. ..:. . . :...:.:: . : . ::. .. .. .. . .. : : ..
CCDS71 VSELVISKINYLGKKSDEFNACGKLL---LNIKHDETHTREKNEVLKNRNTLSHRENT--
160 170 180 190 200
260 270 280 290 300
pF1KSD MYADKVTCENNDYDKTVYQSI---QPIYPARIQTGDNLFKC--TDAVKSFNHIIHFGDHK
. .:. ..... .. : . .. .: . . . .: .. ..: . :.
CCDS71 LQHEKIQTLDHNFEYSICQETLLEKAVFNTRKRENAEENNCDYNEFGRTFCDSSSLLFHQ
210 220 230 240 250 260
310 320 330 340 350 360
pF1KSD GIHTGEKLYEYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYENIFYFSSFMEH-QKIGT
. .. ::...:.... . ....: . : ..:. : : : . . . ::
CCDS71 IPPSKDSHYEFSDCEKFLCVKSTLSKHDGVPV--KHYDCGESGNNFRRKLCLSQLQKGDK
270 280 290 300 310 320
370 380 390 400 410 420
pF1KSD VEKAYKYNEWEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIWSSYLIQHKKTHTGEKP
:: .. :: :.: : ::.: ..:.:: .. :.:: .: .: : .:...::::::
CCDS71 GEKHFECNECGKAFWEKSHLTRHQRVHTGEKHFQCNQCGKTFWEKSNLTKHQRSHTGEKP
330 340 350 360 370 380
430 440 450 460 470 480
pF1KSD YECDKCGKVFRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHLIVHKRIHTGEKPYVCN
.::..:::.: ..:::: :.::::: :::.:: :::.: .: : :.: :::.::: :
CCDS71 FECNECGKAFSHKSALTLHQRTHTGEKPYQCNACGKTFYQKSDLTKHQRTHTGQKPYECY
390 400 410 420 430 440
490 500 510 520 530 540
pF1KSD ECGKSFNWNSHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHMRMHTGEKPFKCDECEK
:::::: :::: ::::::::::::: :::::: .::: :.: : :.::..:. : :
CCDS71 ECGKSFCMNSHLTVHQRTHTGEKPFECLECGKSFCQKSHLTQHQRTHIGDKPYECNACGK
450 460 470 480 490 500
550 560 570 580 590 600
pF1KSD AFRDYSALSKHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHTGEKPYNCQECGKAFRE
.: :.:..:. :.: :::.: ::::.: .: : ::::::::::. : :::: : .
CCDS71 TFYHKSVLTRHQIIHTGLKPYECYECGKTFCLKSDLTIHQRTHTGEKPFACPECGKFFSH
510 520 530 540 550 560
610 620 630 640 650 660
pF1KSD RSALTKHEIIHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKPYECNKCGKSFSQSCHL
.:.:..: :.: :::::..::: . ..:..:.::::::::::::.:::.: :. .:
CCDS71 KSTLSQHYRTHTGEKPYECHECGKIFYNKSYLTKHNRTHTGEKPYECNECGKTFCQKSQL
570 580 590 600 610 620
670 680 690 700 710 720
pF1KSD VAHRRIHTGEKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCNECGKAFNESSSLIVHL
. :.::: :::::.::.: ..: .: ::.:.:::: ::::.::::::.: .:.::.:
CCDS71 TQHQRIHIGEKPYECNECGKAFCHKSALIVHQRTHTQEKPYKCNECGKSFCVKSGLILHE
630 640 650 660 670 680
730 740 750 760 770 780
pF1KSD RNHTGEKPYKCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGKAFSGHSALLQHQRNHS
:.:::::::.::.: :.: ..::: .:.: :.::: :.:::: : .: : .:::.:.
CCDS71 RKHTGEKPYECNECGKSFSHKSSLTVHHRAHTGEKSCQCNECGKIFYRKSDLAKHQRSHT
690 700 710 720 730 740
790
pF1KSD EEKLN
::
CCDS71 GEKPYECNTCRKTFSQKSNLIVHQRTHIGEKPYE
750 760 770
>>CCDS12973.1 ZNF544 gene_id:27300|Hs108|chr19 (715 aa)
initn: 1657 init1: 1657 opt: 2115 Z-score: 1287.7 bits: 249.0 E(32554): 2.1e-65
Smith-Waterman score: 2115; 46.4% identity (70.7% similar) in 716 aa overlap (59-762:11-714)
30 40 50 60 70 80
pF1KSD WALCPQYPAWHVEGSLEEGRRATGLPAAQVQEPVTFKDVAVDFTQEEWGQLDLVQRTLYR
: : :.:::. :::::: ::::.::::::
CCDS12 MEARSMLVPPQASVCFEDVAMAFTQEEWEQLDLAQRTLYR
10 20 30 40
90 100 110 120 130 140
pF1KSD DVMLETYGHLLSVGNQIAKPEVISLLEQGEEPWSVEQACPQRTCPEWVRNLESKALIPAQ
.: :::. :..:.: ..: .::: ::: :. .:: :. .: .:: . : .
CCDS12 EVTLETWEHIVSLGLFLSKSDVISQLEQEEDLCRAEQEAPR----DWKATLEENRLNSEK
50 60 70 80 90
150 160 170 180 190 200
pF1KSD SIFEEEQSHGMKLERYIWDDPWFSRLEVLG-CKDQLEMYHMNQSTAMRQMVFMQKQVLSQ
. .:: :: ... : ..: : ::: .:: .. . .: ...: ::. ......:
CCDS12 DRAREELSHHVEVYRSGPEEP--PSL-VLGKVQDQSNQLREHQENSLRFMVLTSERLFAQ
100 110 120 130 140 150
210 220 230 240 250
pF1KSD RSSEFC----GLGAEFSQNLNFVPSQRVSQIEHFYKPDTHAQSWRCDSAIMY-----ADK
: : : : : . ..:...:. .. : ::..... . .::.. ::
CCDS12 R--EHCELELGGGYSLPSTLSLLPTTLPTST-GFPKPNSQVKELKQNSAFINHEKNGADG
160 170 180 190 200 210
260 270 280 290 300 310
pF1KSD VTCENNDYDKTVYQSIQPIYPARIQTGD-NLFKCTDAVKSFNHIIHFGDHKGIHTGEKLY
::... .. ::: . ..:: : .. . :.:. . : . .:
CCDS12 KHCESHQCARAFCQSIYLSKLGNVETGKKNPYEYIVSGDSLNYGSSLCFHGRTFSVKKSD
220 230 240 250 260 270
320 330 340 350 360 370
pF1KSD EYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYENIFYFS-SFMEHQKIGTVEKAYKYNE
. :. ..:..: :.::. .: :..::. : .. : ... .. : : .. .:
CCDS12 DCKDYGNLFSHSVSLNEQKPVHFGKSQYECDECRETCSESLCLVQTERSGPGETPFRCEE
280 290 300 310 320 330
380 390 400 410 420 430
pF1KSD WEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIWSSYLIQHKKTHTGEKPYECDKCGKV
.: . : ... . :.::: :.:: :: : . :..:::::::.:: .:::
CCDS12 RCAAFPMASSFSDCNIIQTTEKPSVCNQCGKSF--SCCKLIHQRTHTGEKPFECTQCGKS
340 350 360 370 380
440 450 460 470 480 490
pF1KSD FRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHLIVHKRIHTGEKPYVCNECGKSFNWN
: . :. :.::::: :::::. :::.:. :.::.:.::::::::: : :: ::: ::
CCDS12 FSQSYDLVIHQRTHTGEKPYECDLCGKSFTQRSKLITHQRIHTGEKPYQCIECRKSFRWN
390 400 410 420 430 440
500 510 520 530 540 550
pF1KSD SHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHMRMHTGEKPFKCDECEKAFRDYSALS
:.:: ::: ::::::.:::.:::::: : .:..: : ::::::::: .: :.: . :
CCDS12 SNLIVHQRIHTGEKPYECTHCGKSFSQSYELVTHKRTHTGEKPFKCTQCGKSFSQKYDLV
450 460 470 480 490 500
560 570 580 590 600 610
pF1KSD KHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHTGEKPYNCQECGKAFRERSALTKHEI
:.:::.: :::.:. :::::: ::.::.::: :::::::.: ::::.:: : :. :.
CCDS12 VHQRTHTGEKPYECNLCGKSFSQSSKLITHQRIHTGEKPYQCIECGKSFRWNSNLVIHQR
510 520 530 540 550 560
620 630 640 650 660 670
pF1KSD IHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKPYECNKCGKSFSQSCHLVAHRRIHTG
::.: :::.:..:::: :: .:: :.::::::::::::.:::.:..: .:. : .::::
CCDS12 IHTGEKPYDCTHCGKSFSQSYQLVAHKRTHTGEKPYECNECGKAFNRSTQLIRHLQIHTG
570 580 590 600 610 620
680 690 700 710 720 730
pF1KSD EKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCNECGKAFNESSSLIVHLRNHTGEKPY
:::::::::...: ::.:. :.::::::::..:..:::::. ::.:. : : :.:::::
CCDS12 EKPYKCNQCNKAFARSSYLVMHQRTHTGEKPFECSQCGKAFSGSSNLLSHHRIHSGEKPY
630 640 650 660 670 680
740 750 760 770 780 790
pF1KSD KCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGKAFSGHSALLQHQRNHSEEKLN
.:. : :.: ..:.:..:.: :.:::
CCDS12 ECSDCGKSFRQQSQLVVHRRTHTGEKP
690 700 710
>>CCDS60514.1 ZNF33A gene_id:7581|Hs108|chr10 (817 aa)
initn: 1785 init1: 1785 opt: 2101 Z-score: 1278.8 bits: 247.5 E(32554): 6.6e-65
Smith-Waterman score: 2114; 44.0% identity (68.4% similar) in 769 aa overlap (48-790:6-753)
20 30 40 50 60 70
pF1KSD WGMTAVDPWASWALCPQYPAWHVEGSLEEGRRATGLPAAQVQEPVTFKDVAVDFTQEEWG
::..:. . :: :.::::.: ::::::
CCDS60 MANATRRGSGVEQ-KSQESVSFKDVTVGFTQEEWQ
10 20 30
80 90 100 110 120 130
pF1KSD QLDLVQRTLYRDVMLETYGHLLSVGNQIAKPEVISLLEQGEEPWSVEQACPQRTCPEWV-
.:: ::.::::::::.:..:.::: . ::::: :.::::::. :. :... : :.
CCDS60 HLDPSQRALYRDVMLENYSNLVSVGYCVHKPEVIFRLQQGEEPWKQEEEFPSQSFPVWTA
40 50 60 70 80 90
140 150 160 170 180
pF1KSD -----RNLESKA------LIPAQSIFEEEQSHGMKLERYIWDDPWFSRLEVLGCKDQLEM
:. :... .. . .. .::. . . . . . :: : :. :
CCDS60 DHLKERSQENQSKHLWEVVFINNEMLTKEQGDVIGIPFNVDVSSFPSRKMFCQC-DSCGM
100 110 120 130 140 150
190 200 210 220 230
pF1KSD YHMNQSTAMRQMVFMQKQVLSQRSSEF--CG---LGAEF----SQNLNFVPSQRVSQIEH
. ... ..:. . . :...:.:: :: :. . .:. : : ..: . . :
CCDS60 ----SFNTVSELVISKINYLGKKSDEFNACGKLLLNIKHDETHTQEKNEVLKNR-NTLSH
160 170 180 190 200
240 250 260 270 280 290
pF1KSD FYKPDTHAQSWRCDSAIMYADKVTCENNDYDKTVYQSIQPIYPARIQTGD-NLFK---CT
. : . . . :. :... .:.:... : :. .. : : : :
CCDS60 HEETLQHEKIQTLEHNFEYS---ICQETLLEKAVFNT-QKRENAEENNCDYNEFGRTLCD
210 220 230 240 250 260
300 310 320 330 340 350
pF1KSD DAVKSFNHIIHFGDHKGIHTGEKLYEYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYEN
.. :..: :.. ::...:.... . .... :. :. ..:. : :
CCDS60 SSSLLFHQISPSRDNH--------YEFSDCEKFLCVKSTLSK-PH-GVSMKHYDCGESGN
270 280 290 300 310
360 370 380 390 400 410
pF1KSD IFYFSSFMEH-QKIGTVEKAYKYNEWEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIW
: . . : :: :: .. :: :.: : ::.: ..:..::.. ::: .:
CCDS60 NFRRKLCLSHLQKGDKGEKHFECNECGKAFWEKSHLTRHQRVHTGQKPFQCNECEKAFWD
320 330 340 350 360 370
420 430 440 450 460 470
pF1KSD SSYLIQHKKTHTGEKPYECDKCGKVFRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHL
.: : .:...::::::.::..:::.: ..:::: :.::::: :::.:: :::.: .: :
CCDS60 KSNLTKHQRSHTGEKPFECNECGKAFSHKSALTLHQRTHTGEKPYQCNACGKTFCQKSDL
380 390 400 410 420 430
480 490 500 510 520 530
pF1KSD IVHKRIHTGEKPYVCNECGKSFNWNSHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHM
:.: ::: ::: : :::::: .::: ::::::::::::: ::::::: .:.: :.
CCDS60 TKHQRTHTGLKPYECYECGKSFRVTSHLKVHQRTHTGEKPFECLECGKSFSEKSNLTQHQ
440 450 460 470 480 490
540 550 560 570 580 590
pF1KSD RMHTGEKPFKCDECEKAFRDYSALSKHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHT
:.: :.: ..:. : :.: : :..:. :.: :::.: ::::.: .: : .::::::
CCDS60 RIHIGDKSYECNACGKTFYHKSLLTRHQIIHTGWKPYECYECGKTFCLKSDLTVHQRTHT
500 510 520 530 540 550
600 610 620 630 640 650
pF1KSD GEKPYNCQECGKAFRERSALTKHEIIHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKP
:.::. : :::: : ..:.:..: :.: :::::..::: . ..:..:.::::::::
CCDS60 GQKPFACPECGKFFSHKSTLSQHYRTHTGEKPYECHECGKIFYNKSYLTKHNRTHTGEKP
560 570 580 590 600 610
660 670 680 690 700 710
pF1KSD YECNKCGKSFSQSCHLVAHRRIHTGEKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCN
::::.:::.: :. .:. :.::: ::::::::.: ..: .: ::.:.:::: ::::.::
CCDS60 YECNECGKAFYQKSQLTQHQRIHIGEKPYKCNECGKAFCHKSALIVHQRTHTQEKPYKCN
620 630 640 650 660 670
720 730 740 750 760 770
pF1KSD ECGKAFNESSSLIVHLRNHTGEKPYKCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGK
::::.: .:.:: : :.:::::::.::.: : : ..::: .:.: :.::: :.::::
CCDS60 ECGKSFCVKSGLIFHERKHTGEKPYECNECGKFFRHKSSLTVHHRAHTGEKSCQCNECGK
680 690 700 710 720 730
780 790
pF1KSD AFSGHSALLQHQRNHSEEKLN
: .: : ::::.:. ::
CCDS60 IFYRKSELAQHQRSHTGEKPYECNTCRKTFSQKSNLIVHQRRHIGENLMNEMDIRNFQPQ
740 750 760 770 780 790
>>CCDS33097.1 ZNF347 gene_id:84671|Hs108|chr19 (839 aa)
initn: 3358 init1: 1831 opt: 2098 Z-score: 1276.9 bits: 247.2 E(32554): 8.4e-65
Smith-Waterman score: 2109; 43.8% identity (66.9% similar) in 767 aa overlap (56-790:2-763)
30 40 50 60 70 80
pF1KSD WASWALCPQYPAWHVEGSLEEGRRATGLPAAQVQEPVTFKDVAVDFTQEEWGQLDLVQRT
: .: :::.:::..:.:::: :: .:::
CCDS33 MALTQGQVTFRDVAIEFSQEEWTCLDPAQRT
10 20 30
90 100 110 120 130 140
pF1KSD LYRDVMLETYGHLLSVGNQIAKPEVISLLEQGEEPWSVEQACPQRTCP---EWVRNLESK
::::::::.: .: :.: . .::.::::.::...:. : ::. :
CCDS33 LYRDVMLENYRNLASLGISCFDLSIISMLEQGKEPFTLESQVQIAGNPDGWEWI-----K
40 50 60 70 80
150 160 170 180
pF1KSD ALIPAQS---IFEEEQSHGMKLERYIWDDPWFSRLE---VLGCK--------DQLEMYHM
:.: : : .... .: . ... . : : . ::. ::.
CCDS33 AVITALSSEFVMKDLLHKGKSNTGEVFQTVMLERQESQDIEGCSFREVQKNTHGLEYQCR
90 100 110 120 130 140
190 200 210 220 230
pF1KSD NQSTAMRQMVFMQKQVLS-------QRSSEFCGLGAEFSQNL-NFVPSQRVSQIE-HFYK
. .. ... :. :. .:... . ... .: . .: .. : : ..:.
CCDS33 DAEGNYKGVLLTQEGNLTHGRDEHDKRDARNKLIKNQLGLSLQSHLPELQLFQYEGKIYE
150 160 170 180 190 200
240 250 260 270 280 290
pF1KSD PDTHAQSWRCDSAI-----MYADKVTCENNDYDKTVYQSIQPIYPARIQTGDNLFKCTDA
. .:. .:.. : . : .. : : .:. . .. . .: .
CCDS33 CNQVEKSFNNNSSVSPPQQMPYNVKTHISKKYLKDFISSLLLTQGQKANNWGSPYKSNGC
210 220 230 240 250 260
300 310 320 330 340 350
pF1KSD VKSFNHIIHFGDHKGIHTGEKLYEYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYENIF
: . :...:. :: :: :. :: . : ... : .:.::..:. .: ..:
CCDS33 GMVFPQNSHLASHQRSHTKEKPYKCYECGKAFRTRSNLTTHQVIHTGEKRYKCNECGKVF
270 280 290 300 310 320
360 370 380 390 400 410
pF1KSD YFSSFM-EHQKIGTVEKAYKYNEWEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIWSS
.: . .:::: : :: :: :: ::: .: :..: . .:.:::: :::: .: :
CCDS33 SRNSQLSQHQKIHTGEKPYKCNECGKVFTQNSHLVRHRGIHTGEKPYKCNECGKAFRARS
330 340 350 360 370 380
420 430 440 450 460 470
pF1KSD YLIQHKKTHTGEKPYECDKCGKVFRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHLIV
: :. ::.:::::.:..::::: . : ::.: : ::: :::.::.:::::. : : .
CCDS33 SLAIHQATHSGEKPYKCNECGKVFTQNSHLTNHWRIHTGEKPYKCNECGKAFGVRSSLAI
390 400 410 420 430 440
480 490 500 510 520 530
pF1KSD HKRIHTGEKPYVCNECGKSFNWNSHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHMRM
: :::::::: :.:::: : :::: :: ::::::..:.::::.: :.: .:. .
CCDS33 HLVIHTGEKPYKCHECGKVFRRNSHLARHQLIHTGEKPYKCNECGKAFRAHSNLTTHQVI
450 460 470 480 490 500
540 550 560 570 580 590
pF1KSD HTGEKPFKCDECEKAFRDYSALSKHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHTGE
::::::.::.:: :.: . : :..:.: :.:.::: :.::::.:: : : .:: ::::
CCDS33 HTGEKPYKCNECGKVFTQNSHLANHQRIHTGVKPYMCNECGKAFSVYSSLTTHQVIHTGE
510 520 530 540 550 560
600 610 620 630 640 650
pF1KSD KPYNCQECGKAFRERSALTKHEIIHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKPYE
:::.:.::::.: . : :..:. ::.: :::.::.::: . ..: :::: :::::::.
CCDS33 KPYKCNECGKVFTQNSHLARHRGIHTGEKPYKCNECGKVFRHNSYLSRHQRIHTGEKPYK
570 580 590 600 610 620
660 670 680 690 700 710
pF1KSD CNKCGKSFSQSCHLVAHRRIHTGEKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCNEC
:. ::.::. .:..:. :::::::::::.: . :. .::: :::.::: :::.::::
CCDS33 YNEYGKAFSEHSNLTTHQVIHTGEKPYKCNECGKVFTQNSHLARHRRVHTGGKPYQCNEC
630 640 650 660 670 680
720 730 740 750 760 770
pF1KSD GKAFNESSSLIVHLRNHTGEKPYKCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGKAF
::::...:.: : : :::::::.::.: ::: ::: :: .:.:.: . :.::::.:
CCDS33 GKAFSQTSKLARHQRVHTGEKPYECNQCGKAFSVRSSLTTHQAIHTGKKPYKCNECGKVF
690 700 710 720 730 740
780 790
pF1KSD SGHSALLQHQRNHSEEKLN
. .: : .:. :. ::
CCDS33 TQNSHLARHRGIHTGEKPYKCNECGKAFSQTSKLARHQRIHTGEKPYECGKPFSICSSLT
750 760 770 780 790 800
>>CCDS31182.1 ZNF33A gene_id:7581|Hs108|chr10 (810 aa)
initn: 1785 init1: 1785 opt: 2090 Z-score: 1272.2 bits: 246.3 E(32554): 1.5e-64
Smith-Waterman score: 2103; 44.2% identity (68.5% similar) in 758 aa overlap (59-790:9-746)
30 40 50 60 70 80
pF1KSD WALCPQYPAWHVEGSLEEGRRATGLPAAQVQEPVTFKDVAVDFTQEEWGQLDLVQRTLYR
:: :.::::.: :::::: .:: ::.:::
CCDS31 MNKVEQKSQESVSFKDVTVGFTQEEWQHLDPSQRALYR
10 20 30
90 100 110 120 130 140
pF1KSD DVMLETYGHLLSVGNQIAKPEVISLLEQGEEPWSVEQACPQRTCPEWV------RNLESK
:::::.:..:.::: . ::::: :.::::::. :. :... : :. :. :..
CCDS31 DVMLENYSNLVSVGYCVHKPEVIFRLQQGEEPWKQEEEFPSQSFPVWTADHLKERSQENQ
40 50 60 70 80 90
150 160 170 180 190
pF1KSD A------LIPAQSIFEEEQSHGMKLERYIWDDPWFSRLEVLGCKDQLEMYHMNQSTAMRQ
. .. . .. .::. . . . . . :: : :. : . ... .
CCDS31 SKHLWEVVFINNEMLTKEQGDVIGIPFNVDVSSFPSRKMFCQC-DSCGM----SFNTVSE
100 110 120 130 140 150
200 210 220 230 240
pF1KSD MVFMQKQVLSQRSSEF--CG---LGAEF----SQNLNFVPSQRVSQIEHFYKPDTHAQSW
.:. . . :...:.:: :: :. . .:. : : ..: . . : . : .
CCDS31 LVISKINYLGKKSDEFNACGKLLLNIKHDETHTQEKNEVLKNR-NTLSHHEETLQHEKIQ
160 170 180 190 200 210
250 260 270 280 290 300
pF1KSD RCDSAIMYADKVTCENNDYDKTVYQSIQPIYPARIQTGD-NLFK---CTDAVKSFNHIIH
. . :. :... .:.:... : :. .. : : : : .. :..:
CCDS31 TLEHNFEYS---ICQETLLEKAVFNT-QKRENAEENNCDYNEFGRTLCDSSSLLFHQISP
220 230 240 250 260
310 320 330 340 350 360
pF1KSD FGDHKGIHTGEKLYEYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYENIFYFSSFMEH-
:.. ::...:.... . .... :. :. ..:. : : : . . :
CCDS31 SRDNH--------YEFSDCEKFLCVKSTLSK-PH-GVSMKHYDCGESGNNFRRKLCLSHL
270 280 290 300 310
370 380 390 400 410 420
pF1KSD QKIGTVEKAYKYNEWEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIWSSYLIQHKKTH
:: :: .. :: :.: : ::.: ..:..::.. ::: .: .: : .:...:
CCDS31 QKGDKGEKHFECNECGKAFWEKSHLTRHQRVHTGQKPFQCNECEKAFWDKSNLTKHQRSH
320 330 340 350 360 370
430 440 450 460 470 480
pF1KSD TGEKPYECDKCGKVFRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHLIVHKRIHTGEK
:::::.::..:::.: ..:::: :.::::: :::.:: :::.: .: : :.: ::: :
CCDS31 TGEKPFECNECGKAFSHKSALTLHQRTHTGEKPYQCNACGKTFCQKSDLTKHQRTHTGLK
380 390 400 410 420 430
490 500 510 520 530 540
pF1KSD PYVCNECGKSFNWNSHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHMRMHTGEKPFKC
:: : :::::: .::: ::::::::::::: ::::::: .:.: :.:.: :.: ..:
CCDS31 PYECYECGKSFRVTSHLKVHQRTHTGEKPFECLECGKSFSEKSNLTQHQRIHIGDKSYEC
440 450 460 470 480 490
550 560 570 580 590 600
pF1KSD DECEKAFRDYSALSKHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHTGEKPYNCQECG
. : :.: : :..:. :.: :::.: ::::.: .: : .:::::::.::. : :::
CCDS31 NACGKTFYHKSLLTRHQIIHTGWKPYECYECGKTFCLKSDLTVHQRTHTGQKPFACPECG
500 510 520 530 540 550
610 620 630 640 650 660
pF1KSD KAFRERSALTKHEIIHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKPYECNKCGKSFS
: : ..:.:..: :.: :::::..::: . ..:..:.::::::::::::.:::.:
CCDS31 KFFSHKSTLSQHYRTHTGEKPYECHECGKIFYNKSYLTKHNRTHTGEKPYECNECGKAFY
560 570 580 590 600 610
670 680 690 700 710 720
pF1KSD QSCHLVAHRRIHTGEKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCNECGKAFNESSS
:. .:. :.::: ::::::::.: ..: .: ::.:.:::: ::::.::::::.: .:.
CCDS31 QKSQLTQHQRIHIGEKPYKCNECGKAFCHKSALIVHQRTHTQEKPYKCNECGKSFCVKSG
620 630 640 650 660 670
730 740 750 760 770 780
pF1KSD LIVHLRNHTGEKPYKCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGKAFSGHSALLQH
:: : :.:::::::.::.: : : ..::: .:.: :.::: :.:::: : .: : ::
CCDS31 LIFHERKHTGEKPYECNECGKFFRHKSSLTVHHRAHTGEKSCQCNECGKIFYRKSELAQH
680 690 700 710 720 730
790
pF1KSD QRNHSEEKLN
::.:. ::
CCDS31 QRSHTGEKPYECNTCRKTFSQKSNLIVHQRRHIGENLMNEMDIRNFQPQVSLHNASEYSH
740 750 760 770 780 790
>>CCDS44372.1 ZNF33A gene_id:7581|Hs108|chr10 (811 aa)
initn: 1785 init1: 1785 opt: 2087 Z-score: 1270.4 bits: 245.9 E(32554): 1.9e-64
Smith-Waterman score: 2100; 44.3% identity (68.5% similar) in 759 aa overlap (59-790:9-747)
30 40 50 60 70 80
pF1KSD WALCPQYPAWHVEGSLEEGRRATGLPAAQVQEPVTFKDVAVDFTQEEWGQLDLVQRTLYR
:: :.::::.: :::::: .:: ::.:::
CCDS44 MNKVEQKSQESVSFKDVTVGFTQEEWQHLDPSQRALYR
10 20 30
90 100 110 120 130 140
pF1KSD DVMLETYGHLLSVGNQIAKPEVISLLEQGEEPWSVEQACPQRTCPE-WV------RNLES
:::::.:..:.::: . ::::: :.::::::. :. :... :: :. :. :.
CCDS44 DVMLENYSNLVSVGYCVHKPEVIFRLQQGEEPWKQEEEFPSQSFPEVWTADHLKERSQEN
40 50 60 70 80 90
150 160 170 180 190
pF1KSD KA------LIPAQSIFEEEQSHGMKLERYIWDDPWFSRLEVLGCKDQLEMYHMNQSTAMR
.. .. . .. .::. . . . . . :: : :. : . ...
CCDS44 QSKHLWEVVFINNEMLTKEQGDVIGIPFNVDVSSFPSRKMFCQC-DSCGM----SFNTVS
100 110 120 130 140 150
200 210 220 230 240
pF1KSD QMVFMQKQVLSQRSSEF--CG---LGAEF----SQNLNFVPSQRVSQIEHFYKPDTHAQS
..:. . . :...:.:: :: :. . .:. : : ..: . . : . : .
CCDS44 ELVISKINYLGKKSDEFNACGKLLLNIKHDETHTQEKNEVLKNR-NTLSHHEETLQHEKI
160 170 180 190 200 210
250 260 270 280 290 300
pF1KSD WRCDSAIMYADKVTCENNDYDKTVYQSIQPIYPARIQTGD-NLFK---CTDAVKSFNHII
. . :. :... .:.:... : :. .. : : : : .. :..:
CCDS44 QTLEHNFEYS---ICQETLLEKAVFNT-QKRENAEENNCDYNEFGRTLCDSSSLLFHQIS
220 230 240 250 260
310 320 330 340 350 360
pF1KSD HFGDHKGIHTGEKLYEYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYENIFYFSSFMEH
:.. ::...:.... . .... :. :. ..:. : : : . . :
CCDS44 PSRDNH--------YEFSDCEKFLCVKSTLSK-PH-GVSMKHYDCGESGNNFRRKLCLSH
270 280 290 300 310
370 380 390 400 410 420
pF1KSD -QKIGTVEKAYKYNEWEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIWSSYLIQHKKT
:: :: .. :: :.: : ::.: ..:..::.. ::: .: .: : .:...
CCDS44 LQKGDKGEKHFECNECGKAFWEKSHLTRHQRVHTGQKPFQCNECEKAFWDKSNLTKHQRS
320 330 340 350 360 370
430 440 450 460 470 480
pF1KSD HTGEKPYECDKCGKVFRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHLIVHKRIHTGE
::::::.::..:::.: ..:::: :.::::: :::.:: :::.: .: : :.: :::
CCDS44 HTGEKPFECNECGKAFSHKSALTLHQRTHTGEKPYQCNACGKTFCQKSDLTKHQRTHTGL
380 390 400 410 420 430
490 500 510 520 530 540
pF1KSD KPYVCNECGKSFNWNSHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHMRMHTGEKPFK
::: : :::::: .::: ::::::::::::: ::::::: .:.: :.:.: :.: ..
CCDS44 KPYECYECGKSFRVTSHLKVHQRTHTGEKPFECLECGKSFSEKSNLTQHQRIHIGDKSYE
440 450 460 470 480 490
550 560 570 580 590 600
pF1KSD CDECEKAFRDYSALSKHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHTGEKPYNCQEC
:. : :.: : :..:. :.: :::.: ::::.: .: : .:::::::.::. : ::
CCDS44 CNACGKTFYHKSLLTRHQIIHTGWKPYECYECGKTFCLKSDLTVHQRTHTGQKPFACPEC
500 510 520 530 540 550
610 620 630 640 650 660
pF1KSD GKAFRERSALTKHEIIHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKPYECNKCGKSF
:: : ..:.:..: :.: :::::..::: . ..:..:.::::::::::::.:::.:
CCDS44 GKFFSHKSTLSQHYRTHTGEKPYECHECGKIFYNKSYLTKHNRTHTGEKPYECNECGKAF
560 570 580 590 600 610
670 680 690 700 710 720
pF1KSD SQSCHLVAHRRIHTGEKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCNECGKAFNESS
:. .:. :.::: ::::::::.: ..: .: ::.:.:::: ::::.::::::.: .:
CCDS44 YQKSQLTQHQRIHIGEKPYKCNECGKAFCHKSALIVHQRTHTQEKPYKCNECGKSFCVKS
620 630 640 650 660 670
730 740 750 760 770 780
pF1KSD SLIVHLRNHTGEKPYKCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGKAFSGHSALLQ
.:: : :.:::::::.::.: : : ..::: .:.: :.::: :.:::: : .: : :
CCDS44 GLIFHERKHTGEKPYECNECGKFFRHKSSLTVHHRAHTGEKSCQCNECGKIFYRKSELAQ
680 690 700 710 720 730
790
pF1KSD HQRNHSEEKLN
:::.:. ::
CCDS44 HQRSHTGEKPYECNTCRKTFSQKSNLIVHQRRHIGENLMNEMDIRNFQPQVSLHNASEYS
740 750 760 770 780 790
>>CCDS73088.1 ZNF33A gene_id:7581|Hs108|chr10 (829 aa)
initn: 1785 init1: 1785 opt: 2087 Z-score: 1270.4 bits: 246.0 E(32554): 1.9e-64
Smith-Waterman score: 2100; 44.3% identity (68.5% similar) in 759 aa overlap (59-790:27-765)
30 40 50 60 70 80
pF1KSD WALCPQYPAWHVEGSLEEGRRATGLPAAQVQEPVTFKDVAVDFTQEEWGQLDLVQRTLYR
:: :.::::.: :::::: .:: ::.:::
CCDS73 MCPRGYPEQSNWMSSPLYSTEVEQKSQESVSFKDVTVGFTQEEWQHLDPSQRALYR
10 20 30 40 50
90 100 110 120 130 140
pF1KSD DVMLETYGHLLSVGNQIAKPEVISLLEQGEEPWSVEQACPQRTCPE-WV------RNLES
:::::.:..:.::: . ::::: :.::::::. :. :... :: :. :. :.
CCDS73 DVMLENYSNLVSVGYCVHKPEVIFRLQQGEEPWKQEEEFPSQSFPEVWTADHLKERSQEN
60 70 80 90 100 110
150 160 170 180 190
pF1KSD KA------LIPAQSIFEEEQSHGMKLERYIWDDPWFSRLEVLGCKDQLEMYHMNQSTAMR
.. .. . .. .::. . . . . . :: : :. : . ...
CCDS73 QSKHLWEVVFINNEMLTKEQGDVIGIPFNVDVSSFPSRKMFCQC-DSCGM----SFNTVS
120 130 140 150 160 170
200 210 220 230 240
pF1KSD QMVFMQKQVLSQRSSEF--CG---LGAEF----SQNLNFVPSQRVSQIEHFYKPDTHAQS
..:. . . :...:.:: :: :. . .:. : : ..: . . : . : .
CCDS73 ELVISKINYLGKKSDEFNACGKLLLNIKHDETHTQEKNEVLKNR-NTLSHHEETLQHEKI
180 190 200 210 220 230
250 260 270 280 290 300
pF1KSD WRCDSAIMYADKVTCENNDYDKTVYQSIQPIYPARIQTGD-NLFK---CTDAVKSFNHII
. . :. :... .:.:... : :. .. : : : : .. :..:
CCDS73 QTLEHNFEYS---ICQETLLEKAVFNT-QKRENAEENNCDYNEFGRTLCDSSSLLFHQIS
240 250 260 270 280
310 320 330 340 350 360
pF1KSD HFGDHKGIHTGEKLYEYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYENIFYFSSFMEH
:.. ::...:.... . .... :. :. ..:. : : : . . :
CCDS73 PSRDNH--------YEFSDCEKFLCVKSTLSK-PH-GVSMKHYDCGESGNNFRRKLCLSH
290 300 310 320 330
370 380 390 400 410 420
pF1KSD -QKIGTVEKAYKYNEWEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIWSSYLIQHKKT
:: :: .. :: :.: : ::.: ..:..::.. ::: .: .: : .:...
CCDS73 LQKGDKGEKHFECNECGKAFWEKSHLTRHQRVHTGQKPFQCNECEKAFWDKSNLTKHQRS
340 350 360 370 380 390
430 440 450 460 470 480
pF1KSD HTGEKPYECDKCGKVFRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHLIVHKRIHTGE
::::::.::..:::.: ..:::: :.::::: :::.:: :::.: .: : :.: :::
CCDS73 HTGEKPFECNECGKAFSHKSALTLHQRTHTGEKPYQCNACGKTFCQKSDLTKHQRTHTGL
400 410 420 430 440 450
490 500 510 520 530 540
pF1KSD KPYVCNECGKSFNWNSHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHMRMHTGEKPFK
::: : :::::: .::: ::::::::::::: ::::::: .:.: :.:.: :.: ..
CCDS73 KPYECYECGKSFRVTSHLKVHQRTHTGEKPFECLECGKSFSEKSNLTQHQRIHIGDKSYE
460 470 480 490 500 510
550 560 570 580 590 600
pF1KSD CDECEKAFRDYSALSKHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHTGEKPYNCQEC
:. : :.: : :..:. :.: :::.: ::::.: .: : .:::::::.::. : ::
CCDS73 CNACGKTFYHKSLLTRHQIIHTGWKPYECYECGKTFCLKSDLTVHQRTHTGQKPFACPEC
520 530 540 550 560 570
610 620 630 640 650 660
pF1KSD GKAFRERSALTKHEIIHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKPYECNKCGKSF
:: : ..:.:..: :.: :::::..::: . ..:..:.::::::::::::.:::.:
CCDS73 GKFFSHKSTLSQHYRTHTGEKPYECHECGKIFYNKSYLTKHNRTHTGEKPYECNECGKAF
580 590 600 610 620 630
670 680 690 700 710 720
pF1KSD SQSCHLVAHRRIHTGEKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCNECGKAFNESS
:. .:. :.::: ::::::::.: ..: .: ::.:.:::: ::::.::::::.: .:
CCDS73 YQKSQLTQHQRIHIGEKPYKCNECGKAFCHKSALIVHQRTHTQEKPYKCNECGKSFCVKS
640 650 660 670 680 690
730 740 750 760 770 780
pF1KSD SLIVHLRNHTGEKPYKCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGKAFSGHSALLQ
.:: : :.:::::::.::.: : : ..::: .:.: :.::: :.:::: : .: : :
CCDS73 GLIFHERKHTGEKPYECNECGKFFRHKSSLTVHHRAHTGEKSCQCNECGKIFYRKSELAQ
700 710 720 730 740 750
790
pF1KSD HQRNHSEEKLN
:::.:. ::
CCDS73 HQRSHTGEKPYECNTCRKTFSQKSNLIVHQRRHIGENLMNEMDIRNFQPQVSLHNASEYS
760 770 780 790 800 810
>>CCDS54314.1 ZNF347 gene_id:84671|Hs108|chr19 (840 aa)
initn: 3358 init1: 1831 opt: 2086 Z-score: 1269.7 bits: 245.9 E(32554): 2.1e-64
Smith-Waterman score: 2097; 43.8% identity (66.8% similar) in 768 aa overlap (56-790:2-764)
30 40 50 60 70 80
pF1KSD WASWALCPQYPAWHVEGSLEEGRRATGLPAAQVQEPVTFKDVAVDFTQEEWGQLDLVQRT
: .: :::.:::..:.:::: :: .:::
CCDS54 MALTQGQVTFRDVAIEFSQEEWTCLDPAQRT
10 20 30
90 100 110 120 130 140
pF1KSD LYRDVMLETYGHLLSV-GNQIAKPEVISLLEQGEEPWSVEQACPQRTCP---EWVRNLES
::::::::.: .: :. : . .::.::::.::...:. : ::.
CCDS54 LYRDVMLENYRNLASLAGISCFDLSIISMLEQGKEPFTLESQVQIAGNPDGWEWI-----
40 50 60 70 80
150 160 170 180
pF1KSD KALIPAQS---IFEEEQSHGMKLERYIWDDPWFSRLE---VLGCK--------DQLEMYH
::.: : : .... .: . ... . : : . ::. ::.
CCDS54 KAVITALSSEFVMKDLLHKGKSNTGEVFQTVMLERQESQDIEGCSFREVQKNTHGLEYQC
90 100 110 120 130 140
190 200 210 220 230
pF1KSD MNQSTAMRQMVFMQKQVLS-------QRSSEFCGLGAEFSQNL-NFVPSQRVSQIE-HFY
. .. ... :. :. .:... . ... .: . .: .. : : ..:
CCDS54 RDAEGNYKGVLLTQEGNLTHGRDEHDKRDARNKLIKNQLGLSLQSHLPELQLFQYEGKIY
150 160 170 180 190 200
240 250 260 270 280 290
pF1KSD KPDTHAQSWRCDSAI-----MYADKVTCENNDYDKTVYQSIQPIYPARIQTGDNLFKCTD
. . .:. .:.. : . : .. : : .:. . .. . .: .
CCDS54 ECNQVEKSFNNNSSVSPPQQMPYNVKTHISKKYLKDFISSLLLTQGQKANNWGSPYKSNG
210 220 230 240 250 260
300 310 320 330 340 350
pF1KSD AVKSFNHIIHFGDHKGIHTGEKLYEYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYENI
: . :...:. :: :: :. :: . : ... : .:.::..:. .: ..
CCDS54 CGMVFPQNSHLASHQRSHTKEKPYKCYECGKAFRTRSNLTTHQVIHTGEKRYKCNECGKV
270 280 290 300 310 320
360 370 380 390 400 410
pF1KSD FYFSSFM-EHQKIGTVEKAYKYNEWEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIWS
: .: . .:::: : :: :: :: ::: .: :..: . .:.:::: :::: .:
CCDS54 FSRNSQLSQHQKIHTGEKPYKCNECGKVFTQNSHLVRHRGIHTGEKPYKCNECGKAFRAR
330 340 350 360 370 380
420 430 440 450 460 470
pF1KSD SYLIQHKKTHTGEKPYECDKCGKVFRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHLI
: : :. ::.:::::.:..::::: . : ::.: : ::: :::.::.:::::. : :
CCDS54 SSLAIHQATHSGEKPYKCNECGKVFTQNSHLTNHWRIHTGEKPYKCNECGKAFGVRSSLA
390 400 410 420 430 440
480 490 500 510 520 530
pF1KSD VHKRIHTGEKPYVCNECGKSFNWNSHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHMR
.: :::::::: :.:::: : :::: :: ::::::..:.::::.: :.: .:.
CCDS54 IHLVIHTGEKPYKCHECGKVFRRNSHLARHQLIHTGEKPYKCNECGKAFRAHSNLTTHQV
450 460 470 480 490 500
540 550 560 570 580 590
pF1KSD MHTGEKPFKCDECEKAFRDYSALSKHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHTG
.::::::.::.:: :.: . : :..:.: :.:.::: :.::::.:: : : .:: :::
CCDS54 IHTGEKPYKCNECGKVFTQNSHLANHQRIHTGVKPYMCNECGKAFSVYSSLTTHQVIHTG
510 520 530 540 550 560
600 610 620 630 640 650
pF1KSD EKPYNCQECGKAFRERSALTKHEIIHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKPY
::::.:.::::.: . : :..:. ::.: :::.::.::: . ..: :::: :::::::
CCDS54 EKPYKCNECGKVFTQNSHLARHRGIHTGEKPYKCNECGKVFRHNSYLSRHQRIHTGEKPY
570 580 590 600 610 620
660 670 680 690 700 710
pF1KSD ECNKCGKSFSQSCHLVAHRRIHTGEKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCNE
. :. ::.::. .:..:. :::::::::::.: . :. .::: :::.::: :::.:::
CCDS54 KYNEYGKAFSEHSNLTTHQVIHTGEKPYKCNECGKVFTQNSHLARHRRVHTGGKPYQCNE
630 640 650 660 670 680
720 730 740 750 760 770
pF1KSD CGKAFNESSSLIVHLRNHTGEKPYKCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGKA
:::::...:.: : : :::::::.::.: ::: ::: :: .:.:.: . :.::::.
CCDS54 CGKAFSQTSKLARHQRVHTGEKPYECNQCGKAFSVRSSLTTHQAIHTGKKPYKCNECGKV
690 700 710 720 730 740
780 790
pF1KSD FSGHSALLQHQRNHSEEKLN
:. .: : .:. :. ::
CCDS54 FTQNSHLARHRGIHTGEKPYKCNECGKAFSQTSKLARHQRIHTGEKPYECGKPFSICSSL
750 760 770 780 790 800
792 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 07:30:01 2016 done: Thu Nov 3 07:30:02 2016
Total Scan time: 3.770 Total Display time: 0.330
Function used was FASTA [36.3.4 Apr, 2011]