FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB0424, 839 aa
1>>>pF1KB0424 839 - 839 aa - 839 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.9115+/-0.00163; mu= 15.1157+/- 0.097
mean_var=272.8975+/-50.684, 0's: 0 Z-trim(108.4): 934 B-trim: 0 in 0/51
Lambda= 0.077638
statistics sampled from 9178 (10204) to 9178 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.651), E-opt: 0.2 (0.313), width: 16
Scan time: 3.670
The best scores are: opt bits E(32554)
CCDS5667.1 ZKSCAN5 gene_id:23660|Hs108|chr7 ( 839) 5862 671.6 1.5e-192
CCDS33097.1 ZNF347 gene_id:84671|Hs108|chr19 ( 839) 1553 189.0 3e-47
CCDS54314.1 ZNF347 gene_id:84671|Hs108|chr19 ( 840) 1553 189.0 3e-47
CCDS31940.1 ZNF84 gene_id:7637|Hs108|chr12 ( 738) 1546 188.1 4.8e-47
CCDS12498.1 ZNF420 gene_id:147923|Hs108|chr19 ( 688) 1527 185.9 2e-46
CCDS33122.1 ZNF470 gene_id:388566|Hs108|chr19 ( 717) 1509 183.9 8.3e-46
CCDS74350.1 ZNF850 gene_id:342892|Hs108|chr19 (1058) 1499 183.1 2.2e-45
CCDS59379.1 ZNF850 gene_id:342892|Hs108|chr19 (1090) 1499 183.1 2.3e-45
CCDS62706.1 ZNF229 gene_id:7772|Hs108|chr19 ( 819) 1481 180.9 7.9e-45
CCDS42574.1 ZNF229 gene_id:7772|Hs108|chr19 ( 825) 1481 180.9 7.9e-45
CCDS46044.1 ZNF30 gene_id:90075|Hs108|chr19 ( 624) 1473 179.8 1.3e-44
CCDS74322.1 ZNF91 gene_id:7644|Hs108|chr19 (1159) 1464 179.2 3.5e-44
CCDS42541.1 ZNF91 gene_id:7644|Hs108|chr19 (1191) 1464 179.2 3.6e-44
CCDS59372.1 ZNF726 gene_id:730087|Hs108|chr19 ( 616) 1438 175.9 1.9e-43
CCDS74388.1 ZNF227 gene_id:7770|Hs108|chr19 ( 748) 1433 175.5 3.1e-43
CCDS12636.1 ZNF227 gene_id:7770|Hs108|chr19 ( 799) 1433 175.5 3.2e-43
CCDS11180.1 ZNF624 gene_id:57547|Hs108|chr17 ( 865) 1429 175.1 4.6e-43
CCDS75846.1 ZNF658 gene_id:26149|Hs108|chr9 (1059) 1428 175.1 5.5e-43
CCDS77297.1 ZNF546 gene_id:339327|Hs108|chr19 ( 810) 1426 174.7 5.6e-43
CCDS12548.1 ZNF546 gene_id:339327|Hs108|chr19 ( 836) 1426 174.7 5.7e-43
CCDS46212.1 ZNF814 gene_id:730051|Hs108|chr19 ( 855) 1421 174.2 8.5e-43
CCDS33046.1 ZNF224 gene_id:7767|Hs108|chr19 ( 707) 1417 173.6 1e-42
CCDS12856.1 ZNF600 gene_id:162966|Hs108|chr19 ( 722) 1410 172.9 1.8e-42
CCDS12414.2 ZNF681 gene_id:148213|Hs108|chr19 ( 645) 1407 172.4 2.2e-42
CCDS59369.1 ZNF99 gene_id:7652|Hs108|chr19 ( 864) 1394 171.2 6.9e-42
CCDS46100.1 ZNF225 gene_id:7768|Hs108|chr19 ( 706) 1388 170.4 9.9e-42
CCDS12499.1 ZNF585A gene_id:199704|Hs108|chr19 ( 714) 1376 169.0 2.5e-41
CCDS74353.1 ZNF585A gene_id:199704|Hs108|chr19 ( 769) 1376 169.1 2.6e-41
CCDS33093.2 ZNF28 gene_id:7576|Hs108|chr19 ( 718) 1371 168.5 3.7e-41
CCDS12500.1 ZNF585B gene_id:92285|Hs108|chr19 ( 769) 1363 167.6 7.2e-41
CCDS46077.1 ZNF780B gene_id:163131|Hs108|chr19 ( 833) 1363 167.7 7.5e-41
CCDS12632.1 ZNF45 gene_id:7596|Hs108|chr19 ( 682) 1351 166.2 1.7e-40
CCDS46162.1 ZNF836 gene_id:162962|Hs108|chr19 ( 936) 1353 166.6 1.7e-40
CCDS12412.1 ZNF493 gene_id:284443|Hs108|chr19 ( 646) 1336 164.5 5.4e-40
CCDS42536.1 ZNF493 gene_id:284443|Hs108|chr19 ( 774) 1336 164.6 5.9e-40
CCDS59368.1 ZNF729 gene_id:100287226|Hs108|chr19 (1252) 1338 165.2 6.5e-40
CCDS45012.1 ZNF268 gene_id:10795|Hs108|chr12 ( 947) 1330 164.1 1e-39
CCDS6437.1 ZNF16 gene_id:7564|Hs108|chr8 ( 682) 1325 163.3 1.3e-39
CCDS12846.1 ZNF615 gene_id:284370|Hs108|chr19 ( 731) 1321 162.9 1.8e-39
CCDS82387.1 ZNF615 gene_id:284370|Hs108|chr19 ( 736) 1321 162.9 1.8e-39
CCDS59418.1 ZNF615 gene_id:284370|Hs108|chr19 ( 742) 1321 162.9 1.8e-39
CCDS32983.1 ZNF254 gene_id:9534|Hs108|chr19 ( 659) 1297 160.1 1.1e-38
CCDS12848.1 ZNF432 gene_id:9668|Hs108|chr19 ( 652) 1294 159.8 1.4e-38
CCDS12945.1 ZNF471 gene_id:57573|Hs108|chr19 ( 626) 1282 158.4 3.5e-38
CCDS46167.1 ZNF808 gene_id:388558|Hs108|chr19 ( 903) 1282 158.7 4.2e-38
CCDS12966.1 ZNF256 gene_id:10172|Hs108|chr19 ( 627) 1270 157.1 8.9e-38
CCDS14279.1 ZNF41 gene_id:7592|Hs108|chrX ( 779) 1267 156.9 1.3e-37
CCDS12273.1 ZNF791 gene_id:163049|Hs108|chr19 ( 576) 1261 156.0 1.7e-37
CCDS12980.1 ZNF132 gene_id:7691|Hs108|chr19 ( 706) 1254 155.4 3.3e-37
CCDS7198.1 ZNF33B gene_id:7582|Hs108|chr10 ( 778) 1248 154.8 5.5e-37
>>CCDS5667.1 ZKSCAN5 gene_id:23660|Hs108|chr7 (839 aa)
initn: 5862 init1: 5862 opt: 5862 Z-score: 3570.2 bits: 671.6 E(32554): 1.5e-192
Smith-Waterman score: 5862; 99.9% identity (99.9% similar) in 839 aa overlap (1-839:1-839)
10 20 30 40 50 60
pF1KB0 MIMTESREVIDLDPPAETSQEQEDLFIVKVEEEDCTWMQEYNPPTFETFYQRFRHFQYHE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 MIMTESREVIDLDPPAETSQEQEDLFIVKVEEEDCTWMQEYNPPTFETFYQRFRHFQYHE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB0 ASGPREALSQLRVLCCEWLRPELHTKEQILELLVLEQFLTILPEEFQPWVREHHPESGEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 ASGPREALSQLRVLCCEWLRPELHTKEQILELLVLEQFLTILPEEFQPWVREHHPESGEE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB0 AVAVIENIQRELEERRQQIVACPDVLPRKMATPGAVQESCSPHPLTVDTQPEQAPQKPRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 AVAVIENIQRELEERRQQIVACPDVLPRKMATPGAVQESCSPHPLTVDTQPEQAPQKPRL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB0 LEENALPVLQVPSLPLKDSQELTASLLSTGSQKLVKIEEVADVAVSFILEEWGHLDQSQK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 LEENALPVLQVPSLPLKDSQELTASLLSTGSQKLVKIEEVADVAVSFILEEWGHLDQSQK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB0 SLYRDDRKENYGSITSMGYESRDNMELIVKQISDDSESHWVAPEHTERSVPQDPDFAEVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 SLYRDDRKENYGSITSMGYESRDNMELIVKQISDDSESHWVAPEHTERSVPQDPDFAEVS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB0 DLKGMVQRWQVNPTVGKSRQNPSQKRDLDAITDISPKQSTHGERGHRCSDCGKFFLQASN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 DLKGMVQRWQVNPTVGKSRQNPSQKRDLDAITDISPKQSTHGERGHRCSDCGKFFLQASN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB0 FIQHRRIHTGEKPFKCGECGKSYNQRVHLTQHQRVHTGEKPYKCQVCGKAFRVSSHLVQH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 FIQHRRIHTGEKPFKCGECGKSYNQRVHLTQHQRVHTGEKPYKCQVCGKAFRVSSHLVQH
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB0 HSVHSGERPYGCNECGKNFGRHSHLIEHLKRHFREKSQRCSDKRSKNTKLSVKKKISEYS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 HSVHSGERPYGCNECGKNFGRHSHLIEHLKRHFREKSQRCSDKRSKNTKLSVKKKISEYS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB0 EADMELSGKTQRNVSQVQDFGEGCEFQGKLDRKQGIPMKEILGQPSSKRMNYSEVPYVHK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 EADMELSGKTQRNVSQVQDFGEGCEFQGKLDRKQGIPMKEILGQPSSKRMNYSEVPYVHK
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB0 KSSTGERPHKCNECGKSFIQSAHLIQHQRIHTGEKPFRCEECGKSYNQRVHLTQHQRVHT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 KSSTGERPHKCNECGKSFIQSAHLIQHQRIHTGEKPFRCEECGKSYNQRVHLTQHQRVHT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB0 GEKPYTCPLCGKAFRVRSHLVQHQSVHSGERPFKCNECGKGFGRRSHLAGHLRLHSREKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 GEKPYTCPLCGKAFRVRSHLVQHQSVHSGERPFKCNECGKGFGRRSHLAGHLRLHSREKS
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB0 HQCRECGEIFFQYVSLIEHQVLHMGQKNEKNGICEEAYSWNLTVIEDKKIELQEQPYQCD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 HQCRECGEIFFQYVSLIEHQVLHMGQKNEKNGICEEAYSWNLTVIEDKKIELQEQPYQCD
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB0 ICGKAFGYSSDLIQHYRTHTAEKPYQCDICRENVGQCSHTKQHQKIYSSTKSHQCHECGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 ICGKAFGYSSDLIQHYRTHTAEKPYQCDICRENVGQCSHTKQHQKIYSSTKSHQCHECGR
730 740 750 760 770 780
790 800 810 820 830
pF1KB0 GFTLKSHLNQHQGIHTGEKPFQCKECGMNFSWSCSLFKHLRSHERTDPINTLSVEGSLL
:::::::::::: ::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 GFTLKSHLNQHQRIHTGEKPFQCKECGMNFSWSCSLFKHLRSHERTDPINTLSVEGSLL
790 800 810 820 830
>>CCDS33097.1 ZNF347 gene_id:84671|Hs108|chr19 (839 aa)
initn: 4871 init1: 1045 opt: 1553 Z-score: 961.8 bits: 189.0 E(32554): 3e-47
Smith-Waterman score: 1553; 43.3% identity (69.0% similar) in 504 aa overlap (332-828:302-792)
310 320 330 340 350 360
pF1KB0 LKGMVQRWQVNPTVGKSRQNPSQKRDLDAITDISPKQSTH-GERGHRCSDCGKFFLQASN
.... .: : ::. ..:..::: : . :.
CCDS33 QNSHLASHQRSHTKEKPYKCYECGKAFRTRSNLTTHQVIHTGEKRYKCNECGKVFSRNSQ
280 290 300 310 320 330
370 380 390 400 410 420
pF1KB0 FIQHRRIHTGEKPFKCGECGKSYNQRVHLTQHQRVHTGEKPYKCQVCGKAFRVSSHLVQH
. ::..:::::::.::.:::: ..: ::..:. .:::::::::. ::::::. : :. :
CCDS33 LSQHQKIHTGEKPYKCNECGKVFTQNSHLVRHRGIHTGEKPYKCNECGKAFRARSSLAIH
340 350 360 370 380 390
430 440 450 460 470 480
pF1KB0 HSVHSGERPYGCNECGKNFGRHSHLIEHLKRHFREKSQRCSDKRSKNTKLSVKKKISEYS
...::::.:: :::::: : ..::: .: . : :: .:.. : .. :
CCDS33 QATHSGEKPYKCNECGKVFTQNSHLTNHWRIHTGEKPYKCNE---------CGKAFGVRS
400 410 420 430 440
490 500 510 520 530
pF1KB0 EADMELSGKTQRNVSQVQDFGEGCEFQGKLDRKQGI-----PMK-EILGQPSSKRMNYSE
..: .: .. . .. :. . ...: :.: : :.: . :. . : .
CCDS33 SLAIHLVIHTGEKPYKCHECGKVFRRNSHLARHQLIHTGEKPYKCNECGKAFRAHSNLTT
450 460 470 480 490 500
540 550 560 570 580 590
pF1KB0 VPYVHKKSSTGERPHKCNECGKSFIQSAHLIQHQRIHTGEKPFRCEECGKSYNQRVHLTQ
.: :::.:.::::::: : :..:: .::::::: ::. :.::::... ::
CCDS33 HQVIH----TGEKPYKCNECGKVFTQNSHLANHQRIHTGVKPYMCNECGKAFSVYSSLTT
510 520 530 540 550
600 610 620 630 640 650
pF1KB0 HQRVHTGEKPYTCPLCGKAFRVRSHLVQHQSVHSGERPFKCNECGKGFGRRSHLAGHLRL
:: .::::::: : :::.: :::..:...:.::.:.::::::: : . :.:. : :.
CCDS33 HQVIHTGEKPYKCNECGKVFTQNSHLARHRGIHTGEKPYKCNECGKVFRHNSYLSRHQRI
560 570 580 590 600 610
660 670 680 690 700 710
pF1KB0 HSREKSHQCRECGEIFFQYVSLIEHQVLHMGQKNEKNGICEEAYSWNLTVIEDKKIELQE
:. :: .. : :. : .. .: :::.: :.: : . : .... : . . ....
CCDS33 HTGEKPYKYNEYGKAFSEHSNLTTHQVIHTGEKPYKCNECGKVFTQNSHLARHRRVHTGG
620 630 640 650 660 670
720 730 740 750 760 770
pF1KB0 QPYQCDICGKAFGYSSDLIQHYRTHTAEKPYQCDICRENVGQCSHTKQHQKIYSSTKSHQ
.::::. :::::. .: : .: :.::.::::.:. : . . : :: :... : ..
CCDS33 KPYQCNECGKAFSQTSKLARHQRVHTGEKPYECNQCGKAFSVRSSLTTHQAIHTGKKPYK
680 690 700 710 720 730
780 790 800 810 820 830
pF1KB0 CHECGRGFTLKSHLNQHQGIHTGEKPFQCKECGMNFSWSCSLFKHLRSHERTDPINTLSV
:.:::. :: .::: .:.::::::::..:.::: :: . .: .: : : :
CCDS33 CNECGKVFTQNSHLARHRGIHTGEKPYKCNECGKAFSQTSKLARHQRIHTGEKPYECGKP
740 750 760 770 780 790
pF1KB0 EGSLL
CCDS33 FSICSSLTTHQTIHTGGKPYKCNVWKVLKSEFKPCKPSQNS
800 810 820 830
>>CCDS54314.1 ZNF347 gene_id:84671|Hs108|chr19 (840 aa)
initn: 4871 init1: 1045 opt: 1553 Z-score: 961.8 bits: 189.0 E(32554): 3e-47
Smith-Waterman score: 1553; 43.3% identity (69.0% similar) in 504 aa overlap (332-828:303-793)
310 320 330 340 350 360
pF1KB0 LKGMVQRWQVNPTVGKSRQNPSQKRDLDAITDISPKQSTH-GERGHRCSDCGKFFLQASN
.... .: : ::. ..:..::: : . :.
CCDS54 QNSHLASHQRSHTKEKPYKCYECGKAFRTRSNLTTHQVIHTGEKRYKCNECGKVFSRNSQ
280 290 300 310 320 330
370 380 390 400 410 420
pF1KB0 FIQHRRIHTGEKPFKCGECGKSYNQRVHLTQHQRVHTGEKPYKCQVCGKAFRVSSHLVQH
. ::..:::::::.::.:::: ..: ::..:. .:::::::::. ::::::. : :. :
CCDS54 LSQHQKIHTGEKPYKCNECGKVFTQNSHLVRHRGIHTGEKPYKCNECGKAFRARSSLAIH
340 350 360 370 380 390
430 440 450 460 470 480
pF1KB0 HSVHSGERPYGCNECGKNFGRHSHLIEHLKRHFREKSQRCSDKRSKNTKLSVKKKISEYS
...::::.:: :::::: : ..::: .: . : :: .:.. : .. :
CCDS54 QATHSGEKPYKCNECGKVFTQNSHLTNHWRIHTGEKPYKCNE---------CGKAFGVRS
400 410 420 430 440
490 500 510 520 530
pF1KB0 EADMELSGKTQRNVSQVQDFGEGCEFQGKLDRKQGI-----PMK-EILGQPSSKRMNYSE
..: .: .. . .. :. . ...: :.: : :.: . :. . : .
CCDS54 SLAIHLVIHTGEKPYKCHECGKVFRRNSHLARHQLIHTGEKPYKCNECGKAFRAHSNLTT
450 460 470 480 490 500
540 550 560 570 580 590
pF1KB0 VPYVHKKSSTGERPHKCNECGKSFIQSAHLIQHQRIHTGEKPFRCEECGKSYNQRVHLTQ
.: :::.:.::::::: : :..:: .::::::: ::. :.::::... ::
CCDS54 HQVIH----TGEKPYKCNECGKVFTQNSHLANHQRIHTGVKPYMCNECGKAFSVYSSLTT
510 520 530 540 550
600 610 620 630 640 650
pF1KB0 HQRVHTGEKPYTCPLCGKAFRVRSHLVQHQSVHSGERPFKCNECGKGFGRRSHLAGHLRL
:: .::::::: : :::.: :::..:...:.::.:.::::::: : . :.:. : :.
CCDS54 HQVIHTGEKPYKCNECGKVFTQNSHLARHRGIHTGEKPYKCNECGKVFRHNSYLSRHQRI
560 570 580 590 600 610
660 670 680 690 700 710
pF1KB0 HSREKSHQCRECGEIFFQYVSLIEHQVLHMGQKNEKNGICEEAYSWNLTVIEDKKIELQE
:. :: .. : :. : .. .: :::.: :.: : . : .... : . . ....
CCDS54 HTGEKPYKYNEYGKAFSEHSNLTTHQVIHTGEKPYKCNECGKVFTQNSHLARHRRVHTGG
620 630 640 650 660 670
720 730 740 750 760 770
pF1KB0 QPYQCDICGKAFGYSSDLIQHYRTHTAEKPYQCDICRENVGQCSHTKQHQKIYSSTKSHQ
.::::. :::::. .: : .: :.::.::::.:. : . . : :: :... : ..
CCDS54 KPYQCNECGKAFSQTSKLARHQRVHTGEKPYECNQCGKAFSVRSSLTTHQAIHTGKKPYK
680 690 700 710 720 730
780 790 800 810 820 830
pF1KB0 CHECGRGFTLKSHLNQHQGIHTGEKPFQCKECGMNFSWSCSLFKHLRSHERTDPINTLSV
:.:::. :: .::: .:.::::::::..:.::: :: . .: .: : : :
CCDS54 CNECGKVFTQNSHLARHRGIHTGEKPYKCNECGKAFSQTSKLARHQRIHTGEKPYECGKP
740 750 760 770 780 790
pF1KB0 EGSLL
CCDS54 FSICSSLTTHQTIHTGGKPYKCNVWKVLKSEFKPCKPSQNS
800 810 820 830 840
>>CCDS31940.1 ZNF84 gene_id:7637|Hs108|chr12 (738 aa)
initn: 6897 init1: 1042 opt: 1546 Z-score: 958.1 bits: 188.1 E(32554): 4.8e-47
Smith-Waterman score: 1551; 40.2% identity (65.2% similar) in 584 aa overlap (248-828:147-710)
220 230 240 250 260 270
pF1KB0 EEVADVAVSFILEEWGHLDQSQKSLYRDDRKENYGSITSMGYESRDNMELIVKQISDDSE
: .::. : .. ::. : : .:..
CCDS31 NMNFVPLRKSNSEGDLDGLILKHHLDLLIPKGDYGKAESDDFNVFDNFFLHSKP--EDTD
120 130 140 150 160 170
280 290 300 310 320 330
pF1KB0 SHWVAPEHTERSVPQDPDFAEVSDLKGMVQRWQVNPTVGKSRQNPSQKRDLDAITDISPK
. :. : : . : :... .. : : . .. .. .. .
CCDS31 T-WLKY--------YDCDKYKESYKKSQIIIYHRNRLGEKLYECSECRKRFSKKPSLIKH
180 190 200 210 220
340 350 360 370 380 390
pF1KB0 QSTH-GERGHRCSDCGKFFLQASNFIQHRRIHTGEKPFKCGECGKSYNQRVHLTQHQRVH
:: : . . :..::: : : :.:: :.: ::::::..:..:::...:. .::.:::.:
CCDS31 QSRHIRDIAFGCGNCGKTFPQKSQFITHHRTHTGEKPYNCSQCGKAFSQKSQLTSHQRTH
230 240 250 260 270 280
400 410 420 430 440 450
pF1KB0 TGEKPYKCQVCGKAFRVSSHLVQHHSVHSGERPYGCNECGKNFGRHSHLIEHLKRHFREK
::::::.: ::::: .:::..: .:.::.::::::::. :...:.::.: . : ::
CCDS31 TGEKPYECGECGKAFSRKSHLISHWRTHTGEKPYGCNECGRAFSEKSNLINHQRIHTGEK
290 300 310 320 330 340
460 470 480 490 500 510
pF1KB0 SQRCSDKRSKNTKLSVKKKISEYSEADMELSGKTQRNVSQVQDFGEGCEFQGKLDRKQGI
.: : . .: :... . .. .: . : : .. ...: :.: :
CCDS31 PFEC---RECGKAFSRKSQLVTHHRTH---TGTKPFGCS---DCRKAFFEKSELIRHQTI
350 360 370 380 390
520 530 540 550 560 570
pF1KB0 PMKEILGQPSSKRMNYSEVPYV--HKKSSTGERPHKCNECGKSFIQSAHLIQHQRIHTGE
: . : : . : . :... :::.:: : .:::.: :..:::.:: ::::
CCDS31 HTGEKPYECSECRKAFRERSSLINHQRTHTGEKPHGCIQCGKAFSQKSHLISHQMTHTGE
400 410 420 430 440 450
580 590 600 610 620 630
pF1KB0 KPFRCEECGKSYNQRVHLTQHQRVHTGEKPYTCPLCGKAFRVRSHLVQHQSVHSGERPFK
::: : .:::..... .:..:::.::::::: : ::::: . :..:: .:.::.:.
CCDS31 KPFICSKCGKAFSRKSQLVRHQRTHTGEKPYECSECGKAFSEKLSLTNHQRIHTGEKPYV
460 470 480 490 500 510
640 650 660 670 680 690
pF1KB0 CNECGKGFGRRSHLAGHLRLHSREKSHQCRECGEIFFQYVSLIEHQVLHMGQKNEKNGIC
:.::::.: ..::: .: : :. :: ..: :::. : . :: :: : :.: . :
CCDS31 CSECGKAFCQKSHLISHQRTHTGEKPYECSECGKAFGEKSSLATHQRTHTGEKPYECRDC
520 530 540 550 560 570
700 710 720 730 740 750
pF1KB0 EEAYSWNLTVIEDKKIELQEQPYQCDICGKAFGYSSDLIQHYRTHTAEKPYQCDICRENV
:.:.: . . ..:. :.::.:..: ::: .:.::.: ::::.::::.:. ::.
CCDS31 EKAFSQKSQLNTHQRIHTGEKPYECSLCRKAFFEKSELIRHLRTHTGEKPYECNECRKAF
580 590 600 610 620 630
760 770 780 790 800 810
pF1KB0 GQCSHTKQHQKIYSSTKSHQCHECGRGFTLKSHLNQHQGIHTGEKPFQCKECGMNFSWSC
. : .::.:... : .: :::..:. :::: :: ::::::. :.:: :: .
CCDS31 REKSSLINHQRIHTGEKPFECSECGKAFSRKSHLIPHQRTHTGEKPYGCSECRKAFSQKS
640 650 660 670 680 690
820 830
pF1KB0 SLFKHLRSHERTDPINTLSVEGSLL
.: .: : : :
CCDS31 QLVNHQRIHTGEKPYRCIECGKAFSQKSQLINHQRTHTVKKS
700 710 720 730
>>CCDS12498.1 ZNF420 gene_id:147923|Hs108|chr19 (688 aa)
initn: 4032 init1: 1029 opt: 1527 Z-score: 946.9 bits: 185.9 E(32554): 2e-46
Smith-Waterman score: 1658; 39.4% identity (66.7% similar) in 634 aa overlap (222-828:10-642)
200 210 220 230 240 250
pF1KB0 PSLPLKDSQELTASLLSTGSQKLVKIEEVADVAVSFILEEWGHLDQSQKSLYRDDRKENY
:::..: ::: ::..:..:::: :::
CCDS12 MARKLVMFRDVAIDFSQEEWECLDSAQRDLYRDVMLENY
10 20 30
260 270 280 290 300
pF1KB0 GSITSMGYESR-DNMELIVKQISDDSE-SHWVAPEHTERSVPQDPDFAEVSDLKGMVQRW
....:. :: . .: .. . ..: :.: .. : .. . . . :: ...
CCDS12 SNLVSLDLPSRCASKDLSPEKNTYETELSQWEMSDRLENCDLEESNSRDYLEAKGKMEKQ
40 50 60 70 80 90
310 320 330 340 350 360
pF1KB0 QVNPTVGKSRQNP---SQKRDLDAITDISPKQSTHG-ERGHRCSDCGKFFLQASNFIQHR
: : ::. .. .. : .: .. :. :. ..:..::: : .::.. ::.
CCDS12 QENQKE-YFRQGMIIYDKMSIFNQHTYLSQHSRCHSTEKPYKCKECGKAFRRASHLTQHQ
100 110 120 130 140 150
370 380 390 400 410 420
pF1KB0 RIHTGEKPFKCGECGKSYNQRVHLTQHQRVHTGEKPYKCQVCGKAFRVSSHLVQHHSVHS
:::::::..: .:::.... .:. :::.::::::: :. ::::: ::.:. :: .:.
CCDS12 SIHTGEKPYECKQCGKAFSRDSQLSLHQRLHTGEKPYACKECGKAFTQSSQLILHHRIHT
160 170 180 190 200 210
430 440 450 460 470
pF1KB0 GERPYGCNECGKNFGRHSHLIEHLKRHFREKSQRCSD---KRSKNTKLSVKK------KI
::.:: :.:::: : : :.: .: : : :: .:.. ..:..:.... :.
CCDS12 GEKPYKCEECGKAFIRSSQLTRHQKVHTGEKPYECKECGKAFTQNSQLTLHQRLHTGEKL
220 230 240 250 260 270
480 490 500 510 520
pF1KB0 SEYSEADMELSGKTQRNVSQVQDFGEG---CEFQGK-------LDRKQGIPM--KEILGQ
: .: .. .: . . :: :. :: :...: : : .
CCDS12 YECKECRKVFTQLSQLILHKRIHTGEKPYECKECGKAFICGSQLSQHQKIHNGEKPYECK
280 290 300 310 320 330
530 540 550 560 570 580
pF1KB0 PSSKRMNYSEVPYVHKKSSTGERPHKCNECGKSFIQSAHLIQHQRIHTGEKPFRCEECGK
.. . . . . :.. :::.:.::.::::.::....: :::::::.:::..:.::::
CCDS12 ECGRAFIRGSLLMQHQRIHTGEKPYKCEECGKAFIRGSQLTQHQRIHTNEKPYECKECGK
340 350 360 370 380 390
590 600 610 620 630 640
pF1KB0 SYNQRVHLTQHQRVHTGEKPYTCPLCGKAFRVRSHLVQHQSVHSGERPFKCNECGKGFGR
... .::::::.::::::: : ::::: : :..:: .:.::.:..:.:::: :.:
CCDS12 MFSHGSQLTQHQRIHTGEKPYQCKECGKAFNRGSLLTRHQRIHTGEKPYECKECGKTFSR
400 410 420 430 440 450
650 660 670 680 690 700
pF1KB0 RSHLAGHLRLHSREKSHQCRECGEIFFQYVSLIEHQVLHMGQKNEKNGICEEAYSWNLTV
:.:. : :.:. :: ..:.:::. :.. .: .:: .: :.: . :. :.. . .
CCDS12 GSELTQHERIHTGEKPYECKECGKSFIRGSQLTQHQRIHTGEKPYECKECRMAFTQSSHL
460 470 480 490 500 510
710 720 730 740 750 760
pF1KB0 IEDKKIELQEQPYQCDICGKAFGYSSDLIQHYRTHTAEKPYQCDICRENVGQCSHTKQHQ
. .... :.:: :. :::::. . :::: : ::.:::::: : . . :. :::
CCDS12 SQHQRLHTGEKPYVCNECGKAFARGLLLIQHQRIHTGEKPYQCKECGKAFIRGSQLTQHQ
520 530 540 550 560 570
770 780 790 800 810 820
pF1KB0 KIYSSTKSHQCHECGRGFTLKSHLNQHQGIHTGEKPFQCKECGMNFSWSCSLFKHLRSHE
.:... : ..:.:::..:. :.:. :: :::::::..:.:: :. : : .: : :
CCDS12 RIHTGEKPYECKECGKAFSHGSQLTLHQRIHTGEKPYECRECRKAFTQSSHLSRHQRIHT
580 590 600 610 620 630
830
pF1KB0 RTDPINTLSVEGSLL
:
CCDS12 GEKPYQCKECGKAFTRGSQLTQHQRIHISEKSFEYKECGIDFSHGSQVYM
640 650 660 670 680
>>CCDS33122.1 ZNF470 gene_id:388566|Hs108|chr19 (717 aa)
initn: 3318 init1: 1046 opt: 1509 Z-score: 935.8 bits: 183.9 E(32554): 8.3e-46
Smith-Waterman score: 1509; 40.2% identity (69.0% similar) in 522 aa overlap (310-823:191-699)
280 290 300 310 320 330
pF1KB0 WVAPEHTERSVPQDPDFAEVSDLKGMVQRWQVNPTVGKSRQNPSQKRDLDAITDISPKQS
:. : . . ..:..: . . .. ...
CCDS33 ITHIDTLIEKRDHSNKSGTVFHLNTLSYIKQIFPMEERIFNFHTDKKSLKTHSVVKKHKQ
170 180 190 200 210 220
340 350 360 370 380 390
pF1KB0 THGERGH-RCSDCGKFFLQASNFIQHRRIHTGEKPFKCGECGKSYNQRVHLTQHQRVHTG
.::. .:.:: :.: . :.. :.::::::::..: ::::...: .::.::::.:::
CCDS33 DRGEKKLLKCNDCEKIFSKISTLTLHQRIHTGEKPYECIECGKAFSQSAHLAQHQRIHTG
230 240 250 260 270 280
400 410 420 430 440 450
pF1KB0 EKPYKCQVCGKAFRVSSHLVQHHSVHSGERPYGCNECGKNFGRHSHLIEHLKRHFREKSQ
:::..: ::::: ..:::::. ::.::.:: :..:.: :.. .:: .: . : ::
CCDS33 EKPFECTECGKAFSQNAHLVQHQRVHTGEKPYQCKQCNKAFSQLAHLAQHQRVHTGEKPY
290 300 310 320 330 340
460 470 480 490 500 510
pF1KB0 RCSDKRSKNTKLSVKKKISEYSEADMELSGKTQRNVSQVQDFGEGCEFQGKLDRKQGI--
.: . : .:. : . .: . . : :.. . ...: :..
CCDS33 EC---------IECGKAFSDCSSLAHHRRIHTGKRPYECIDCGKAFRQNASLIRHRRYYH
350 360 370 380 390
520 530 540 550 560 570
pF1KB0 ----PMKEI-LGQPSSKRMNYSEVPYVHKKSSTGERPHKCNECGKSFIQSAHLIQHQRIH
:. : :. . ... . ::.. :::::.::: :::.: ... : :::::
CCDS33 TGEKPFDCIDCGKAFTDHIGLIQ----HKRTHTGERPYKCNVCGKAFSHGSSLTVHQRIH
400 410 420 430 440
580 590 600 610 620 630
pF1KB0 TGEKPFRCEECGKSYNQRVHLTQHQRVHTGEKPYTCPLCGKAFRVRSHLVQHQSVHSGER
:::::..:. : :....: :: ::::::::::: : :::::: .::..:: .:.::.
CCDS33 TGEKPYECNICEKAFSHRGSLTLHQRVHTGEKPYECKECGKAFRQSTHLAHHQRIHTGEK
450 460 470 480 490 500
640 650 660 670 680 690
pF1KB0 PFKCNECGKGFGRRSHLAGHLRLHSREKSHQCRECGEIFFQYVSLIEHQVLHMGQKNEKN
:..:.::.: :.. .::: : ..:. :: ..:.:::. : : . :..:: .: :.: .
CCDS33 PYECKECSKTFSQNAHLAQHQKIHTGEKPYECKECGKAFSQIAHLVQHQRVHTGEKPYEC
510 520 530 540 550 560
700 710 720 730 740 750
pF1KB0 GICEEAYSWNLTVIEDKKIELQEQPYQCDICGKAFGYSSDLIQHYRTHTAEKPYQCDICR
: .:.: . ... .... ..::.: ::::: ..:: : : ::.::::.:..:
CCDS33 IECGKAFSDGSYLVQHQRLHSGKRPYECLECGKAFRQRASLICHQRCHTGEKPYECNVCG
570 580 590 600 610 620
760 770 780 790 800 810
pF1KB0 ENVGQCSHTKQHQKIYSSTKSHQCHECGRGFTLKSHLNQHQGIHTGEKPFQCKECGMNFS
. .. . ::.:... : ..:.::...:. .::. :. :::::.:..::::: :
CCDS33 KAFSHRKSLTLHQRIHTGEKPYECKECSKAFSQVAHLTLHKRIHTGERPYECKECGKAFR
630 640 650 660 670 680
820 830
pF1KB0 WSCSLFKHLRSHERTDPINTLSVEGSLL
: : .: : :
CCDS33 QSVHLAHHQRIHTGESSVILSSALPYHQVL
690 700 710
>>CCDS74350.1 ZNF850 gene_id:342892|Hs108|chr19 (1058 aa)
initn: 9878 init1: 1043 opt: 1499 Z-score: 928.2 bits: 183.1 E(32554): 2.2e-45
Smith-Waterman score: 1543; 37.8% identity (63.3% similar) in 640 aa overlap (222-828:11-640)
200 210 220 230 240 250
pF1KB0 PSLPLKDSQELTASLLSTGSQKLVKIEEVADVAVSFILEEWGHLDQSQKSLYRDDRKENY
:....: ::: :: .::.:::: :::
CCDS74 MNMEGLVMFQDLSIDFSQEEWECLDAAQKDLYRDVMMENY
10 20 30 40
260 270 280 290
pF1KB0 GSITSMGYESRDNME--LIVKQISDDSESHWVAPEHTERSVP-------------QDPDF
.:..:. : : . . . :.: . . :.:: :. . : : :.
CCDS74 SSLVSLDSEFRCKTKDSCLPKEIYEVTSSQWVRMEKCHSLVGSSVRDDWECKGQFQHQDI
50 60 70 80 90 100
300 310 320 330 340
pF1KB0 AEVSDLKGMVQRWQVNPTVG-------KSRQNPSQK--RDLDAI-----TDISPKQSTH-
. :. .. ....:: . : .:..: .. . . .... .: ::
CCDS74 NQERYLEKAIMTYETTPTFCLQTSLTLHHRIHPGEKLYKSTECMAFKYGSELTQQQETHT
110 120 130 140 150 160
350 360 370 380 390 400
pF1KB0 GERGHRCSDCGKFFLQASNFIQHRRIHTGEKPFKCGECGKSYNQRVHLTQHQRVHTGEKP
::. ..:..::: : . : ...:.:::::::: : : ::.. . :: :::...: :.:
CCDS74 GEKLYKCKECGKAFHHFSYLVKHQRIHTGEKPCACKEYGKAFISGSHLIQHQKMYTDERP
170 180 190 200 210 220
410 420 430 440 450 460
pF1KB0 YKCQVCGKAFRVSSHLVQHHSVHSGERPYGCNECGKNFGRHSHLIEHLKRHFREKSQRCS
..:: :::: :.::.:: .:.:..:: :.::::.: : : .: . : :: .:
CCDS74 HECQESVKAFRPSAHLIQHWRIHTGDKPYECKECGKSFTSGSTLNQHQQIHTGEKPYHC-
230 240 250 260 270
470 480 490 500 510
pF1KB0 DKRSKNTKLSVKKKISEYSEADMELSGKTQRNVSQV-QDFGEGCEFQGKLDRKQGIPM--
.. . ...: . . .... .:. . .. ..:. : . : :.: :
CCDS74 --KQCGKSFTVGSTLIRHQQIH---TGEKPYDCKECGKSFASG----SALIRHQRIHTGE
280 290 300 310 320 330
520 530 540 550 560 570
pF1KB0 KEILGQPSSKRMNYSEVPYVHKKSSTGERPHKCNECGKSFIQSAHLIQHQRIHTGEKPFR
: . .: ... . :.. :::.:. :.:::::: . :: :: :::::::.
CCDS74 KPYDCKECGKSFTFHSALIRHQRIHTGEKPYDCKECGKSFTFRSGLIGHQAIHTGEKPYD
340 350 360 370 380 390
580 590 600 610 620 630
pF1KB0 CEECGKSYNQRVHLTQHQRVHTGEKPYTCPLCGKAFRVRSHLVQHQSVHSGERPFKCNEC
:.:::::.. : ::::.::::::: : :::.: : :.::: .:.::.:. :.::
CCDS74 CKECGKSFTAGSTLIQHQRIHTGEKPYDCKECGKSFASGSALLQHQRIHTGEKPYCCKEC
400 410 420 430 440 450
640 650 660 670 680 690
pF1KB0 GKGFGRRSHLAGHLRLHSREKSHQCRECGEIFFQYVSLIEHQVLHMGQKNEKNGICEEAY
::.: :: : :.:. :: ..:.:::. : . .:..:: .: :.: . : ...
CCDS74 GKSFTFRSTRNRHQRIHTGEKPYNCKECGKSFASGSALLQHQRIHTGEKPYHCKECGKSF
460 470 480 490 500 510
700 710 720 730 740 750
pF1KB0 SWNLTVIEDKKIELQEQPYQCDICGKAFGYSSDLIQHYRTHTAEKPYQCDICRENVGQCS
.. .: . .. :.::.: :::.: : :::: : ::.::::.: : .. :
CCDS74 TFRSGLIGHQAVHTGEKPYDCKECGKSFTSRSALIQHQRIHTGEKPYHCKECGKSFTVGS
520 530 540 550 560 570
760 770 780 790 800 810
pF1KB0 HTKQHQKIYSSTKSHQCHECGRGFTLKSHLNQHQGIHTGEKPFQCKECGMNFSWSCSLFK
:::.:... : ..:.:::..: :. .:.::: :::::::.::.::: : .: .
CCDS74 TLLQHQQIHTGEKPYDCKECGKAFRLRLRLTQHQQIHTGEKPYQCQECGKAFVSVSGLTQ
580 590 600 610 620 630
820 830
pF1KB0 HLRSHERTDPINTLSVEGSLL
: : : :
CCDS74 HHRIHTGEKPYECPDCGKAFRQRTYLNQHRRIHTGEKPYECKECGKSFTFCSGLIQHQQN
640 650 660 670 680 690
>--
initn: 4788 init1: 1002 opt: 1222 Z-score: 760.5 bits: 152.1 E(32554): 4.9e-36
Smith-Waterman score: 1371; 41.5% identity (63.5% similar) in 482 aa overlap (346-826:641-1058)
320 330 340 350 360 370
pF1KB0 GKSRQNPSQKRDLDAITDISPKQSTHGERGHRCSDCGKFFLQASNFIQHRRIHTGEKPFK
..: :::: : : . . :::::::::::..
CCDS74 KPYQCQECGKAFVSVSGLTQHHRIHTGEKPYECPDCGKAFRQRTYLNQHRRIHTGEKPYE
620 630 640 650 660 670
380 390 400 410 420 430
pF1KB0 CGECGKSYNQRVHLTQHQRVHTGEKPYKCQVCGKAFRVSSHLVQHHSVHSGERPYGCNEC
: :::::.. : :::. :: :::: . :::.: : :.::...:.::.:: :.::
CCDS74 CKECGKSFTFCSGLIQHQQNHTDEKPYDGKECGKSFTSHSTLIQHQQIHTGEKPYDCKEC
680 690 700 710 720 730
440 450 460 470 480 490
pF1KB0 GKNFGRHSHLIEHLKRHFREKSQRCSDKRSKNTKLSVKKKISEYSEADMELSGKTQRNVS
::.: :: ::.: . : :: :.. ::. . :
CCDS74 GKSFTSHSTLIQHQQIHTGEKLYDCKE------------------------CGKSFTSHS
740 750 760
500 510 520 530 540 550
pF1KB0 QVQDFGEGCEFQGKLDRKQGIPMKEILGQPSSKRMNYSEVPYVHKKSSTGERPHKCNECG
. : :: .: :::.:..:.:::
CCDS74 TL-----------------------IQHQP------------LH----TGEKPYHCKECG
770 780
560 570 580 590 600 610
pF1KB0 KSFIQSAHLIQHQRIHTGEKPFRCEECGKSYNQRVHLTQHQRVHTGEKPYTCPLCGKAFR
::: . ::::. .::::: . :.:::::...: : .:::.::::::: : :::.:
CCDS74 KSFTLRSALIQHRPVHTGEKRYSCKECGKSFTSRSTLIEHQRIHTGEKPYHCKECGKSFA
790 800 810 820 830 840
620 630 640 650 660 670
pF1KB0 VRSHLVQHQSVHSGERPFKCNECGKGFGRRSHLAGHLRLHSREKSHQCRECGEIFFQYVS
:: ..::. .:.::.:. :.::::.: :::.:. : :.:. :: ..:.:::. : .. .
CCDS74 FRSAIIQHRRIHTGEKPYDCKECGKAFRRRSKLTQHQRIHTGEKPYRCHECGKAFVRFSG
850 860 870 880 890 900
680 690 700 710 720 730
pF1KB0 LIEHQVLHMGQKNEKNGICEEAYSWNLTVIEDKKIELQEQPYQCDICGKAFGYSSDLIQH
: .:. .: :.: . : ... . ..:. ..::.: :::.: .:.::.:
CCDS74 LTKHHSIHTGEKPYECKTCGKSFRQRTHLTLHQRIHTGDRPYECKECGKSFTCGSELIRH
910 920 930 940 950 960
740 750 760 770 780 790
pF1KB0 YRTHTAEKPYQCDICRENVGQC-SHTKQHQKIYSSTKSHQCHECGRGFTLKSHLNQHQGI
::::.::::.: : . .: :. .::..:... :..:: :::..: : :..::..
CCDS74 QRTHTGEKPYDCKECGKAF-RCPSQLSQHKRIHTGEKTYQCPECGKAFFYASGLSRHQSV
970 980 990 1000 1010 1020
800 810 820 830
pF1KB0 HTGEKPFQCKECGMNFSWSCSLFKHLRSHERTDPINTLSVEGSLL
::::::..:: :: :. .: .: : :. :
CCDS74 HTGEKPYECKTCGKAFKQLTQLTRHQRIHDLT
1030 1040 1050
>>CCDS59379.1 ZNF850 gene_id:342892|Hs108|chr19 (1090 aa)
initn: 9878 init1: 1043 opt: 1499 Z-score: 928.0 bits: 183.1 E(32554): 2.3e-45
Smith-Waterman score: 1499; 42.0% identity (70.2% similar) in 490 aa overlap (343-830:250-730)
320 330 340 350 360 370
pF1KB0 PTVGKSRQNPSQKRDLDAITDISPKQSTHGERGHRCSDCGKFFLQASNFIQHRRIHTGEK
:: :.:.. : : ....::: :::::.:
CCDS59 TGEKPCACKEYGKAFISGSHLIQHQKMYTDERPHECQESVKAFRPSAHLIQHWRIHTGDK
220 230 240 250 260 270
380 390 400 410 420 430
pF1KB0 PFKCGECGKSYNQRVHLTQHQRVHTGEKPYKCQVCGKAFRVSSHLVQHHSVHSGERPYGC
:..: :::::... :.:::..:::::::.:. :::.: :.: :..:...:.::.:: :
CCDS59 PYECKECGKSFTSGSTLNQHQQIHTGEKPYHCKQCGKSFTVGSTLIRHQQIHTGEKPYDC
280 290 300 310 320 330
440 450 460 470 480 490
pF1KB0 NECGKNFGRHSHLIEHLKRHFREKSQRCSDKRSKNTKLSVKKKISEYSEADMELSGKTQR
.::::.:. : ::.: . : :: :.. :... .: . .: .
CCDS59 KECGKSFASGSALIRHQRIHTGEKPYDCKE---------CGKSFTFHSALIRHQRIHTGE
340 350 360 370 380 390
500 510 520 530 540 550
pF1KB0 NVSQVQDFGEGCEFQGKLDRKQGIPM--KEILGQPSSKRMNYSEVPYVHKKSSTGERPHK
. . .. :.. :.. : .:.: : . .: .. . . :.. :::.:.
CCDS59 KPYDCKECGKSFTFRSGLIGHQAIHTGEKPYDCKECGKSFTAGSTLIQHQRIHTGEKPYD
400 410 420 430 440 450
560 570 580 590 600 610
pF1KB0 CNECGKSFIQSAHLIQHQRIHTGEKPFRCEECGKSYNQRVHLTQHQRVHTGEKPYTCPLC
:.:::::: ... :.:::::::::::. :.:::::.. : ..:::.:::::::.: :
CCDS59 CKECGKSFASGSALLQHQRIHTGEKPYCCKECGKSFTFRSTRNRHQRIHTGEKPYNCKEC
460 470 480 490 500 510
620 630 640 650 660 670
pF1KB0 GKAFRVRSHLVQHQSVHSGERPFKCNECGKGFGRRSHLAGHLRLHSREKSHQCRECGEIF
::.: : :.::: .:.::.:..:.::::.: :: : :: .:. :: ..:.:::. :
CCDS59 GKSFASGSALLQHQRIHTGEKPYHCKECGKSFTFRSGLIGHQAVHTGEKPYDCKECGKSF
520 530 540 550 560 570
680 690 700 710 720 730
pF1KB0 FQYVSLIEHQVLHMGQKNEKNGICEEAYSWNLTVIEDKKIELQEQPYQCDICGKAFGYSS
. .::.:: .: :.: . : .... . :... ..:. :.::.: :::::
CCDS59 TSRSALIQHQRIHTGEKPYHCKECGKSFTVGSTLLQHQQIHTGEKPYDCKECGKAFRLRL
580 590 600 610 620 630
740 750 760 770 780 790
pF1KB0 DLIQHYRTHTAEKPYQCDICRENVGQCSHTKQHQKIYSSTKSHQCHECGRGFTLKSHLNQ
: :: . ::.::::::. : . . : ::..:... : ..: .::..: ...:::
CCDS59 RLTQHQQIHTGEKPYQCQECGKAFVSVSGLTQHHRIHTGEKPYECPDCGKAFRQRTYLNQ
640 650 660 670 680 690
800 810 820 830
pF1KB0 HQGIHTGEKPFQCKECGMNFSWSCSLFKHLRSHERTDPINTLSVEGSLL
:. :::::::..::::: .:.. .:..: ..: : .
CCDS59 HRRIHTGEKPYECKECGKSFTFCSGLIQHQQNHTDEKPYDGKECGKSFTSHSTLIQHQQI
700 710 720 730 740 750
CCDS59 HTGEKPYDCKECGKSFTSHSTLIQHQQIHTGEKLYDCKECGKSFTSHSTLIQHQPLHTGE
760 770 780 790 800 810
>--
initn: 3829 init1: 1002 opt: 1036 Z-score: 647.8 bits: 131.2 E(32554): 9.2e-30
Smith-Waterman score: 1196; 39.7% identity (58.4% similar) in 478 aa overlap (350-826:733-1090)
320 330 340 350 360 370
pF1KB0 QNPSQKRDLDAITDISPKQSTHGERGHRCSDCGKFFLQASNFIQHRRIHTGEKPFKCGEC
.::: : . :..:::..:::::::. : ::
CCDS59 CKECGKSFTFCSGLIQHQQNHTDEKPYDGKECGKSFTSHSTLIQHQQIHTGEKPYDCKEC
710 720 730 740 750 760
380 390 400 410 420 430
pF1KB0 GKSYNQRVHLTQHQRVHTGEKPYKCQVCGKAFRVSSHLVQHHSVHSGERPYGCNECGKNF
:::.... : :::..::::: : :. :::.: : :.::. .:.::.:: :.::::.:
CCDS59 GKSFTSHSTLIQHQQIHTGEKLYDCKECGKSFTSHSTLIQHQPLHTGEKPYHCKECGKSF
770 780 790 800 810 820
440 450 460 470 480 490
pF1KB0 GRHSHLIEHLKRHFREKSQRCSDKRSKNTKLSVKKKISEYSEADMELSGKTQRNVSQVQD
.: ::.:
CCDS59 TLRSALIQH---------------------------------------------------
830
500 510 520 530 540 550
pF1KB0 FGEGCEFQGKLDRKQGIPMKEILGQPSSKRMNYSEVPYVHKKSSTGERPHKCNECGKSFI
.: :: :::. ..:.::::::
CCDS59 ------------------------RP------------VH----TGEKRYSCKECGKSFT
840 850
560 570 580 590 600 610
pF1KB0 QSAHLIQHQRIHTGEKPFRCEECGKSYNQRVHLTQHQRVHTGEKPYTCPLCGKAFRVRSH
. . ::.::::::::::..:.:::::. : . ::.:.::::::: : :::::: ::.
CCDS59 SRSTLIEHQRIHTGEKPYHCKECGKSFAFRSAIIQHRRIHTGEKPYDCKECGKAFRRRSK
860 870 880 890 900 910
620 630 640 650 660 670
pF1KB0 LVQHQSVHSGERPFKCNECGKGFGRRSHLAGHLRLHSREKSHQCRECGEIFFQYVSLIEH
:.::: .:.::.:..:.::::.: : : :. : .:. :: ..:. ::. : : . : :
CCDS59 LTQHQRIHTGEKPYRCHECGKAFVRFSGLTKHHSIHTGEKPYECKTCGKSFRQRTHLTLH
920 930 940 950 960 970
680 690 700 710 720 730
pF1KB0 QVLHMGQKNEKNGICEEAYSWNLTVIEDKKIELQEQPYQCDICGKAFGYSSDLIQHYRTH
: .: :.. ::.: :::.: .:.::.: :::
CCDS59 QRIHTGDR----------------------------PYECKECGKSFTCGSELIRHQRTH
980 990 1000
740 750 760 770 780 790
pF1KB0 TAEKPYQCDICRENVGQC-SHTKQHQKIYSSTKSHQCHECGRGFTLKSHLNQHQGIHTGE
:.::::.: : . .: :. .::..:... :..:: :::..: : :..::..::::
CCDS59 TGEKPYDCKECGKAF-RCPSQLSQHKRIHTGEKTYQCPECGKAFFYASGLSRHQSVHTGE
1010 1020 1030 1040 1050 1060
800 810 820 830
pF1KB0 KPFQCKECGMNFSWSCSLFKHLRSHERTDPINTLSVEGSLL
::..:: :: :. .: .: : :. :
CCDS59 KPYECKTCGKAFKQLTQLTRHQRIHDLT
1070 1080 1090
>>CCDS62706.1 ZNF229 gene_id:7772|Hs108|chr19 (819 aa)
initn: 3784 init1: 979 opt: 1481 Z-score: 918.3 bits: 180.9 E(32554): 7.9e-45
Smith-Waterman score: 1482; 40.9% identity (66.7% similar) in 541 aa overlap (292-828:288-817)
270 280 290 300 310 320
pF1KB0 RDNMELIVKQISDDSESHWVAPEHTERSVPQDPDFAEVSDLKGMVQRWQVNPTVGKSRQN
: .:.: .. ..: : :: :: ..
CCDS62 GLKSNEYRNGFRDDADLPPHPRVPLKEKLCQYDEFSEGLRHSAHLNRHQRVPTGEKSVKS
260 270 280 290 300 310
330 340 350 360 370
pF1KB0 PSQKRDLDAITDIS--PKQSTHGERGHRCSDCGKFFLQASNFIQHRRIHTGEKPFKCGEC
. : . : : :. . :. .::. ::: : : .. :. .:::..:.:: ::
CCDS62 LERGRGVRQNTHIRNHPRAPV-GDMPYRCDVCGKGFRYKSVLLIHQGVHTGRRPYKCEEC
320 330 340 350 360 370
380 390 400 410 420 430
pF1KB0 GKSYNQRVHLTQHQRVHTGEKPYKCQVCGKAFRVSSHLVQHHSVHSGERPYGCNECGKNF
::.... .: :::::::::::::. :::.: :: : :. .:.::.:: :.::::.:
CCDS62 GKAFGRSSNLLVHQRVHTGEKPYKCSECGKGFSYSSVLQVHQRLHTGEKPYTCSECGKGF
380 390 400 410 420 430
440 450 460 470 480 490
pF1KB0 GRHSHLIEHLKRHFREKSQRCSDKRSKNTKLSVKKKISEYSEADMELSGKTQRNVSQVQD
.: : .: . : :: :.. . .: ....: .... .:. : .
CCDS62 CAKSALHKHQHIHPGEKPYSCGEC---GKGFSCSSHLSSHQKTH---TGERPY---QCDK
440 450 460 470 480
500 510 520 530 540 550
pF1KB0 FGEGCEFQGKLDRKQGIPMKEILGQPS--SKRMNYSEVPYVHKKSSTGERPHKCNECGKS
:.: .. :. .: . : . : . . .: ..:: .:.. :::.:.:: :::::
CCDS62 CGKGFSHNSYLQAHQRVHMGQHLYKCNVCGKSFSYSSGLLMHQRLHTGEKPYKC-ECGKS
490 500 510 520 530 540
560 570 580 590 600 610
pF1KB0 FIQSAHLIQHQRIHTGEKPFRCEECGKSYNQRVHLTQHQRVHTGEKPYTCPLCGKAFRVR
: .:. : :::.::::::..: ::::.. . : .::::::::.::.: .:::.:
CCDS62 FGRSSDLHIHQRVHTGEKPYKCSECGKGFRRNSDLHSHQRVHTGERPYVCDVCGKGFIYS
550 560 570 580 590 600
620 630 640 650 660 670
pF1KB0 SHLVQHQSVHSGERPFKCNECGKGFGRRSHLAGHLRLHSREKSHQCRECGEIFFQYVSLI
: :. :: ::.::.:.:: ::::::. : : : :.:. :: ..:.:::. : ::
CCDS62 SDLLIHQRVHTGEKPYKCAECGKGFSYSSGLLIHQRVHTGEKPYRCQECGKGFRCTSSLH
610 620 630 640 650 660
680 690 700 710 720 730
pF1KB0 EHQVLHMGQKNEKNGICEEAYSWNLTVIEDKKIELQEQPYQCDICGKAFGYSSDLIQHYR
.:: .: :.: : ...:.. .. .... :.:: : :::.: :.: :..: :
CCDS62 KHQRVHTGKKPYTCDQCGKGFSYGSNLRTHQRLHTGEKPYTCCECGKGFRYGSGLLSHKR
670 680 690 700 710 720
740 750 760 770 780 790
pF1KB0 THTAEKPYQCDICRENVGQCSHTKQHQKIYSSTKSHQCHECGRGFTLKSHLNQHQGIHTG
.::.::::.: .: .. .: :: . ::..... : ..:.:::.:: .: :. :: .:::
CCDS62 VHTGEKPYRCHVCGKGYSQSSHLQGHQRVHTGEKPYKCEECGKGFGRNSCLHVHQRVHTG
730 740 750 760 770 780
800 810 820 830
pF1KB0 EKPFQCKECGMNFSWSCSLFKHLRSHERTDPINTLSVEGSLL
:::. : :: .::.. .: .: : : .:
CCDS62 EKPYTCGVCGKGFSYTSGLRNHQRVHLGENPYK
790 800 810
>>CCDS42574.1 ZNF229 gene_id:7772|Hs108|chr19 (825 aa)
initn: 3122 init1: 979 opt: 1481 Z-score: 918.3 bits: 180.9 E(32554): 7.9e-45
Smith-Waterman score: 1482; 40.9% identity (66.7% similar) in 541 aa overlap (292-828:294-823)
270 280 290 300 310 320
pF1KB0 RDNMELIVKQISDDSESHWVAPEHTERSVPQDPDFAEVSDLKGMVQRWQVNPTVGKSRQN
: .:.: .. ..: : :: :: ..
CCDS42 GLKSNEYRNGFRDDADLPPHPRVPLKEKLCQYDEFSEGLRHSAHLNRHQRVPTGEKSVKS
270 280 290 300 310 320
330 340 350 360 370
pF1KB0 PSQKRDLDAITDIS--PKQSTHGERGHRCSDCGKFFLQASNFIQHRRIHTGEKPFKCGEC
. : . : : :. . :. .::. ::: : : .. :. .:::..:.:: ::
CCDS42 LERGRGVRQNTHIRNHPRAPV-GDMPYRCDVCGKGFRYKSVLLIHQGVHTGRRPYKCEEC
330 340 350 360 370 380
380 390 400 410 420 430
pF1KB0 GKSYNQRVHLTQHQRVHTGEKPYKCQVCGKAFRVSSHLVQHHSVHSGERPYGCNECGKNF
::.... .: :::::::::::::. :::.: :: : :. .:.::.:: :.::::.:
CCDS42 GKAFGRSSNLLVHQRVHTGEKPYKCSECGKGFSYSSVLQVHQRLHTGEKPYTCSECGKGF
390 400 410 420 430 440
440 450 460 470 480 490
pF1KB0 GRHSHLIEHLKRHFREKSQRCSDKRSKNTKLSVKKKISEYSEADMELSGKTQRNVSQVQD
.: : .: . : :: :.. . .: ....: .... .:. : .
CCDS42 CAKSALHKHQHIHPGEKPYSCGEC---GKGFSCSSHLSSHQKTH---TGERPY---QCDK
450 460 470 480 490
500 510 520 530 540 550
pF1KB0 FGEGCEFQGKLDRKQGIPMKEILGQPS--SKRMNYSEVPYVHKKSSTGERPHKCNECGKS
:.: .. :. .: . : . : . . .: ..:: .:.. :::.:.:: :::::
CCDS42 CGKGFSHNSYLQAHQRVHMGQHLYKCNVCGKSFSYSSGLLMHQRLHTGEKPYKC-ECGKS
500 510 520 530 540 550
560 570 580 590 600 610
pF1KB0 FIQSAHLIQHQRIHTGEKPFRCEECGKSYNQRVHLTQHQRVHTGEKPYTCPLCGKAFRVR
: .:. : :::.::::::..: ::::.. . : .::::::::.::.: .:::.:
CCDS42 FGRSSDLHIHQRVHTGEKPYKCSECGKGFRRNSDLHSHQRVHTGERPYVCDVCGKGFIYS
560 570 580 590 600 610
620 630 640 650 660 670
pF1KB0 SHLVQHQSVHSGERPFKCNECGKGFGRRSHLAGHLRLHSREKSHQCRECGEIFFQYVSLI
: :. :: ::.::.:.:: ::::::. : : : :.:. :: ..:.:::. : ::
CCDS42 SDLLIHQRVHTGEKPYKCAECGKGFSYSSGLLIHQRVHTGEKPYRCQECGKGFRCTSSLH
620 630 640 650 660 670
680 690 700 710 720 730
pF1KB0 EHQVLHMGQKNEKNGICEEAYSWNLTVIEDKKIELQEQPYQCDICGKAFGYSSDLIQHYR
.:: .: :.: : ...:.. .. .... :.:: : :::.: :.: :..: :
CCDS42 KHQRVHTGKKPYTCDQCGKGFSYGSNLRTHQRLHTGEKPYTCCECGKGFRYGSGLLSHKR
680 690 700 710 720 730
740 750 760 770 780 790
pF1KB0 THTAEKPYQCDICRENVGQCSHTKQHQKIYSSTKSHQCHECGRGFTLKSHLNQHQGIHTG
.::.::::.: .: .. .: :: . ::..... : ..:.:::.:: .: :. :: .:::
CCDS42 VHTGEKPYRCHVCGKGYSQSSHLQGHQRVHTGEKPYKCEECGKGFGRNSCLHVHQRVHTG
740 750 760 770 780 790
800 810 820 830
pF1KB0 EKPFQCKECGMNFSWSCSLFKHLRSHERTDPINTLSVEGSLL
:::. : :: .::.. .: .: : : .:
CCDS42 EKPYTCGVCGKGFSYTSGLRNHQRVHLGENPYK
800 810 820
839 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 01:57:44 2016 done: Sun Nov 6 01:57:45 2016
Total Scan time: 3.670 Total Display time: 0.220
Function used was FASTA [36.3.4 Apr, 2011]