FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB8402, 782 aa
1>>>pF1KB8402 782 - 782 aa - 782 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.1721+/-0.00147; mu= 19.8400+/- 0.089
mean_var=285.3877+/-51.198, 0's: 0 Z-trim(111.0): 928 B-trim: 0 in 0/50
Lambda= 0.075920
statistics sampled from 11013 (12050) to 11013 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.698), E-opt: 0.2 (0.37), width: 16
Scan time: 3.670
The best scores are: opt bits E(32554)
CCDS47738.1 ZNF786 gene_id:136051|Hs108|chr7 ( 782) 5744 643.9 2.8e-184
CCDS59379.1 ZNF850 gene_id:342892|Hs108|chr19 (1090) 1582 188.3 5.6e-47
CCDS54240.1 ZNF208 gene_id:7757|Hs108|chr19 (1280) 1495 178.9 4.4e-44
CCDS82409.1 ZNF418 gene_id:147686|Hs108|chr19 ( 591) 1473 175.9 1.6e-43
CCDS42642.1 ZNF418 gene_id:147686|Hs108|chr19 ( 676) 1473 176.0 1.8e-43
CCDS82410.1 ZNF418 gene_id:147686|Hs108|chr19 ( 697) 1473 176.1 1.8e-43
CCDS12498.1 ZNF420 gene_id:147923|Hs108|chr19 ( 688) 1472 175.9 1.9e-43
CCDS74350.1 ZNF850 gene_id:342892|Hs108|chr19 (1058) 1464 175.4 4.3e-43
CCDS33097.1 ZNF347 gene_id:84671|Hs108|chr19 ( 839) 1461 174.9 4.8e-43
CCDS54314.1 ZNF347 gene_id:84671|Hs108|chr19 ( 840) 1457 174.5 6.5e-43
CCDS31940.1 ZNF84 gene_id:7637|Hs108|chr12 ( 738) 1454 174.0 7.7e-43
CCDS46102.1 ZNF226 gene_id:7769|Hs108|chr19 ( 803) 1446 173.2 1.5e-42
CCDS33046.1 ZNF224 gene_id:7767|Hs108|chr19 ( 707) 1444 172.9 1.6e-42
CCDS46169.1 ZNF665 gene_id:79788|Hs108|chr19 ( 678) 1440 172.4 2.1e-42
CCDS13174.1 ZNF337 gene_id:26152|Hs108|chr20 ( 751) 1433 171.7 3.8e-42
CCDS12846.1 ZNF615 gene_id:284370|Hs108|chr19 ( 731) 1426 170.9 6.4e-42
CCDS82387.1 ZNF615 gene_id:284370|Hs108|chr19 ( 736) 1426 171.0 6.5e-42
CCDS59418.1 ZNF615 gene_id:284370|Hs108|chr19 ( 742) 1426 171.0 6.5e-42
CCDS12977.1 ZNF497 gene_id:162968|Hs108|chr19 ( 498) 1420 170.0 8.5e-42
CCDS10329.2 ZSCAN2 gene_id:54993|Hs108|chr15 ( 614) 1417 169.8 1.2e-41
CCDS4624.1 ZNF184 gene_id:7738|Hs108|chr6 ( 751) 1416 169.9 1.4e-41
CCDS42636.1 ZNF17 gene_id:7565|Hs108|chr19 ( 662) 1413 169.4 1.6e-41
CCDS82405.1 ZNF17 gene_id:7565|Hs108|chr19 ( 664) 1413 169.5 1.7e-41
CCDS33048.1 ZNF235 gene_id:9310|Hs108|chr19 ( 738) 1412 169.4 1.9e-41
CCDS14279.1 ZNF41 gene_id:7592|Hs108|chrX ( 779) 1412 169.5 1.9e-41
CCDS46212.1 ZNF814 gene_id:730051|Hs108|chr19 ( 855) 1412 169.5 2e-41
CCDS45012.1 ZNF268 gene_id:10795|Hs108|chr12 ( 947) 1409 169.3 2.6e-41
CCDS7198.1 ZNF33B gene_id:7582|Hs108|chr10 ( 778) 1401 168.3 4.4e-41
CCDS77297.1 ZNF546 gene_id:339327|Hs108|chr19 ( 810) 1394 167.5 7.7e-41
CCDS12548.1 ZNF546 gene_id:339327|Hs108|chr19 ( 836) 1394 167.5 7.8e-41
CCDS12497.1 ZNF345 gene_id:25850|Hs108|chr19 ( 488) 1388 166.5 9.5e-41
CCDS11180.1 ZNF624 gene_id:57547|Hs108|chr17 ( 865) 1388 166.9 1.2e-40
CCDS43307.1 PRDM9 gene_id:56979|Hs108|chr5 ( 894) 1388 166.9 1.3e-40
CCDS46101.1 ZNF234 gene_id:10780|Hs108|chr19 ( 700) 1382 166.1 1.8e-40
CCDS12955.1 ZNF530 gene_id:348327|Hs108|chr19 ( 599) 1379 165.6 2.1e-40
CCDS12505.1 ZNF571 gene_id:51276|Hs108|chr19 ( 609) 1378 165.6 2.3e-40
CCDS56092.1 ZNF568 gene_id:374900|Hs108|chr19 ( 580) 1374 165.1 3e-40
CCDS54258.1 ZNF540 gene_id:163255|Hs108|chr19 ( 628) 1374 165.1 3.1e-40
CCDS42558.1 ZNF568 gene_id:374900|Hs108|chr19 ( 644) 1374 165.2 3.1e-40
CCDS12506.1 ZNF540 gene_id:163255|Hs108|chr19 ( 660) 1374 165.2 3.2e-40
CCDS12848.1 ZNF432 gene_id:9668|Hs108|chr19 ( 652) 1369 164.6 4.6e-40
CCDS74388.1 ZNF227 gene_id:7770|Hs108|chr19 ( 748) 1369 164.7 4.9e-40
CCDS12636.1 ZNF227 gene_id:7770|Hs108|chr19 ( 799) 1369 164.8 5.1e-40
CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 1361 163.7 8.3e-40
CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 1361 163.7 8.5e-40
CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 1361 163.8 8.6e-40
CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 1361 163.8 8.7e-40
CCDS13134.1 ZNF133 gene_id:7692|Hs108|chr20 ( 653) 1360 163.6 9.2e-40
CCDS74703.1 ZNF133 gene_id:7692|Hs108|chr20 ( 667) 1360 163.7 9.3e-40
CCDS63235.1 ZNF133 gene_id:7692|Hs108|chr20 ( 591) 1357 163.2 1.1e-39
>>CCDS47738.1 ZNF786 gene_id:136051|Hs108|chr7 (782 aa)
initn: 5744 init1: 5744 opt: 5744 Z-score: 3421.8 bits: 643.9 E(32554): 2.8e-184
Smith-Waterman score: 5744; 99.9% identity (99.9% similar) in 782 aa overlap (1-782:1-782)
10 20 30 40 50 60
pF1KB8 MAEPPRLPLTFEDVAIYFSEQEWQDLEAWQKELYKHVMRSNYETLVSLDDGLPKPELISW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 MAEPPRLPLTFEDVAIYFSEQEWQDLEAWQKELYKHVMRSNYETLVSLDDGLPKPELISW
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 IEHGGEPFRKWRESQKSGNIICSSVDMHFDPGFEEQLFWGSQQAMNSGKTKSHFQLDPES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 IEHGGEPFRKWRESQKSGNIICSSVDMHFDPGFEEQLFWGSQQAMNSGKTKSHFQLDPES
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 QCSFGSFVSFRPDQGITLGSPQRHDARAPPPLACGPSESTLKEGIPGPRNLDLPGLWDVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 QCSFGSFVSFRPDQGITLGSPQRHDARAPPPLACGPSESTLKEGIPGPRNLDLPGLWDVP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB8 AWESTQHPWPVCGESCWENNHLVMHQRGHSKDRTRRAWEKFNKRAETQMPWSSPRVQRHF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 AWESTQHPWPVCGESCWENNHLVMHQRGHSKDRTRRAWEKFNKRAETQMPWSSPRVQRHF
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB8 RCGVCGKSFRRKLCLLRHLAAHTGRGPFRNADGEMCFRHELTHPSHRLPQQGEKPAQCTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 RCGVCGKSFRRKLCLLRHLAAHTGRGPFRNADGEMCFRHELTHPSHRLPQQGEKPAQCTP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB8 CGKRSLPVDSTQARRCQHSREGPASWREGRGASSSVHSGQKPGSRLPQEGNSHQEGDTEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 CGKRSLPVDSTQARRCQHSREGPASWREGRGASSSVHSGQKPGSRLPQEGNSHQEGDTEA
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB8 LQHGAEGPCSCSECGERSPMSARLASPCRAHTGEKPFQCAHCTKRFRLRRLLQVHQHAHG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 LQHGAEGPCSCSECGERSPMSARLASPCRAHTGEKPFQCAHCTKRFRLRRLLQVHQHAHG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB8 GERPFSCRKCGKGFAKQCKLTEHIRVHSGEKPFRCAKCGRNFRQRGQLLRHQRLHTDEKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 GERPFSCRKCGKGFAKQCKLTEHIRVHSGEKPFRCAKCGRNFRQRGQLLRHQRLHTDEKP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB8 FQCPECGLSFRLESMLRAHRLRHGGERPFSCSECGRGFTHQCKLREHLRVHSGERPFQCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 FQCPECGLSFRLESMLRAHRLRHGGERPFSCSECGRGFTHQCKLREHLRVHSGERPFQCL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB8 KCDKRFRLKGILKAHQHTHSKERPFSCGECGKGFTRQSKLTEHLRVHSGERPFQCPECNR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 KCDKRFRLKGILKAHQHTHSKERPFSCGECGKGFTRQSKLTEHLRVHSGERPFQCPECNR
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB8 SFRLKGQLLSHQRLHTGERPFQCPECDKRYRVKADMKAHQLLHSGEMPFSCECGKGFVKH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 SFRLKGQLLSHQRLHTGERPFQCPECDKRYRVKADMKAHQLLHSGEMPFSCECGKGFVKH
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB8 SKLIEHIRTHTGEKPFQCPKCDKSFRLKAQLLSHQGLHTGERPFHCPECDKNFWERGHML
::::::::::::::::::::::::::::::::::::::::::::::::::::: ::::::
CCDS47 SKLIEHIRTHTGEKPFQCPKCDKSFRLKAQLLSHQGLHTGERPFHCPECDKNFRERGHML
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB8 RHQRIHRPERPFACGDCGKGFIYKSKLAEHIRVHTKSCPAPNELDIKKRLSQLFAMIEAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 RHQRIHRPERPFACGDCGKGFIYKSKLAEHIRVHTKSCPAPNELDIKKRLSQLFAMIEAD
730 740 750 760 770 780
pF1KB8 WS
::
CCDS47 WS
>>CCDS59379.1 ZNF850 gene_id:342892|Hs108|chr19 (1090 aa)
initn: 8886 init1: 1047 opt: 1582 Z-score: 956.9 bits: 188.3 E(32554): 5.6e-47
Smith-Waterman score: 1736; 35.5% identity (61.7% similar) in 772 aa overlap (11-759:9-756)
10 20 30 40 50 60
pF1KB8 MAEPPRLPLTFEDVAIYFSEQEWQDLEAWQKELYKHVMRSNYETLVSLDDGLPKPELISW
:.:..: ::..::. :.: ::.::. :: :: .:::: ..:::..::
CCDS59 MNMEGLVMFQDLSIDFSQEEWECLDAAQKDLYRDVMMENYSSLVSLGLSIPKPDVISL
10 20 30 40 50
70 80 90 100 110
pF1KB8 IEHGGEPFRKWRESQ----KSGNIICSSVDMHFDPGFEEQLF--WGSQQAMNS--GKT--
.:.: ::. :. ..... :.. : . . : : .. .: :..
CCDS59 LEQGKEPWMVSRDVLGGWCRDSEFRCKTKDSCLPKEIYEVTSSQWVRMEKCHSLVGSSVR
60 70 80 90 100 110
120 130 140 150 160
pF1KB8 -----KSHFQLDPESQCSF--GSFVSFRPDQGITLGSPQRHDARAPPPLACGPSESTLKE
:..:: . .: . ...... . : . : : : . :
CCDS59 DDWECKGQFQHQDINQERYLEKAIMTYETTPTFCLQTSLTLHHRIHP----GEKLYKSTE
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB8 GIPGPRNLDLPGLWDVPAWESTQHPWPVCGESCWENNHLVMHQRGHSKDRT---RRAWEK
. . .: .. . :. . ::.. . ..:: ::: :. .. .. .
CCDS59 CMAFKYGSELTQQQETHTGEKL-YKCKECGKAFHHFSYLVKHQRIHTGEKPCACKEYGKA
180 190 200 210 220 230
230 240 250 260 270 280
pF1KB8 FNKRAETQMPWSSPRVQRHFRCGVCGKSFRRKLCLLRHLAAHTGRGPFRNADGEMCFRHE
: . .. . . .: .: :.:: . :..: ::: :.. . :
CCDS59 FISGSHLIQHQKMYTDERPHECQESVKAFRPSAHLIQHWRIHTGDKPYECKECGKSFTSG
240 250 260 270 280 290
290 300 310 320 330
pF1KB8 LTHPSHRLPQQGEKPAQCTPCGKRSLPVDSTQARRCQ-HSREGPASWRE-GRGASSSVHS
: .:. . :::: .: ::: :. : :: :. : :. : : . .: :.. .:
CCDS59 STLNQHQQIHTGEKPYHCKQCGK-SFTVGSTLIRHQQIHTGEKPYDCKECGKSFAS----
300 310 320 330 340
340 350 360 370 380 390
pF1KB8 GQKPGSRLPQEGNSHQEGDTEALQHGAEGPCSCSECGERSPMSARLASPCRAHTGEKPFQ
:: : . ::. : .: : .:.:::. . . : : ::::::..
CCDS59 ----GSALIR----HQR------IHTGEKPYDCKECGKSFTFHSALIRHQRIHTGEKPYD
350 360 370 380 390
400 410 420 430 440 450
pF1KB8 CAHCTKRFRLRRLLQVHQHAHGGERPFSCRKCGKGFAKQCKLTEHIRVHSGEKPFRCAKC
: .: : : .: : :: : ::.:..:..:::.:. : .: :.:.::::. : .:
CCDS59 CKECGKSFTFRSGLIGHQAIHTGEKPYDCKECGKSFTAGSTLIQHQRIHTGEKPYDCKEC
400 410 420 430 440 450
460 470 480 490 500 510
pF1KB8 GRNFRQRGQLLRHQRLHTDEKPFQCPECGLSFRLESMLRAHRLRHGGERPFSCSECGRGF
:..: . . ::.:::.:: :::. : ::: :: ..: :. : ::.:..:.:::..:
CCDS59 GKSFASGSALLQHQRIHTGEKPYCCKECGKSFTFRSTRNRHQRIHTGEKPYNCKECGKSF
460 470 480 490 500 510
520 530 540 550 560 570
pF1KB8 THQCKLREHLRVHSGERPFQCLKCDKRFRLKGILKAHQHTHSKERPFSCGECGKGFTRQS
. : .: :.:.::.:..: .: : : ... : .:: .:. :.:..: ::::.:: .:
CCDS59 ASGSALLQHQRIHTGEKPYHCKECGKSFTFRSGLIGHQAVHTGEKPYDCKECGKSFTSRS
520 530 540 550 560 570
580 590 600 610 620 630
pF1KB8 KLTEHLRVHSGERPFQCPECNRSFRLKGQLLSHQRLHTGERPFQCPECDKRYRVKADMKA
: .: :.:.::.:..: ::..:: . . ::.::..::::.:..: :: : .:.. .
CCDS59 ALIQHQRIHTGEKPYHCKECGKSFTVGSTLLQHQQIHTGEKPYDCKECGKAFRLRLRLTQ
580 590 600 610 620 630
640 650 660 670 680 690
pF1KB8 HQLLHSGEMPFSC-ECGKGFVKHSKLIEHIRTHTGEKPFQCPKCDKSFRLKAQLLSHQGL
:: .:.:: :..: ::::.::. : : .: : ::::::..:: : :.:: .. : .:. .
CCDS59 HQQIHTGEKPYQCQECGKAFVSVSGLTQHHRIHTGEKPYECPDCGKAFRQRTYLNQHRRI
640 650 660 670 680 690
700 710 720 730 740 750
pF1KB8 HTGERPFHCPECDKNFWERGHMLRHQRIHRPERPFACGDCGKGFIYKSKLAEHIRVHTKS
::::.:..: :: :.: . ...::. : :.:. .:::.: .: : .: ..::
CCDS59 HTGEKPYECKECGKSFTFCSGLIQHQQNHTDEKPYDGKECGKSFTSHSTLIQHQQIHTGE
700 710 720 730 740 750
760 770 780
pF1KB8 CPAPNELDIKKRLSQLFAMIEADWS
:
CCDS59 KPYDCKECGKSFTSHSTLIQHQQIHTGEKLYDCKECGKSFTSHSTLIQHQPLHTGEKPYH
760 770 780 790 800 810
>--
initn: 1998 init1: 1036 opt: 1086 Z-score: 663.3 bits: 134.0 E(32554): 1.3e-30
Smith-Waterman score: 1247; 45.5% identity (75.6% similar) in 332 aa overlap (425-754:757-1087)
400 410 420 430 440 450
pF1KB8 KPFQCAHCTKRFRLRRLLQVHQHAHGGERPFSCRKCGKGFAKQCKLTEHIRVHSGEKPFR
..:..:::.:... : .: ..:.::: .
CCDS59 KPYDGKECGKSFTSHSTLIQHQQIHTGEKPYDCKECGKSFTSHSTLIQHQQIHTGEKLYD
730 740 750 760 770 780
460 470 480 490 500 510
pF1KB8 CAKCGRNFRQRGQLLRHQRLHTDEKPFQCPECGLSFRLESMLRAHRLRHGGERPFSCSEC
: .::..: ... :..:: ::: :::..: ::: :: :.: : :: : ::. .::.::
CCDS59 CKECGKSFTSHSTLIQHQPLHTGEKPYHCKECGKSFTLRSALIQHRPVHTGEKRYSCKEC
790 800 810 820 830 840
520 530 540 550 560 570
pF1KB8 GRGFTHQCKLREHLRVHSGERPFQCLKCDKRFRLKGILKAHQHTHSKERPFSCGECGKGF
:..:: . : :: :.:.::.:..: .: : : ... . :.. :. :.:..: ::::.:
CCDS59 GKSFTSRSTLIEHQRIHTGEKPYHCKECGKSFAFRSAIIQHRRIHTGEKPYDCKECGKAF
850 860 870 880 890 900
580 590 600 610 620 630
pF1KB8 TRQSKLTEHLRVHSGERPFQCPECNRSF-RLKGQLLSHQRLHTGERPFQCPECDKRYRVK
:.::::.: :.:.::.:..: ::...: :..: : .:. .::::.:..: : : .: .
CCDS59 RRRSKLTQHQRIHTGEKPYRCHECGKAFVRFSG-LTKHHSIHTGEKPYECKTCGKSFRQR
910 920 930 940 950 960
640 650 660 670 680 690
pF1KB8 ADMKAHQLLHSGEMPFSC-ECGKGFVKHSKLIEHIRTHTGEKPFQCPKCDKSFRLKAQLL
. . :: .:.:. :. : ::::.:. :.::.: ::::::::..: .: :.:: .::
CCDS59 THLTLHQRIHTGDRPYECKECGKSFTCGSELIRHQRTHTGEKPYDCKECGKAFRCPSQLS
970 980 990 1000 1010 1020
700 710 720 730 740 750
pF1KB8 SHQGLHTGERPFHCPECDKNFWERGHMLRHQRIHRPERPFACGDCGKGFIYKSKLAEHIR
.:. .::::. ..:::: : :. . . ::: .: :.:. : :::.: ..:..: :
CCDS59 QHKRIHTGEKTYQCPECGKAFFYASGLSRHQSVHTGEKPYECKTCGKAFKQLTQLTRHQR
1030 1040 1050 1060 1070 1080
760 770 780
pF1KB8 VHTKSCPAPNELDIKKRLSQLFAMIEADWS
.:
CCDS59 IHDLT
1090
>>CCDS54240.1 ZNF208 gene_id:7757|Hs108|chr19 (1280 aa)
initn: 1001 init1: 1001 opt: 1495 Z-score: 904.8 bits: 178.9 E(32554): 4.4e-44
Smith-Waterman score: 1502; 34.5% identity (62.6% similar) in 588 aa overlap (192-763:318-892)
170 180 190 200 210
pF1KB8 KEGIPGPRNLDLPGLWDVPAWESTQHPWPVCGESCWENNHLVMHQRGHSKDRTRR-----
::.. . . :. :. :. .. .
CCDS54 EECGKAFSKVSTLTTHKAIHAGEKPYKCKECGKAFSKVSTLITHKAIHAGEKPYKCKECG
290 300 310 320 330 340
220 230 240 250 260 270
pF1KB8 -AWEKFNKRAETQMPWSSPRVQRHFRCGVCGKSFRRKLCLLRHLAAHTGRGPFRNADGEM
:. ::. .. .. .. .. ..: :::... : : :::. :.. .
CCDS54 KAFSKFSILTKHKVIHTG---EKPYKCEECGKAYKWPSTLSYHKKIHTGEKPYKCEECGK
350 360 370 380 390 400
280 290 300 310 320 330
pF1KB8 CFRHELTHPSHRLPQQGEKPAQCTPCGKRSLPVDSTQARRCQHSREGPASWRE-GRGAS-
: .:.. . :::: .: ::: .. . .. :. : : . .: :.: :
CCDS54 GFSMFSILTKHEVIHTGEKPYKCEECGKAFNWSSNLMEHKKIHTGETPYKCEECGKGFSM
410 420 430 440 450 460
340 350 360 370 380
pF1KB8 -------SSVHSGQKPGSRLPQEGNSHQEGDTEALQHGAEGPCSCSECGERSPMSARLAS
. .:.:.:: .. . . :..: : .: :::. :. :
CCDS54 FSILTKHKVIHNGEKP----------YKCEECDKATHAGEKPYKCEECGKAFNWSSNLME
470 480 490 500 510
390 400 410 420 430 440
pF1KB8 PCRAHTGEKPFQCAHCTKRFRLRRLLQVHQHAHGGERPFSCRKCGKGFAKQCKLTEHIRV
: ::::::..: .: : : .: :. : ::.:..:..:::.. . :. : ..
CCDS54 HKRIHTGEKPYKCEECGKSFSTFSILTKHKVIHTGEKPYKCEECGKAYKWSSTLSYHKKI
520 530 540 550 560 570
450 460 470 480 490 500
pF1KB8 HSGEKPFRCAKCGRNFRQRGQLLRHQRLHTDEKPFQCPECGLSFRLESMLRAHRLRHGGE
:. :::..: .::. : : . :..:.:.:: :::..: ::: .: : : .:. :.::
CCDS54 HTVEKPYKCEECGKAFNQSAILIKHKRIHTGEKPYKCEECGKTFSKVSTLTTHKAIHAGE
580 590 600 610 620 630
510 520 530 540 550 560
pF1KB8 RPFSCSECGRGFTHQCKLREHLRVHSGERPFQCLKCDKRFRLKGILKAHQHTHSKERPFS
.:..:.:::. : . : : .:.::.:..: .: : : .:: :. :. :.:..
CCDS54 KPYKCKECGKTFIKVSTLTTHKAIHAGEKPYKCKECGKAFSKFSILTKHKVIHTGEKPYK
640 650 660 670 680 690
570 580 590 600 610 620
pF1KB8 CGECGKGFTRQSKLTEHLRVHSGERPFQCPECNRSFRLKGQLLSHQRLHTGERPFQCPEC
: ::::.:. .:.: :: :.:.::.:..: ::..:: . : .:. .::::.:..: ::
CCDS54 CEECGKAFNWSSNLMEHKRIHTGEKPYKCEECGKSFSTFSVLTKHKVIHTGEKPYKCEEC
700 710 720 730 740 750
630 640 650 660 670 680
pF1KB8 DKRYRVKADMKAHQLLHSGEMPFSCE-CGKGFVKHSKLIEHIRTHTGEKPFQCPKCDKSF
: :. .. .. :. .:. : :..:: :::.: . . ::.: : :: :::..: .: :.:
CCDS54 GKAYKWSSTLSYHKKIHTVEKPYKCEECGKAFNRSAILIKHKRIHTDEKPYKCEECGKTF
760 770 780 790 800 810
690 700 710 720 730 740
pF1KB8 RLKAQLLSHQGLHTGERPFHCPECDKNFWERGHMLRHQRIHRPERPFACGDCGKGFIYKS
. : .:...:.::.:..: :: : : . . . .:. :: :.:. : .:::.. . :
CCDS54 SKVSTLTTHKAIHAGEKPYKCKECGKAFSKFSILTKHKVIHTGEKPYKCEECGKAYKWPS
820 830 840 850 860 870
750 760 770 780
pF1KB8 KLAEHIRVHTKSCPAPNELDIKKRLSQLFAMIEADWS
:. : ..:: : :
CCDS54 TLSYHKKIHTGEKPYKCEECGKGFSMFSILTKHEVIHTGEKPYKCEECGKAFSWLSVFSK
880 890 900 910 920 930
>--
initn: 926 init1: 926 opt: 968 Z-score: 592.9 bits: 121.2 E(32554): 1.1e-26
Smith-Waterman score: 1227; 39.8% identity (69.0% similar) in 384 aa overlap (373-755:893-1276)
350 360 370 380 390 400
pF1KB8 GSRLPQEGNSHQEGDTEALQHGAEGPCSCSECGERSPMSARLASPCRAHTGEKPFQCAHC
:::. : . :.. ::::::..: .:
CCDS54 CEECGKAYKWPSTLSYHKKIHTGEKPYKCEECGKGFSMFSILTKHEVIHTGEKPYKCEEC
870 880 890 900 910 920
410 420 430 440 450 460
pF1KB8 TKRFRLRRLLQVHQHAHGGERPFSCRKCGKGFAKQCKLTEHIRVHSGEKPFRCAKCGRNF
: : ... :...:.::. ..:. :::.. .. :. : ..:. :::.. .::..:
CCDS54 GKAFSWLSVFSKHKKTHAGEKFYKCEACGKAYKSSSTLSYHKKIHTEEKPYKYEECGKGF
930 940 950 960 970 980
470 480 490 500 510 520
pF1KB8 RQRGQLLRHQRLHTDEKPFQCPECGLSFRLESMLRAHRLRHGGERPFSCSECGRGFTHQC
. : .:. .:: :::..: ::: .: : : :. : :: :..: :: ..:.
CCDS54 STFSILTKHKVIHTGEKPYKCEECGKAFNWSSNLMEHKKIHTGETPYKCEECDKAFSWPS
990 1000 1010 1020 1030 1040
530 540 550 560 570 580
pF1KB8 KLREHLRVHSGERPFQCLKCDKRFRLKGILKAHQHTHSKERPFSCGECGKGFTRQSKLTE
.: :: .:.::.:..: .: : : . : :. ::. :.:..: ::::.:. .:.: :
CCDS54 SLTEHKATHAGEKPYKCEECGKAFSWPSRLTEHKATHAGEEPYKCEECGKAFNWSSNLME
1050 1060 1070 1080 1090 1100
590 600 610 620 630 640
pF1KB8 HLRVHSGERPFQCPECNRSFRLKGQLLSHQRLHTGERPFQCPECDKRYRVKADMKAHQLL
: :.:.::.:..: ::..:: . : .:. .::::.:..: :: : :. .. .. :. .
CCDS54 HKRIHTGEKPYKCEECGKSFSTFSILTKHKVIHTGEKPYKCEECGKAYKWSSTLSYHKKI
1110 1120 1130 1140 1150 1160
650 660 670 680 690 700
pF1KB8 HSGEMPFSCE-CGKGFVKHSKLIEHIRTHTGEKPFQCPKCDKSFRLKAQLLSHQGLHTGE
:. : :..:: :::::: : : .: ::::: ..: .: :... . : :. .::::
CCDS54 HTVEKPYKCEECGKGFVMFSILAKHKVIHTGEKLYKCEECGKAYKWPSTLRYHKKIHTGE
1170 1180 1190 1200 1210 1220
710 720 730 740 750 760
pF1KB8 RPFHCPECDKNFWERGHMLRHQRIHRPERPFACGDCGKGFIYKSKLAEHIRVHTKSCPAP
.:..: :: : : . . .:. :: :.:. : .:::.: . : ...: ..::
CCDS54 KPYKCEECGKAFSTFSILTKHKVIHTGEKPYKCEECGKAFSWLSVFSKHKKIHTGEKL
1230 1240 1250 1260 1270 1280
770 780
pF1KB8 NELDIKKRLSQLFAMIEADWS
>>CCDS82409.1 ZNF418 gene_id:147686|Hs108|chr19 (591 aa)
initn: 6253 init1: 1064 opt: 1473 Z-score: 894.6 bits: 175.9 E(32554): 1.6e-43
Smith-Waterman score: 1494; 39.5% identity (65.3% similar) in 554 aa overlap (258-778:11-551)
230 240 250 260 270 280
pF1KB8 QMPWSSPRVQRHFRCGVCGKSFRRKLCLLRHLAAHTGRGPFRNADGEMCFRHELTHPSHR
::: : : .. . ..: :.:
CCDS82 MCGAILGDILHLADHQGTHHKQKLHRCEAWGNKLYDSSNR
10 20 30 40
290 300 310 320 330
pF1KB8 LPQQ----GEKPAQCTPCGKRSLPVDSTQARRCQ-H-SREGPASWREGRG--ASSSV---
:.: :::: :: .. ..::. : :.:. . :. ::..
CCDS82 -PHQNQYLGEKPY-------RSSVEEALFVKRCKFHVSEESSIFIQSGKDFLPSSGLLLQ
50 60 70 80 90
340 350 360 370
pF1KB8 ---HSGQKPGSRLPQEGNSHQEGDT-----EALQHGAEG---------P----CSCSECG
:.:.: .:. :. . : ::: : ..:.. : : : :::
CCDS82 EATHTGEKSNSK-PECESPFQWGDTHYSCGECMKHSSTKHVFVQQQRLPSREECYCWECG
100 110 120 130 140 150
380 390 400 410 420 430
pF1KB8 ERSPMSARLASPCRAHTGEKPFQCAHCTKRFRLRRLLQVHQHAHGGERPFSCRKCGKGFA
. ... :.:::..:..:..: : : . : ::..: :.::. : .:::.:.
CCDS82 KSFSKYDSVSNHQRVHTGKRPYECGECGKSFSHKGSLVQHQRVHTGKRPYECGECGKSFS
160 170 180 190 200 210
440 450 460 470 480 490
pF1KB8 KQCKLTEHIRVHSGEKPFRCAKCGRNFRQRGQLLRHQRLHTDEKPFQCPECGLSFRLESM
.. .:..: :::.::.:..:..::..: : : :..:::.:: :.:..: ::: : ..
CCDS82 HKGSLVQHQRVHTGERPYECGECGKSFSQNGTLIKHQRVHTGERPYECEECGKCFTQKGN
220 230 240 250 260 270
500 510 520 530 540 550
pF1KB8 LRAHRLRHGGERPFSCSECGRGFTHQCKLREHLRVHSGERPFQCLKCDKRFRLKGILKAH
: :. : .:::. : :::. :... : :: :::. :::..: .: : : :: :. :
CCDS82 LIQHQRGHTSERPYECEECGKCFSQKGTLTEHHRVHTRERPYECGECGKSFSRKGHLRNH
280 290 300 310 320 330
560 570 580 590 600 610
pF1KB8 QHTHSKERPFSCGECGKGFTRQSKLTEHLRVHSGERPFQCPECNRSFRLKGQLLSHQRLH
:. :. :::. ::::::.:.:...: .: : :.::::..: :: . :: :..:. :::.:
CCDS82 QRGHTGERPYECGECGKSFSRKGNLIQHQRSHTGERPYECRECRKLFRGKSHLIEHQRVH
340 350 360 370 380 390
620 630 640 650 660 670
pF1KB8 TGERPFQCPECDKRYRVKADMKAHQLLHSGEMPFSC-ECGKGFVKHSKLIEHIRTHTGEK
:::::..: :: : .. .. ...:: .:.:: :: : ::::.: . .:..: :.::::.
CCDS82 TGERPYECNECGKSFQDSSGFRVHQRVHTGEKPFECSECGKSFPQSCSLLRHRRVHTGER
400 410 420 430 440 450
680 690 700 710 720 730
pF1KB8 PFQCPKCDKSFRLKAQLLSHQGLHTGERPFHCPECDKNFWERGHMLRHQRIHRPERPFAC
:..: .: :::. ...:: :: ::.:::..: :: : : . .:.:.:.: :::. :
CCDS82 PYECGECGKSFHQSSSLLRHQKTHTAERPYECRECGKFF---SSLLEHRRVHTGERPYEC
460 470 480 490 500
740 750 760 770 780
pF1KB8 GDCGKGFIYKSKLAEHIRVHTKSCPAPNELDIKKRLSQLFAMIEADWS
.::: : .: .: :.::.. : . : ... :.. :
CCDS82 RECGKTFTRRSAHFKHQRLHTRGKPYECS-ECGKSFAETFSLTEHRRVHTGERPYECSEC
510 520 530 540 550 560
CCDS82 GKSFHRSSSLLRHQRVHTERSPYK
570 580 590
>>CCDS42642.1 ZNF418 gene_id:147686|Hs108|chr19 (676 aa)
initn: 6253 init1: 1064 opt: 1473 Z-score: 894.1 bits: 176.0 E(32554): 1.8e-43
Smith-Waterman score: 1506; 38.2% identity (64.2% similar) in 587 aa overlap (225-778:67-636)
200 210 220 230 240 250
pF1KB8 SCWENNHLVMHQRGHSKDRTRRAWEKFNKRAETQMPWSSPRVQRHFRCGVCGKSFRRKLC
.... : .. .. : .:: . :
CCDS42 NWVLISSLGCWCGSEDEEAPSKKSISIQRVSQVSTPGAGVSPKKAHSCEMCGAILGDIL-
40 50 60 70 80 90
260 270 280 290 300 310
pF1KB8 LLRHLAAHTGRGPFRNADGEMCFRHELTHPSHRLPQQ----GEKPAQCTPCGKRSLPVDS
::: : : .. . ..: :.: :.: :::: :: ..
CCDS42 ---HLADHQGTHHKQKLHRCEAWGNKLYDSSNR-PHQNQYLGEKPY-------RSSVEEA
100 110 120 130 140
320 330 340 350
pF1KB8 TQARRCQ-H-SREGPASWREGRG--ASSSV------HSGQKPGSRLPQEGNSHQEGDT--
..::. : :.:. . :. ::.. :.:.: .:. :. . : :::
CCDS42 LFVKRCKFHVSEESSIFIQSGKDFLPSSGLLLQEATHTGEKSNSK-PECESPFQWGDTHY
150 160 170 180 190 200
360 370 380 390 400
pF1KB8 ---EALQHGAEG---------P----CSCSECGERSPMSARLASPCRAHTGEKPFQCAHC
: ..:.. : : : :::. ... :.:::..:..:..:
CCDS42 SCGECMKHSSTKHVFVQQQRLPSREECYCWECGKSFSKYDSVSNHQRVHTGKRPYECGEC
210 220 230 240 250 260
410 420 430 440 450 460
pF1KB8 TKRFRLRRLLQVHQHAHGGERPFSCRKCGKGFAKQCKLTEHIRVHSGEKPFRCAKCGRNF
: : . : ::..: :.::. : .:::.:... .:..: :::.::.:..:..::..:
CCDS42 GKSFSHKGSLVQHQRVHTGKRPYECGECGKSFSHKGSLVQHQRVHTGERPYECGECGKSF
270 280 290 300 310 320
470 480 490 500 510 520
pF1KB8 RQRGQLLRHQRLHTDEKPFQCPECGLSFRLESMLRAHRLRHGGERPFSCSECGRGFTHQC
: : :..:::.:: :.:..: ::: : .. : :. : .:::. : :::. :...
CCDS42 SQNGTLIKHQRVHTGERPYECEECGKCFTQKGNLIQHQRGHTSERPYECEECGKCFSQKG
330 340 350 360 370 380
530 540 550 560 570 580
pF1KB8 KLREHLRVHSGERPFQCLKCDKRFRLKGILKAHQHTHSKERPFSCGECGKGFTRQSKLTE
: :: :::. :::..: .: : : :: :. ::. :. :::. ::::::.:.:...: .
CCDS42 TLTEHHRVHTRERPYECGECGKSFSRKGHLRNHQRGHTGERPYECGECGKSFSRKGNLIQ
390 400 410 420 430 440
590 600 610 620 630 640
pF1KB8 HLRVHSGERPFQCPECNRSFRLKGQLLSHQRLHTGERPFQCPECDKRYRVKADMKAHQLL
: : :.::::..: :: . :: :..:. :::.::::::..: :: : .. .. ...:: .
CCDS42 HQRSHTGERPYECRECRKLFRGKSHLIEHQRVHTGERPYECNECGKSFQDSSGFRVHQRV
450 460 470 480 490 500
650 660 670 680 690 700
pF1KB8 HSGEMPFSC-ECGKGFVKHSKLIEHIRTHTGEKPFQCPKCDKSFRLKAQLLSHQGLHTGE
:.:: :: : ::::.: . .:..: :.::::.:..: .: :::. ...:: :: ::.:
CCDS42 HTGEKPFECSECGKSFPQSCSLLRHRRVHTGERPYECGECGKSFHQSSSLLRHQKTHTAE
510 520 530 540 550 560
710 720 730 740 750 760
pF1KB8 RPFHCPECDKNFWERGHMLRHQRIHRPERPFACGDCGKGFIYKSKLAEHIRVHTKSCPAP
::..: :: : : . .:.:.:.: :::. : .::: : .: .: :.::.. :
CCDS42 RPYECRECGKFF---SSLLEHRRVHTGERPYECRECGKTFTRRSAHFKHQRLHTRGKPYE
570 580 590 600 610 620
770 780
pF1KB8 NELDIKKRLSQLFAMIEADWS
. : ... :.. :
CCDS42 CS-ECGKSFAETFSLTEHRRVHTGERPYECSECGKSFHRSSSLLRHQRVHTERSPYK
630 640 650 660 670
>>CCDS82410.1 ZNF418 gene_id:147686|Hs108|chr19 (697 aa)
initn: 6253 init1: 1064 opt: 1473 Z-score: 894.0 bits: 176.1 E(32554): 1.8e-43
Smith-Waterman score: 1506; 38.2% identity (64.2% similar) in 587 aa overlap (225-778:88-657)
200 210 220 230 240 250
pF1KB8 SCWENNHLVMHQRGHSKDRTRRAWEKFNKRAETQMPWSSPRVQRHFRCGVCGKSFRRKLC
.... : .. .. : .:: . :
CCDS82 NWVLISSLGCWCGSEDEEAPSKKSISIQRVSQVSTPGAGVSPKKAHSCEMCGAILGDIL-
60 70 80 90 100 110
260 270 280 290 300 310
pF1KB8 LLRHLAAHTGRGPFRNADGEMCFRHELTHPSHRLPQQ----GEKPAQCTPCGKRSLPVDS
::: : : .. . ..: :.: :.: :::: :: ..
CCDS82 ---HLADHQGTHHKQKLHRCEAWGNKLYDSSNR-PHQNQYLGEKPY-------RSSVEEA
120 130 140 150 160
320 330 340 350
pF1KB8 TQARRCQ-H-SREGPASWREGRG--ASSSV------HSGQKPGSRLPQEGNSHQEGDT--
..::. : :.:. . :. ::.. :.:.: .:. :. . : :::
CCDS82 LFVKRCKFHVSEESSIFIQSGKDFLPSSGLLLQEATHTGEKSNSK-PECESPFQWGDTHY
170 180 190 200 210 220
360 370 380 390 400
pF1KB8 ---EALQHGAEG---------P----CSCSECGERSPMSARLASPCRAHTGEKPFQCAHC
: ..:.. : : : :::. ... :.:::..:..:..:
CCDS82 SCGECMKHSSTKHVFVQQQRLPSREECYCWECGKSFSKYDSVSNHQRVHTGKRPYECGEC
230 240 250 260 270 280
410 420 430 440 450 460
pF1KB8 TKRFRLRRLLQVHQHAHGGERPFSCRKCGKGFAKQCKLTEHIRVHSGEKPFRCAKCGRNF
: : . : ::..: :.::. : .:::.:... .:..: :::.::.:..:..::..:
CCDS82 GKSFSHKGSLVQHQRVHTGKRPYECGECGKSFSHKGSLVQHQRVHTGERPYECGECGKSF
290 300 310 320 330 340
470 480 490 500 510 520
pF1KB8 RQRGQLLRHQRLHTDEKPFQCPECGLSFRLESMLRAHRLRHGGERPFSCSECGRGFTHQC
: : :..:::.:: :.:..: ::: : .. : :. : .:::. : :::. :...
CCDS82 SQNGTLIKHQRVHTGERPYECEECGKCFTQKGNLIQHQRGHTSERPYECEECGKCFSQKG
350 360 370 380 390 400
530 540 550 560 570 580
pF1KB8 KLREHLRVHSGERPFQCLKCDKRFRLKGILKAHQHTHSKERPFSCGECGKGFTRQSKLTE
: :: :::. :::..: .: : : :: :. ::. :. :::. ::::::.:.:...: .
CCDS82 TLTEHHRVHTRERPYECGECGKSFSRKGHLRNHQRGHTGERPYECGECGKSFSRKGNLIQ
410 420 430 440 450 460
590 600 610 620 630 640
pF1KB8 HLRVHSGERPFQCPECNRSFRLKGQLLSHQRLHTGERPFQCPECDKRYRVKADMKAHQLL
: : :.::::..: :: . :: :..:. :::.::::::..: :: : .. .. ...:: .
CCDS82 HQRSHTGERPYECRECRKLFRGKSHLIEHQRVHTGERPYECNECGKSFQDSSGFRVHQRV
470 480 490 500 510 520
650 660 670 680 690 700
pF1KB8 HSGEMPFSC-ECGKGFVKHSKLIEHIRTHTGEKPFQCPKCDKSFRLKAQLLSHQGLHTGE
:.:: :: : ::::.: . .:..: :.::::.:..: .: :::. ...:: :: ::.:
CCDS82 HTGEKPFECSECGKSFPQSCSLLRHRRVHTGERPYECGECGKSFHQSSSLLRHQKTHTAE
530 540 550 560 570 580
710 720 730 740 750 760
pF1KB8 RPFHCPECDKNFWERGHMLRHQRIHRPERPFACGDCGKGFIYKSKLAEHIRVHTKSCPAP
::..: :: : : . .:.:.:.: :::. : .::: : .: .: :.::.. :
CCDS82 RPYECRECGKFF---SSLLEHRRVHTGERPYECRECGKTFTRRSAHFKHQRLHTRGKPYE
590 600 610 620 630 640
770 780
pF1KB8 NELDIKKRLSQLFAMIEADWS
. : ... :.. :
CCDS82 CS-ECGKSFAETFSLTEHRRVHTGERPYECSECGKSFHRSSSLLRHQRVHTERSPYK
650 660 670 680 690
>>CCDS12498.1 ZNF420 gene_id:147923|Hs108|chr19 (688 aa)
initn: 5961 init1: 1041 opt: 1472 Z-score: 893.5 bits: 175.9 E(32554): 1.9e-43
Smith-Waterman score: 1563; 39.3% identity (65.7% similar) in 539 aa overlap (221-755:120-638)
200 210 220 230 240 250
pF1KB8 VCGESCWENNHLVMHQRGHSKDRTRRAWEKFNKRAETQMPWSSPRVQRHFRCGVCGKSFR
::... .. ... ..: :::.::
CCDS12 LEAKGKMEKQQENQKEYFRQGMIIYDKMSIFNQHTYLSQHSRCHSTEKPYKCKECGKAFR
90 100 110 120 130 140
260 270 280 290 300 310
pF1KB8 RKLCLLRHLAAHTGRGPFRNADGEMCFRHELTHPSHRLPQQGEKPAQCTPCGKRSLPVDS
: : .: . :::. :.. . : .. :. . :::: : ::: ..:
CCDS12 RASHLTQHQSIHTGEKPYECKQCGKAFSRDSQLSLHQRLHTGEKPYACKECGKAF--TQS
150 160 170 180 190 200
320 330 340 350 360
pF1KB8 TQARRCQHSREGPASWREGRGASSSVHSGQKPGSRLPQEGNSHQEGDTEALQ---HGAEG
.: : : .:.:.:: . . :.. ... . . : .:
CCDS12 SQL--ILHHR---------------IHTGEKP-YKCEECGKAFIRSSQLTRHQKVHTGEK
210 220 230 240
370 380 390 400 410 420
pF1KB8 PCSCSECGERSPMSARLASPCRAHTGEKPFQCAHCTKRFRLRRLLQVHQHAHGGERPFSC
: :.:::. ....:. : ::::: ..: .: : : : .:.. : ::.:. :
CCDS12 PYECKECGKAFTQNSQLTLHQRLHTGEKLYECKECRKVFTQLSQLILHKRIHTGEKPYEC
250 260 270 280 290 300
430 440 450 460 470 480
pF1KB8 RKCGKGFAKQCKLTEHIRVHSGEKPFRCAKCGRNFRQRGQLLRHQRLHTDEKPFQCPECG
..:::.: .:..: ..:.::::..: .::: : . . :..:::.:: :::..: :::
CCDS12 KECGKAFICGSQLSQHQKIHNGEKPYECKECGRAFIRGSLLMQHQRIHTGEKPYKCEECG
310 320 330 340 350 360
490 500 510 520 530 540
pF1KB8 LSFRLESMLRAHRLRHGGERPFSCSECGRGFTHQCKLREHLRVHSGERPFQCLKCDKRFR
.: :.: :. : .:.:. :.:::. :.: .: .: :.:.::.:.:: .: : :
CCDS12 KAFIRGSQLTQHQRIHTNEKPYECKECGKMFSHGSQLTQHQRIHTGEKPYQCKECGKAFN
370 380 390 400 410 420
550 560 570 580 590 600
pF1KB8 LKGILKAHQHTHSKERPFSCGECGKGFTRQSKLTEHLRVHSGERPFQCPECNRSFRLKGQ
..: ::. :. :.:. : :::: :.: :.::.: :.:.::.:..: ::..:: .:
CCDS12 RGSLLTRHQRIHTGEKPYECKECGKTFSRGSELTQHERIHTGEKPYECKECGKSFIRGSQ
430 440 450 460 470 480
610 620 630 640 650 660
pF1KB8 LLSHQRLHTGERPFQCPECDKRYRVKADMKAHQLLHSGEMPFSC-ECGKGFVKHSKLIEH
: .:::.::::.:..: :: . .. .. :: ::.:: :. : ::::.:.. ::.:
CCDS12 LTQHQRIHTGEKPYECKECRMAFTQSSHLSQHQRLHTGEKPYVCNECGKAFARGLLLIQH
490 500 510 520 530 540
670 680 690 700 710 720
pF1KB8 IRTHTGEKPFQCPKCDKSFRLKAQLLSHQGLHTGERPFHCPECDKNFWERGHMLRHQRIH
: ::::::.:: .: :.: .:: .:: .::::.:..: :: : : . ... :::::
CCDS12 QRIHTGEKPYQCKECGKAFIRGSQLTQHQRIHTGEKPYECKECGKAFSHGSQLTLHQRIH
550 560 570 580 590 600
730 740 750 760 770 780
pF1KB8 RPERPFACGDCGKGFIYKSKLAEHIRVHTKSCPAPNELDIKKRLSQLFAMIEADWS
:.:. : .: :.: .:.:..: :.::
CCDS12 TGEKPYECRECRKAFTQSSHLSRHQRIHTGEKPYQCKECGKAFTRGSQLTQHQRIHISEK
610 620 630 640 650 660
>>CCDS74350.1 ZNF850 gene_id:342892|Hs108|chr19 (1058 aa)
initn: 8886 init1: 1047 opt: 1464 Z-score: 887.2 bits: 175.4 E(32554): 4.3e-43
Smith-Waterman score: 1667; 35.2% identity (60.6% similar) in 761 aa overlap (11-759:9-724)
10 20 30 40 50 60
pF1KB8 MAEPPRLPLTFEDVAIYFSEQEWQDLEAWQKELYKHVMRSNYETLVSLDDGLPKPELISW
:.:..: ::..::. :.: ::.::. :: :: .:::::. . :
CCDS74 MNMEGLVMFQDLSIDFSQEEWECLDAAQKDLYRDVMMENYSSLVSLDSEFRCKTKDSC
10 20 30 40 50
70 80 90 100 110
pF1KB8 IEHGGEPFR----KWRESQKSGNIICSSVDMHFDPGFEEQLFWGSQQAMNSGKTKSHFQL
. . : .. .: . .: ... ::: : : . :..::
CCDS74 LPK--EIYEVTSSQWVRMEKCHSLVGSSVR---DD-------W---------ECKGQFQH
60 70 80 90
120 130 140 150 160 170
pF1KB8 DPESQCSF--GSFVSFRPDQGITLGSPQRHDARAPPPLACGPSESTLKEGIPGPRNLDLP
. .: . ...... . : . : : : . : . . .:
CCDS74 QDINQERYLEKAIMTYETTPTFCLQTSLTLHHRIHP----GEKLYKSTECMAFKYGSELT
100 110 120 130 140 150
180 190 200 210 220 230
pF1KB8 GLWDVPAWESTQHPWPVCGESCWENNHLVMHQRGHSKDRT---RRAWEKFNKRAETQMPW
.. . :. . ::.. . ..:: ::: :. .. .. . : . .. .
CCDS74 QQQETHTGEKL-YKCKECGKAFHHFSYLVKHQRIHTGEKPCACKEYGKAFISGSHLIQHQ
160 170 180 190 200 210
240 250 260 270 280 290
pF1KB8 SSPRVQRHFRCGVCGKSFRRKLCLLRHLAAHTGRGPFRNADGEMCFRHELTHPSHRLPQQ
. .: .: :.:: . :..: ::: :.. . : : .:. .
CCDS74 KMYTDERPHECQESVKAFRPSAHLIQHWRIHTGDKPYECKECGKSFTSGSTLNQHQQIHT
220 230 240 250 260 270
300 310 320 330 340
pF1KB8 GEKPAQCTPCGKRSLPVDSTQARRCQ-HSREGPASWRE-GRGASSSVHSGQKPGSRLPQE
:::: .: ::: :. : :: :. : :. : : . .: :.. .: :: : .
CCDS74 GEKPYHCKQCGK-SFTVGSTLIRHQQIHTGEKPYDCKECGKSFAS--------GSALIR-
280 290 300 310 320
350 360 370 380 390 400
pF1KB8 GNSHQEGDTEALQHGAEGPCSCSECGERSPMSARLASPCRAHTGEKPFQCAHCTKRFRLR
::. : .: : .:.:::. . . : : ::::::..: .: : : .:
CCDS74 ---HQR------IHTGEKPYDCKECGKSFTFHSALIRHQRIHTGEKPYDCKECGKSFTFR
330 340 350 360 370
410 420 430 440 450 460
pF1KB8 RLLQVHQHAHGGERPFSCRKCGKGFAKQCKLTEHIRVHSGEKPFRCAKCGRNFRQRGQLL
: :: : ::.:..:..:::.:. : .: :.:.::::. : .::..: . . ::
CCDS74 SGLIGHQAIHTGEKPYDCKECGKSFTAGSTLIQHQRIHTGEKPYDCKECGKSFASGSALL
380 390 400 410 420 430
470 480 490 500 510 520
pF1KB8 RHQRLHTDEKPFQCPECGLSFRLESMLRAHRLRHGGERPFSCSECGRGFTHQCKLREHLR
.:::.:: :::. : ::: :: ..: :. : ::.:..:.:::..:. : .: :
CCDS74 QHQRIHTGEKPYCCKECGKSFTFRSTRNRHQRIHTGEKPYNCKECGKSFASGSALLQHQR
440 450 460 470 480 490
530 540 550 560 570 580
pF1KB8 VHSGERPFQCLKCDKRFRLKGILKAHQHTHSKERPFSCGECGKGFTRQSKLTEHLRVHSG
.:.::.:..: .: : : ... : .:: .:. :.:..: ::::.:: .: : .: :.:.:
CCDS74 IHTGEKPYHCKECGKSFTFRSGLIGHQAVHTGEKPYDCKECGKSFTSRSALIQHQRIHTG
500 510 520 530 540 550
590 600 610 620 630 640
pF1KB8 ERPFQCPECNRSFRLKGQLLSHQRLHTGERPFQCPECDKRYRVKADMKAHQLLHSGEMPF
:.:..: ::..:: . . ::.::..::::.:..: :: : .:.. . :: .:.:: :.
CCDS74 EKPYHCKECGKSFTVGSTLLQHQQIHTGEKPYDCKECGKAFRLRLRLTQHQQIHTGEKPY
560 570 580 590 600 610
650 660 670 680 690 700
pF1KB8 SC-ECGKGFVKHSKLIEHIRTHTGEKPFQCPKCDKSFRLKAQLLSHQGLHTGERPFHCPE
.: ::::.::. : : .: : ::::::..:: : :.:: .. : .:. .::::.:..: :
CCDS74 QCQECGKAFVSVSGLTQHHRIHTGEKPYECPDCGKAFRQRTYLNQHRRIHTGEKPYECKE
620 630 640 650 660 670
710 720 730 740 750 760
pF1KB8 CDKNFWERGHMLRHQRIHRPERPFACGDCGKGFIYKSKLAEHIRVHTKSCPAPNELDIKK
: :.: . ...::. : :.:. .:::.: .: : .: ..:: :
CCDS74 CGKSFTFCSGLIQHQQNHTDEKPYDGKECGKSFTSHSTLIQHQQIHTGEKPYDCKECGKS
680 690 700 710 720 730
770 780
pF1KB8 RLSQLFAMIEADWS
CCDS74 FTSHSTLIQHQQIHTGEKLYDCKECGKSFTSHSTLIQHQPLHTGEKPYHCKECGKSFTLR
740 750 760 770 780 790
>--
initn: 1998 init1: 1036 opt: 1086 Z-score: 663.4 bits: 134.0 E(32554): 1.2e-30
Smith-Waterman score: 1247; 45.5% identity (75.6% similar) in 332 aa overlap (425-754:725-1055)
400 410 420 430 440 450
pF1KB8 KPFQCAHCTKRFRLRRLLQVHQHAHGGERPFSCRKCGKGFAKQCKLTEHIRVHSGEKPFR
..:..:::.:... : .: ..:.::: .
CCDS74 KPYDGKECGKSFTSHSTLIQHQQIHTGEKPYDCKECGKSFTSHSTLIQHQQIHTGEKLYD
700 710 720 730 740 750
460 470 480 490 500 510
pF1KB8 CAKCGRNFRQRGQLLRHQRLHTDEKPFQCPECGLSFRLESMLRAHRLRHGGERPFSCSEC
: .::..: ... :..:: ::: :::..: ::: :: :.: : :: : ::. .::.::
CCDS74 CKECGKSFTSHSTLIQHQPLHTGEKPYHCKECGKSFTLRSALIQHRPVHTGEKRYSCKEC
760 770 780 790 800 810
520 530 540 550 560 570
pF1KB8 GRGFTHQCKLREHLRVHSGERPFQCLKCDKRFRLKGILKAHQHTHSKERPFSCGECGKGF
:..:: . : :: :.:.::.:..: .: : : ... . :.. :. :.:..: ::::.:
CCDS74 GKSFTSRSTLIEHQRIHTGEKPYHCKECGKSFAFRSAIIQHRRIHTGEKPYDCKECGKAF
820 830 840 850 860 870
580 590 600 610 620 630
pF1KB8 TRQSKLTEHLRVHSGERPFQCPECNRSF-RLKGQLLSHQRLHTGERPFQCPECDKRYRVK
:.::::.: :.:.::.:..: ::...: :..: : .:. .::::.:..: : : .: .
CCDS74 RRRSKLTQHQRIHTGEKPYRCHECGKAFVRFSG-LTKHHSIHTGEKPYECKTCGKSFRQR
880 890 900 910 920 930
640 650 660 670 680 690
pF1KB8 ADMKAHQLLHSGEMPFSC-ECGKGFVKHSKLIEHIRTHTGEKPFQCPKCDKSFRLKAQLL
. . :: .:.:. :. : ::::.:. :.::.: ::::::::..: .: :.:: .::
CCDS74 THLTLHQRIHTGDRPYECKECGKSFTCGSELIRHQRTHTGEKPYDCKECGKAFRCPSQLS
940 950 960 970 980 990
700 710 720 730 740 750
pF1KB8 SHQGLHTGERPFHCPECDKNFWERGHMLRHQRIHRPERPFACGDCGKGFIYKSKLAEHIR
.:. .::::. ..:::: : :. . . ::: .: :.:. : :::.: ..:..: :
CCDS74 QHKRIHTGEKTYQCPECGKAFFYASGLSRHQSVHTGEKPYECKTCGKAFKQLTQLTRHQR
1000 1010 1020 1030 1040 1050
760 770 780
pF1KB8 VHTKSCPAPNELDIKKRLSQLFAMIEADWS
.:
CCDS74 IHDLT
>>CCDS33097.1 ZNF347 gene_id:84671|Hs108|chr19 (839 aa)
initn: 4803 init1: 1001 opt: 1461 Z-score: 886.2 bits: 174.9 E(32554): 4.8e-43
Smith-Waterman score: 1604; 33.3% identity (60.8% similar) in 798 aa overlap (9-759:8-792)
10 20 30 40 50 60
pF1KB8 MAEPPRLPLTFEDVAIYFSEQEWQDLEAWQKELYKHVMRSNYETLVSLDDGLPKPELISW
.::.:::: ::..:: :. :. ::. :: ::..:.:: . .::
CCDS33 MALTQGQVTFRDVAIEFSQEEWTCLDPAQRTLYRDVMLENYRNLASLGISCFDLSIISM
10 20 30 40 50
70 80 90 100 110
pF1KB8 IEHGGEPFRKWRESQKSGN--------IICSSVDMHFDPGFEEQLFWGSQQAMNSGKTKS
.:.: ::: . : .:: . .... .: ... : :.. :.:.. .
CCDS33 LEQGKEPFTLESQVQIAGNPDGWEWIKAVITALSSEFV--MKDLLHKGKS---NTGEVFQ
60 70 80 90 100 110
120 130 140 150 160
pF1KB8 HFQLD-PESQCSFGSFVSFRPDQGITLGSP-QRHDARAPPPLACGPSESTLKEGIP----
.:. ::: : ::: : : : : .::.. . .:..: .:
CCDS33 TVMLERQESQDIEG--CSFREVQKNTHGLEYQCRDAEGNYKGVLLTQEGNLTHGRDEHDK
120 130 140 150 160 170
170 180 190 200 210
pF1KB8 -GPRN------LDLPGLWDVPAWESTQHPWPV--CG--ESCWENNHLVMHQRGHSKDRTR
:: : : .: . :. . :. :. ..:: : . .
CCDS33 RDARNKLIKNQLGLSLQSHLPELQLFQYEGKIYECNQVEKSFNNNSSVSPPQQMPYNVKT
180 190 200 210 220 230
220 230 240 250 260
pF1KB8 RAWEKFNK---------RAETQMPWSSPRVQRHFRCGVCGKSFRRKLCLLRHLAAHTGRG
. .:. : ... :.:: .. . :: : .. : : .:: .
CCDS33 HISKKYLKDFISSLLLTQGQKANNWGSP-----YKSNGCGMVFPQNSHLASHQRSHTKEK
240 250 260 270 280
270 280 290 300 310 320
pF1KB8 PFRNADGEMCFRHELTHPSHRLPQQGEKPAQCTPCGKRSLPVDSTQARRCQHSREGPASW
:.. . :: . . .:.. . ::: .:. ::: .. . .. :. : : .
CCDS33 PYKCYECGKAFRTRSNLTTHQVIHTGEKRYKCNECGKVFSRNSQLSQHQKIHTGEKPYKC
290 300 310 320 330 340
330 340 350 360 370
pF1KB8 RE-GRGASSS--------VHSGQKPGSRLPQEGNSHQEGDTEALQ---HGAEGPCSCSEC
: :. ... .:.:.:: . . :.. . .. :.. :..: : .:.::
CCDS33 NECGKVFTQNSHLVRHRGIHTGEKP-YKCNECGKAFRARSSLAIHQATHSGEKPYKCNEC
350 360 370 380 390 400
380 390 400 410 420 430
pF1KB8 GERSPMSARLASPCRAHTGEKPFQCAHCTKRFRLRRLLQVHQHAHGGERPFSCRKCGKGF
:. ....:.. : ::::::..: .: : : .: : .: : ::.:..:..::: :
CCDS33 GKVFTQNSHLTNHWRIHTGEKPYKCNECGKAFGVRSSLAIHLVIHTGEKPYKCHECGKVF
410 420 430 440 450 460
440 450 460 470 480 490
pF1KB8 AKQCKLTEHIRVHSGEKPFRCAKCGRNFRQRGQLLRHQRLHTDEKPFQCPECGLSFRLES
.. .:..: .:.::::..: .::. :: ...: :: .:: :::..: ::: : .:
CCDS33 RRNSHLARHQLIHTGEKPYKCNECGKAFRAHSNLTTHQVIHTGEKPYKCNECGKVFTQNS
470 480 490 500 510 520
500 510 520 530 540 550
pF1KB8 MLRAHRLRHGGERPFSCSECGRGFTHQCKLREHLRVHSGERPFQCLKCDKRFRLKGILKA
: :. : : .:. :.:::..:. .: : .:.::.:..: .: : : .. :
CCDS33 HLANHQRIHTGVKPYMCNECGKAFSVYSSLTTHQVIHTGEKPYKCNECGKVFTQNSHLAR
530 540 550 560 570 580
560 570 580 590 600 610
pF1KB8 HQHTHSKERPFSCGECGKGFTRQSKLTEHLRVHSGERPFQCPECNRSFRLKGQLLSHQRL
:. :. :.:..:.:::: : ..: :..: :.:.::.:.. : ...: ...: .:: .
CCDS33 HRGIHTGEKPYKCNECGKVFRHNSYLSRHQRIHTGEKPYKYNEYGKAFSEHSNLTTHQVI
590 600 610 620 630 640
620 630 640 650 660 670
pF1KB8 HTGERPFQCPECDKRYRVKADMKAHQLLHSGEMPFSC-ECGKGFVKHSKLIEHIRTHTGE
::::.:..: :: : . .. . :. .:.: :..: ::::.: . ::: .: :.::::
CCDS33 HTGEKPYKCNECGKVFTQNSHLARHRRVHTGGKPYQCNECGKAFSQTSKLARHQRVHTGE
650 660 670 680 690 700
680 690 700 710 720 730
pF1KB8 KPFQCPKCDKSFRLKAQLLSHQGLHTGERPFHCPECDKNFWERGHMLRHQRIHRPERPFA
::..: .: :.: ....: .::..:::..:..: :: : : . .:. ::. :: :.:.
CCDS33 KPYECNQCGKAFSVRSSLTTHQAIHTGKKPYKCNECGKVFTQNSHLARHRGIHTGEKPYK
710 720 730 740 750 760
740 750 760 770 780
pF1KB8 CGDCGKGFIYKSKLAEHIRVHTKSCPAPNELDIKKRLSQLFAMIEADWS
:..:::.: ::::.: :.:: :
CCDS33 CNECGKAFSQTSKLARHQRIHTGEKPYECGKPFSICSSLTTHQTIHTGGKPYKCNVWKVL
770 780 790 800 810 820
>>CCDS54314.1 ZNF347 gene_id:84671|Hs108|chr19 (840 aa)
initn: 4803 init1: 1001 opt: 1457 Z-score: 883.9 bits: 174.5 E(32554): 6.5e-43
Smith-Waterman score: 1600; 33.5% identity (60.9% similar) in 800 aa overlap (9-759:8-793)
10 20 30 40 50
pF1KB8 MAEPPRLPLTFEDVAIYFSEQEWQDLEAWQKELYKHVMRSNYETLVSLDDGLPKPEL--I
.::.:::: ::..:: :. :. ::. :: ::..:.:: :. .: :
CCDS54 MALTQGQVTFRDVAIEFSQEEWTCLDPAQRTLYRDVMLENYRNLASLA-GISCFDLSII
10 20 30 40 50
60 70 80 90 100 110
pF1KB8 SWIEHGGEPFRKWRESQKSGN--------IICSSVDMHFDPGFEEQLFWGSQQAMNSGKT
: .:.: ::: . : .:: . .... .: ... : :.. :.:..
CCDS54 SMLEQGKEPFTLESQVQIAGNPDGWEWIKAVITALSSEFV--MKDLLHKGKS---NTGEV
60 70 80 90 100 110
120 130 140 150 160
pF1KB8 KSHFQLD-PESQCSFGSFVSFRPDQGITLGSP-QRHDARAPPPLACGPSESTLKEGIP--
. .:. ::: : ::: : : : : .::.. . .:..: .:
CCDS54 FQTVMLERQESQDIEG--CSFREVQKNTHGLEYQCRDAEGNYKGVLLTQEGNLTHGRDEH
120 130 140 150 160 170
170 180 190 200 210
pF1KB8 ---GPRN------LDLPGLWDVPAWESTQHPWPV--CG--ESCWENNHLVMHQRGHSKDR
:: : : .: . :. . :. :. ..:: : . .
CCDS54 DKRDARNKLIKNQLGLSLQSHLPELQLFQYEGKIYECNQVEKSFNNNSSVSPPQQMPYNV
180 190 200 210 220 230
220 230 240 250 260
pF1KB8 TRRAWEKFNK---------RAETQMPWSSPRVQRHFRCGVCGKSFRRKLCLLRHLAAHTG
. .:. : ... :.:: .. . :: : .. : : .::
CCDS54 KTHISKKYLKDFISSLLLTQGQKANNWGSP-----YKSNGCGMVFPQNSHLASHQRSHTK
240 250 260 270 280
270 280 290 300 310 320
pF1KB8 RGPFRNADGEMCFRHELTHPSHRLPQQGEKPAQCTPCGKRSLPVDSTQARRCQHSREGPA
. :.. . :: . . .:.. . ::: .:. ::: .. . .. :. : :
CCDS54 EKPYKCYECGKAFRTRSNLTTHQVIHTGEKRYKCNECGKVFSRNSQLSQHQKIHTGEKPY
290 300 310 320 330 340
330 340 350 360 370
pF1KB8 SWRE-GRGASSS--------VHSGQKPGSRLPQEGNSHQEGDTEALQ---HGAEGPCSCS
. : :. ... .:.:.:: . . :.. . .. :.. :..: : .:.
CCDS54 KCNECGKVFTQNSHLVRHRGIHTGEKP-YKCNECGKAFRARSSLAIHQATHSGEKPYKCN
350 360 370 380 390 400
380 390 400 410 420 430
pF1KB8 ECGERSPMSARLASPCRAHTGEKPFQCAHCTKRFRLRRLLQVHQHAHGGERPFSCRKCGK
:::. ....:.. : ::::::..: .: : : .: : .: : ::.:..:..:::
CCDS54 ECGKVFTQNSHLTNHWRIHTGEKPYKCNECGKAFGVRSSLAIHLVIHTGEKPYKCHECGK
410 420 430 440 450 460
440 450 460 470 480 490
pF1KB8 GFAKQCKLTEHIRVHSGEKPFRCAKCGRNFRQRGQLLRHQRLHTDEKPFQCPECGLSFRL
: .. .:..: .:.::::..: .::. :: ...: :: .:: :::..: ::: :
CCDS54 VFRRNSHLARHQLIHTGEKPYKCNECGKAFRAHSNLTTHQVIHTGEKPYKCNECGKVFTQ
470 480 490 500 510 520
500 510 520 530 540 550
pF1KB8 ESMLRAHRLRHGGERPFSCSECGRGFTHQCKLREHLRVHSGERPFQCLKCDKRFRLKGIL
.: : :. : : .:. :.:::..:. .: : .:.::.:..: .: : : .. :
CCDS54 NSHLANHQRIHTGVKPYMCNECGKAFSVYSSLTTHQVIHTGEKPYKCNECGKVFTQNSHL
530 540 550 560 570 580
560 570 580 590 600 610
pF1KB8 KAHQHTHSKERPFSCGECGKGFTRQSKLTEHLRVHSGERPFQCPECNRSFRLKGQLLSHQ
:. :. :.:..:.:::: : ..: :..: :.:.::.:.. : ...: ...: .::
CCDS54 ARHRGIHTGEKPYKCNECGKVFRHNSYLSRHQRIHTGEKPYKYNEYGKAFSEHSNLTTHQ
590 600 610 620 630 640
620 630 640 650 660 670
pF1KB8 RLHTGERPFQCPECDKRYRVKADMKAHQLLHSGEMPFSC-ECGKGFVKHSKLIEHIRTHT
.::::.:..: :: : . .. . :. .:.: :..: ::::.: . ::: .: :.::
CCDS54 VIHTGEKPYKCNECGKVFTQNSHLARHRRVHTGGKPYQCNECGKAFSQTSKLARHQRVHT
650 660 670 680 690 700
680 690 700 710 720 730
pF1KB8 GEKPFQCPKCDKSFRLKAQLLSHQGLHTGERPFHCPECDKNFWERGHMLRHQRIHRPERP
::::..: .: :.: ....: .::..:::..:..: :: : : . .:. ::. :: :.:
CCDS54 GEKPYECNQCGKAFSVRSSLTTHQAIHTGKKPYKCNECGKVFTQNSHLARHRGIHTGEKP
710 720 730 740 750 760
740 750 760 770 780
pF1KB8 FACGDCGKGFIYKSKLAEHIRVHTKSCPAPNELDIKKRLSQLFAMIEADWS
. :..:::.: ::::.: :.:: :
CCDS54 YKCNECGKAFSQTSKLARHQRIHTGEKPYECGKPFSICSSLTTHQTIHTGGKPYKCNVWK
770 780 790 800 810 820
782 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 12:37:02 2016 done: Fri Nov 4 12:37:03 2016
Total Scan time: 3.670 Total Display time: 0.270
Function used was FASTA [36.3.4 Apr, 2011]