FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1141, 871 aa
1>>>pF1KA1141 871 - 871 aa - 871 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.9088+/-0.0016; mu= 14.9369+/- 0.095
mean_var=228.0608+/-45.478, 0's: 0 Z-trim(106.8): 951 B-trim: 36 in 1/49
Lambda= 0.084928
statistics sampled from 8169 (9190) to 8169 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.616), E-opt: 0.2 (0.282), width: 16
Scan time: 2.960
The best scores are: opt bits E(32554)
CCDS33077.1 ZNF473 gene_id:25888|Hs108|chr19 ( 871) 6197 773.9 0
CCDS77335.1 ZNF473 gene_id:25888|Hs108|chr19 ( 859) 6123 764.8 0
CCDS54240.1 ZNF208 gene_id:7757|Hs108|chr19 (1280) 1863 243.1 2.4e-63
CCDS62706.1 ZNF229 gene_id:7772|Hs108|chr19 ( 819) 1636 215.0 4.3e-55
CCDS42574.1 ZNF229 gene_id:7772|Hs108|chr19 ( 825) 1636 215.0 4.3e-55
CCDS12944.1 ZNF667 gene_id:63934|Hs108|chr19 ( 610) 1505 198.8 2.4e-50
CCDS75846.1 ZNF658 gene_id:26149|Hs108|chr9 (1059) 1456 193.1 2.2e-48
CCDS12637.1 ZNF112 gene_id:7771|Hs108|chr19 ( 907) 1426 189.4 2.5e-47
CCDS54276.1 ZNF112 gene_id:7771|Hs108|chr19 ( 913) 1426 189.4 2.5e-47
CCDS64999.1 ZNF7 gene_id:7553|Hs108|chr8 ( 590) 1396 185.4 2.5e-46
CCDS6435.1 ZNF7 gene_id:7553|Hs108|chr8 ( 686) 1396 185.5 2.7e-46
CCDS64996.1 ZNF7 gene_id:7553|Hs108|chr8 ( 697) 1396 185.5 2.8e-46
CCDS82413.1 ZNF544 gene_id:27300|Hs108|chr19 ( 687) 1361 181.2 5.4e-45
CCDS12973.1 ZNF544 gene_id:27300|Hs108|chr19 ( 715) 1361 181.3 5.5e-45
CCDS62707.1 ZNF180 gene_id:7733|Hs108|chr19 ( 665) 1347 179.5 1.7e-44
CCDS62708.1 ZNF180 gene_id:7733|Hs108|chr19 ( 667) 1347 179.5 1.7e-44
CCDS12639.1 ZNF180 gene_id:7733|Hs108|chr19 ( 692) 1347 179.5 1.8e-44
CCDS12980.1 ZNF132 gene_id:7691|Hs108|chr19 ( 706) 1337 178.3 4.2e-44
CCDS35106.1 ZNF483 gene_id:158399|Hs108|chr9 ( 744) 1322 176.5 1.5e-43
CCDS35067.1 ZNF484 gene_id:83744|Hs108|chr9 ( 816) 1316 175.8 2.7e-43
CCDS35066.1 ZNF484 gene_id:83744|Hs108|chr9 ( 852) 1316 175.9 2.8e-43
CCDS59136.1 ZNF484 gene_id:83744|Hs108|chr9 ( 854) 1316 175.9 2.8e-43
CCDS75076.1 ZNF595 gene_id:152687|Hs108|chr4 ( 616) 1309 174.8 4.2e-43
CCDS75075.1 ZNF595 gene_id:152687|Hs108|chr4 ( 648) 1309 174.8 4.3e-43
CCDS7198.1 ZNF33B gene_id:7582|Hs108|chr10 ( 778) 1306 174.6 6.2e-43
CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 1300 173.7 8.9e-43
CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 1300 173.7 9.3e-43
CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 1300 173.8 9.4e-43
CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 1300 173.8 9.5e-43
CCDS42536.1 ZNF493 gene_id:284443|Hs108|chr19 ( 774) 1300 173.8 1e-42
CCDS12412.1 ZNF493 gene_id:284443|Hs108|chr19 ( 646) 1295 173.1 1.4e-42
CCDS58687.1 ZNF211 gene_id:10520|Hs108|chr19 ( 555) 1283 171.6 3.6e-42
CCDS74468.1 ZNF211 gene_id:10520|Hs108|chr19 ( 616) 1283 171.6 3.8e-42
CCDS58686.1 ZNF211 gene_id:10520|Hs108|chr19 ( 629) 1283 171.6 3.8e-42
CCDS12968.1 ZNF606 gene_id:80095|Hs108|chr19 ( 792) 1283 171.8 4.4e-42
CCDS58688.1 ZNF211 gene_id:10520|Hs108|chr19 ( 503) 1279 171.0 4.7e-42
CCDS12957.1 ZNF211 gene_id:10520|Hs108|chr19 ( 564) 1279 171.1 5.1e-42
CCDS12956.1 ZNF211 gene_id:10520|Hs108|chr19 ( 577) 1279 171.1 5.1e-42
CCDS46102.1 ZNF226 gene_id:7769|Hs108|chr19 ( 803) 1280 171.4 5.7e-42
CCDS11179.2 ZNF287 gene_id:57336|Hs108|chr17 ( 761) 1277 171.0 7.1e-42
CCDS35075.1 ZNF782 gene_id:158431|Hs108|chr9 ( 699) 1272 170.4 1e-41
CCDS12409.1 ZNF14 gene_id:7561|Hs108|chr19 ( 642) 1267 169.7 1.5e-41
CCDS2719.1 ZNF502 gene_id:91392|Hs108|chr3 ( 544) 1263 169.1 1.9e-41
CCDS54259.1 ZNF607 gene_id:84775|Hs108|chr19 ( 695) 1263 169.2 2.2e-41
CCDS33006.1 ZNF607 gene_id:84775|Hs108|chr19 ( 696) 1263 169.2 2.2e-41
CCDS73089.1 ZNF33A gene_id:7581|Hs108|chr10 ( 699) 1258 168.6 3.4e-41
CCDS31182.1 ZNF33A gene_id:7581|Hs108|chr10 ( 810) 1258 168.7 3.7e-41
CCDS44372.1 ZNF33A gene_id:7581|Hs108|chr10 ( 811) 1258 168.7 3.7e-41
CCDS60514.1 ZNF33A gene_id:7581|Hs108|chr10 ( 817) 1258 168.7 3.7e-41
CCDS73088.1 ZNF33A gene_id:7581|Hs108|chr10 ( 829) 1258 168.7 3.8e-41
>>CCDS33077.1 ZNF473 gene_id:25888|Hs108|chr19 (871 aa)
initn: 6197 init1: 6197 opt: 6197 Z-score: 4122.5 bits: 773.9 E(32554): 0
Smith-Waterman score: 6197; 99.9% identity (100.0% similar) in 871 aa overlap (1-871:1-871)
10 20 30 40 50 60
pF1KA1 MAEEFVTLKDVGMDFTLGDWEQLGLEQGDTFWDTALDNCQDLFLLDPPRPNLTSHPDGSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MAEEFVTLKDVGMDFTLGDWEQLGLEQGDTFWDTALDNCQDLFLLDPPRPNLTSHPDGSE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 DLEPLAGGSPEATSPDVTETKNSPLMEDFFEEGFSQEIIEMLSKDGFWNSNFGEACIEDT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 DLEPLAGGSPEATSPDVTETKNSPLMEDFFEEGFSQEIIEMLSKDGFWNSNFGEACIEDT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 WLDSLLGDPESLLRSDIATNGESPTECKSHELKRGLSPVSTVSTGEDSMVHNVSEKTLTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 WLDSLLGDPESLLRSDIATNGESPTECKSHELKRGLSPVSTVSTGEDSMVHNVSEKTLTP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 AKSKEYRGEFFSYSDHSQQDSVQEGEKPYQCSECGKSFSGSYRLTQHWITHTREKPTVHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 AKSKEYRGEFFSYSDHSQQDSVQEGEKPYQCSECGKSFSGSYRLTQHWITHTREKPTVHQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 ECEQGFDRNASLSVYPKTHTGYKFYVCNEYGTTFSQSTYLWHQKTHTGEKPCKSQDSDHP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ECEQGFDRNASLSVYPKTHTGYKFYVCNEYGTTFSQSTYLWHQKTHTGEKPCKSQDSDHP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 PSHDTQPGEHQKTHTDSKSYNCNECGKAFTRIFHLTRHQKIHTRKRYECSKCQATFNLRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PSHDTQPGEHQKTHTDSKSYNCNECGKAFTRIFHLTRHQKIHTRKRYECSKCQATFNLRK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 HLIQHQKTHAAKTTSECQECGKIFRHSSLLIEHQALHAGEEPYKCNERGKSFRHNSTLKI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 HLIQHQKTHAAKTTSECQECGKIFRHSSLLIEHQALHAGEEPYKCNERGKSFRHNSTLKI
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 HQRVHSGEKPYKCSECGKAFHRHTHLNEHRRIHTGYRPHKCQECVRSFSRPSHLMRHQAI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 HQRVHSGEKPYKCSECGKAFHRHTHLNEHRRIHTGYRPHKCQECVRSFSRPSHLMRHQAI
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 HTAEKPYSCAECKETFSDNNRLVQHQKMHTVKTPYECQECGERFICGSTLKCHESVHARE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 HTAEKPYSCAECKETFSDNNRLVQHQKMHTVKTPYECQECGERFICGSTLKCHESVHARE
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA1 KQGFFVSGKILDQNPEQKEKCFKCNKCEKTFSCSKYLTQHERIHTRGMKPFECDQCGKAF
:::::::::::::::::::::::::::::::::::::::::::::::.::::::::::::
CCDS33 KQGFFVSGKILDQNPEQKEKCFKCNKCEKTFSCSKYLTQHERIHTRGVKPFECDQCGKAF
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA1 GQSTRLIHHQRIHSRVRLYKWGEQGKAISSASLIKLQSFHTKEHPFKCNECGKTFSHSAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GQSTRLIHHQRIHSRVRLYKWGEQGKAISSASLIKLQSFHTKEHPFKCNECGKTFSHSAH
610 620 630 640 650 660
670 680 690 700 710 720
pF1KA1 LSKHQLIHAGENPFKCSKCDRVFTQRNYLVQHERTHARKKPLVCNECGKTFRQSSCLSKH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LSKHQLIHAGENPFKCSKCDRVFTQRNYLVQHERTHARKKPLVCNECGKTFRQSSCLSKH
670 680 690 700 710 720
730 740 750 760 770 780
pF1KA1 QRIHSGEKPYVCDYCGKAFGLSAELVRHQRIHTGEKPYVCQECGKAFTQSSCLSIHRRVH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QRIHSGEKPYVCDYCGKAFGLSAELVRHQRIHTGEKPYVCQECGKAFTQSSCLSIHRRVH
730 740 750 760 770 780
790 800 810 820 830 840
pF1KA1 TGEKPYRCGECGKAFAQKANLTQHQRIHTGEKPYSCNVCGKAFVLSAHLNQHLRVHTQET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TGEKPYRCGECGKAFAQKANLTQHQRIHTGEKPYSCNVCGKAFVLSAHLNQHLRVHTQET
790 800 810 820 830 840
850 860 870
pF1KA1 LYQCQRCQKAFRCHSSLSRHQRVHNKQQYCL
:::::::::::::::::::::::::::::::
CCDS33 LYQCQRCQKAFRCHSSLSRHQRVHNKQQYCL
850 860 870
>>CCDS77335.1 ZNF473 gene_id:25888|Hs108|chr19 (859 aa)
initn: 6123 init1: 6123 opt: 6123 Z-score: 4073.6 bits: 764.8 E(32554): 0
Smith-Waterman score: 6123; 99.9% identity (100.0% similar) in 859 aa overlap (13-871:1-859)
10 20 30 40 50 60
pF1KA1 MAEEFVTLKDVGMDFTLGDWEQLGLEQGDTFWDTALDNCQDLFLLDPPRPNLTSHPDGSE
::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 MDFTLGDWEQLGLEQGDTFWDTALDNCQDLFLLDPPRPNLTSHPDGSE
10 20 30 40
70 80 90 100 110 120
pF1KA1 DLEPLAGGSPEATSPDVTETKNSPLMEDFFEEGFSQEIIEMLSKDGFWNSNFGEACIEDT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 DLEPLAGGSPEATSPDVTETKNSPLMEDFFEEGFSQEIIEMLSKDGFWNSNFGEACIEDT
50 60 70 80 90 100
130 140 150 160 170 180
pF1KA1 WLDSLLGDPESLLRSDIATNGESPTECKSHELKRGLSPVSTVSTGEDSMVHNVSEKTLTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 WLDSLLGDPESLLRSDIATNGESPTECKSHELKRGLSPVSTVSTGEDSMVHNVSEKTLTP
110 120 130 140 150 160
190 200 210 220 230 240
pF1KA1 AKSKEYRGEFFSYSDHSQQDSVQEGEKPYQCSECGKSFSGSYRLTQHWITHTREKPTVHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 AKSKEYRGEFFSYSDHSQQDSVQEGEKPYQCSECGKSFSGSYRLTQHWITHTREKPTVHQ
170 180 190 200 210 220
250 260 270 280 290 300
pF1KA1 ECEQGFDRNASLSVYPKTHTGYKFYVCNEYGTTFSQSTYLWHQKTHTGEKPCKSQDSDHP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 ECEQGFDRNASLSVYPKTHTGYKFYVCNEYGTTFSQSTYLWHQKTHTGEKPCKSQDSDHP
230 240 250 260 270 280
310 320 330 340 350 360
pF1KA1 PSHDTQPGEHQKTHTDSKSYNCNECGKAFTRIFHLTRHQKIHTRKRYECSKCQATFNLRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 PSHDTQPGEHQKTHTDSKSYNCNECGKAFTRIFHLTRHQKIHTRKRYECSKCQATFNLRK
290 300 310 320 330 340
370 380 390 400 410 420
pF1KA1 HLIQHQKTHAAKTTSECQECGKIFRHSSLLIEHQALHAGEEPYKCNERGKSFRHNSTLKI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 HLIQHQKTHAAKTTSECQECGKIFRHSSLLIEHQALHAGEEPYKCNERGKSFRHNSTLKI
350 360 370 380 390 400
430 440 450 460 470 480
pF1KA1 HQRVHSGEKPYKCSECGKAFHRHTHLNEHRRIHTGYRPHKCQECVRSFSRPSHLMRHQAI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 HQRVHSGEKPYKCSECGKAFHRHTHLNEHRRIHTGYRPHKCQECVRSFSRPSHLMRHQAI
410 420 430 440 450 460
490 500 510 520 530 540
pF1KA1 HTAEKPYSCAECKETFSDNNRLVQHQKMHTVKTPYECQECGERFICGSTLKCHESVHARE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 HTAEKPYSCAECKETFSDNNRLVQHQKMHTVKTPYECQECGERFICGSTLKCHESVHARE
470 480 490 500 510 520
550 560 570 580 590 600
pF1KA1 KQGFFVSGKILDQNPEQKEKCFKCNKCEKTFSCSKYLTQHERIHTRGMKPFECDQCGKAF
:::::::::::::::::::::::::::::::::::::::::::::::.::::::::::::
CCDS77 KQGFFVSGKILDQNPEQKEKCFKCNKCEKTFSCSKYLTQHERIHTRGVKPFECDQCGKAF
530 540 550 560 570 580
610 620 630 640 650 660
pF1KA1 GQSTRLIHHQRIHSRVRLYKWGEQGKAISSASLIKLQSFHTKEHPFKCNECGKTFSHSAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 GQSTRLIHHQRIHSRVRLYKWGEQGKAISSASLIKLQSFHTKEHPFKCNECGKTFSHSAH
590 600 610 620 630 640
670 680 690 700 710 720
pF1KA1 LSKHQLIHAGENPFKCSKCDRVFTQRNYLVQHERTHARKKPLVCNECGKTFRQSSCLSKH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 LSKHQLIHAGENPFKCSKCDRVFTQRNYLVQHERTHARKKPLVCNECGKTFRQSSCLSKH
650 660 670 680 690 700
730 740 750 760 770 780
pF1KA1 QRIHSGEKPYVCDYCGKAFGLSAELVRHQRIHTGEKPYVCQECGKAFTQSSCLSIHRRVH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 QRIHSGEKPYVCDYCGKAFGLSAELVRHQRIHTGEKPYVCQECGKAFTQSSCLSIHRRVH
710 720 730 740 750 760
790 800 810 820 830 840
pF1KA1 TGEKPYRCGECGKAFAQKANLTQHQRIHTGEKPYSCNVCGKAFVLSAHLNQHLRVHTQET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 TGEKPYRCGECGKAFAQKANLTQHQRIHTGEKPYSCNVCGKAFVLSAHLNQHLRVHTQET
770 780 790 800 810 820
850 860 870
pF1KA1 LYQCQRCQKAFRCHSSLSRHQRVHNKQQYCL
:::::::::::::::::::::::::::::::
CCDS77 LYQCQRCQKAFRCHSSLSRHQRVHNKQQYCL
830 840 850
>>CCDS54240.1 ZNF208 gene_id:7757|Hs108|chr19 (1280 aa)
initn: 2773 init1: 946 opt: 1863 Z-score: 1250.9 bits: 243.1 E(32554): 2.4e-63
Smith-Waterman score: 2153; 38.1% identity (62.9% similar) in 932 aa overlap (6-868:4-915)
10 20 30 40 50
pF1KA1 MAEEFVTLKDVGMDFTLGDWEQLGLEQGDTFWDTALDNCQDLFLLDPP--RPNLTSHPDG
.:..::...:.: .:. : : . . .. :.: ..: .: .:.: .
CCDS54 MGSLTFRDVAIEFSLEEWQCLDTAQQNLYRNVMLENYRNLVFLGIAAFKPDLIIFLEE
10 20 30 40 50
60 70 80 90 100 110
pF1KA1 SEDLEPLAGGSPEATSPDVTETKNSPLM-EDFFEEGFSQEIIEMLSKDGFWN-------S
... . :: . . : :. .:..:.. :.. : : : .
CCDS54 GKESWNMKRHEMVEESPVICSHFAQDLWPEQGIEDSFQKVILRRYEKCGHENLHLKIGYT
60 70 80 90 100 110
120 130 140
pF1KA1 NFGEACIEDTWLDSL---LGDPESLL-----------------RSDIATNGESPTECK--
: : .. ..: : .: . : : .:.. .::
CCDS54 NVDECKVHKEGYNKLNQSLTTTQSKVFQRGKYANVFHKCSNSNRHKIRHTGKKHLQCKEY
120 130 140 150 160 170
150 160 170 180 190
pF1KA1 --SHELKRGLSPVSTVSTGEDSMVHNVSEK------TLTPAKS-----KEYR----GEFF
: . :: . . : :.:. . . : ::: :: : :: :. :
CCDS54 VRSFCMLSHLSQHKRIYTRENSYKCEEGGKAFNWSSTLTYYKSAHTGEKPYRCKECGKAF
180 190 200 210 220 230
200 210 220 230 240 250
pF1KA1 S-YSDHSQQDSVQEGEKPYQCSECGKSFSGSYRLTQHWITHTREKPTVHQECEQGFDRNA
: .: ... .. ::: :.: ::::.:. : ::.: : :: :::. .:: ..:.. .
CCDS54 SKFSILTKHKVIHTGEKSYKCEECGKAFNQSAILTKHKIIHTGEKPNKCEECGKAFSKVS
240 250 260 270 280 290
260 270 280 290 300
pF1KA1 SLSVYPKTHTGYKFYVCNEYGTTFSQ-STYLWHQKTHTGEKPCKSQDSDHPPSHDTQPGE
.:... :.: : : :.: : .::. :: . :. :.:::: : .. . :. . .
CCDS54 TLTTHKAIHAGEKPYKCKECGKAFSKVSTLITHKAIHAGEKPYKCKECGKAFSKFSILTK
300 310 320 330 340 350
310 320 330 340 350 360
pF1KA1 HQKTHTDSKSYNCNECGKAFTRIFHLTRHQKIHT-RKRYECSKCQATFNLRKHLIQHQKT
:. :: : :.:.:::::. :. :.:::: .: :.: .: :.. . : .:.
CCDS54 HKVIHTGEKPYKCEECGKAYKWPSTLSYHKKIHTGEKPYKCEECGKGFSMFSILTKHEVI
360 370 380 390 400 410
370 380 390 400 410 420
pF1KA1 HAAKTTSECQECGKIFRHSSLLIEHQALHAGEEPYKCNERGKSFRHNSTLKIHQRVHSGE
:... .:.:::: : :: :.::. .:.:: ::::.: ::.: : : :. .:.::
CCDS54 HTGEKPYKCEECGKAFNWSSNLMEHKKIHTGETPYKCEECGKGFSMFSILTKHKVIHNGE
420 430 440 450 460 470
430 440 450 460 470
pF1KA1 KPYKCSEC----------------GKAFHRHTHLNEHRRIHTGYRPHKCQECVRSFSRPS
::::: :: ::::. ..: ::.::::: .:.::.:: .::: :
CCDS54 KPYKCEECDKATHAGEKPYKCEECGKAFNWSSNLMEHKRIHTGEKPYKCEECGKSFSTFS
480 490 500 510 520 530
480 490 500 510 520 530
pF1KA1 HLMRHQAIHTAEKPYSCAECKETFSDNNRLVQHQKMHTVKTPYECQECGERFICGSTLKC
: .:..:::.::::.: :: .... .. : :.:.:::. ::.:.:::. : .. :
CCDS54 ILTKHKVIHTGEKPYKCEECGKAYKWSSTLSYHKKIHTVEKPYKCEECGKAFNQSAILIK
540 550 560 570 580 590
540 550 560 570 580 590
pF1KA1 HESVHAREKQGFFVSGKILDQNPEQKEKCFKCNKCEKTFSCSKYLTQHERIHTRGMKPFE
:. .:. :: : .::..: :::: . :: :. ::. : ::..
CCDS54 HKRIHTGEK-------------P------YKCEECGKTFSKVSTLTTHKAIHA-GEKPYK
600 610 620 630
600 610 620 630 640 650
pF1KA1 CDQCGKAFGQSTRLIHHQRIHSRVRLYKWGEQGKAISSASLI-KLQSFHTKEHPFKCNEC
: .:::.: . . : :. ::. . :: : :::.:. :.. : . .:: :.:.::.::
CCDS54 CKECGKTFIKVSTLTTHKAIHAGEKPYKCKECGKAFSKFSILTKHKVIHTGEKPYKCEEC
640 650 660 670 680 690
660 670 680 690 700 710
pF1KA1 GKTFSHSAHLSKHQLIHAGENPFKCSKCDRVFTQRNYLVQHERTHARKKPLVCNECGKTF
::.:. :..: .:. ::.::.:.:: .: . :. . :..:. :. .:: :.::::..
CCDS54 GKAFNWSSNLMEHKRIHTGEKPYKCEECGKSFSTFSVLTKHKVIHTGEKPYKCEECGKAY
700 710 720 730 740 750
720 730 740 750 760 770
pF1KA1 RQSSCLSKHQRIHSGEKPYVCDYCGKAFGLSAELVRHQRIHTGEKPYVCQECGKAFTQSS
. :: :: :..::. :::: :. :::::. :: :..:.:::: :::: :.::::.:.. :
CCDS54 KWSSTLSYHKKIHTVEKPYKCEECGKAFNRSAILIKHKRIHTDEKPYKCEECGKTFSKVS
760 770 780 790 800 810
780 790 800 810 820 830
pF1KA1 CLSIHRRVHTGEKPYRCGECGKAFAQKANLTQHQRIHTGEKPYSCNVCGKAFVLSAHLNQ
:. :. .:.:::::.: ::::::.. . ::.:. ::::::::.:. ::::. . :.
CCDS54 TLTTHKAIHAGEKPYKCKECGKAFSKFSILTKHKVIHTGEKPYKCEECGKAYKWPSTLSY
820 830 840 850 860 870
840 850 860 870
pF1KA1 HLRVHTQETLYQCQRCQKAFRCHSSLSRHQRVHNKQQYCL
: ..:: : :.:..: :.: : :..:. .:. ..
CCDS54 HKKIHTGEKPYKCEECGKGFSMFSILTKHEVIHTGEKPYKCEECGKAFSWLSVFSKHKKT
880 890 900 910 920 930
CCDS54 HAGEKFYKCEACGKAYKSSSTLSYHKKIHTEEKPYKYEECGKGFSTFSILTKHKVIHTGE
940 950 960 970 980 990
>--
initn: 3291 init1: 902 opt: 1062 Z-score: 720.5 bits: 145.0 E(32554): 8.2e-34
Smith-Waterman score: 1249; 43.6% identity (68.6% similar) in 411 aa overlap (402-812:916-1279)
380 390 400 410 420 430
pF1KA1 KTTSECQECGKIFRHSSLLIEHQALHAGEEPYKCNERGKSFRHNSTLKIHQRVHSGEKPY
::::.: ::.: :... :...:.::: :
CCDS54 EKPYKCEECGKGFSMFSILTKHEVIHTGEKPYKCEECGKAFSWLSVFSKHKKTHAGEKFY
890 900 910 920 930 940
440 450 460 470 480 490
pF1KA1 KCSECGKAFHRHTHLNEHRRIHTGYRPHKCQECVRSFSRPSHLMRHQAIHTAEKPYSCAE
:: ::::.. . :. :..::: .:.: .:: ..:: : : .:..:::.::::.: :
CCDS54 KCEACGKAYKSSSTLSYHKKIHTEEKPYKYEECGKGFSTFSILTKHKVIHTGEKPYKCEE
950 960 970 980 990 1000
500 510 520 530 540 550
pF1KA1 CKETFSDNNRLVQHQKMHTVKTPYECQECGERFICGSTLKCHESVHAREKQGFFVSGKIL
: ..:. .. :..:.:.:: .:::.:.:: . : :.: :...:: ::
CCDS54 CGKAFNWSSNLMEHKKIHTGETPYKCEECDKAFSWPSSLTEHKATHAGEK----------
1010 1020 1030 1040 1050
560 570 580 590 600 610
pF1KA1 DQNPEQKEKCFKCNKCEKTFSCSKYLTQHERIHTRGMKPFECDQCGKAFGQSTRLIHHQR
: .::..: :.:: . ::.:. :. : .:..:..:::::. :. :..:.:
CCDS54 ---P------YKCEECGKAFSWPSRLTEHKATHA-GEEPYKCEECGKAFNWSSNLMEHKR
1060 1070 1080 1090 1100
620 630 640 650 660 670
pF1KA1 IHSRVRLYKWGEQGKAISSASLIKLQSFHTKEHPFKCNECGKTFSHSAHLSKHQLIHAGE
:: : :.:.::.::::.:: . :.::..::.::
CCDS54 IH---------------------------TGEKPYKCEECGKSFSTFSILTKHKVIHTGE
1110 1120 1130
680 690 700 710 720 730
pF1KA1 NPFKCSKCDRVFTQRNYLVQHERTHARKKPLVCNECGKTFRQSSCLSKHQRIHSGEKPYV
.:.:: .: ... . : :.. :. .:: :.:::: : . : :.::. ::.::: :
CCDS54 KPYKCEECGKAYKWSSTLSYHKKIHTVEKPYKCEECGKGFVMFSILAKHKVIHTGEKLYK
1140 1150 1160 1170 1180 1190
740 750 760 770 780 790
pF1KA1 CDYCGKAFGLSAELVRHQRIHTGEKPYVCQECGKAFTQSSCLSIHRRVHTGEKPYRCGEC
:. ::::. . : :..:::::::: :.::::::. : :. :. .:::::::.: ::
CCDS54 CEECGKAYKWPSTLRYHKKIHTGEKPYKCEECGKAFSTFSILTKHKVIHTGEKPYKCEEC
1200 1210 1220 1230 1240 1250
800 810 820 830 840 850
pF1KA1 GKAFAQKANLTQHQRIHTGEKPYSCNVCGKAFVLSAHLNQHLRVHTQETLYQCQRCQKAF
::::. . ...:..::::::
CCDS54 GKAFSWLSVFSKHKKIHTGEKL
1260 1270 1280
>>CCDS62706.1 ZNF229 gene_id:7772|Hs108|chr19 (819 aa)
initn: 4250 init1: 983 opt: 1636 Z-score: 1102.6 bits: 215.0 E(32554): 4.3e-55
Smith-Waterman score: 1781; 43.8% identity (69.2% similar) in 601 aa overlap (267-864:236-812)
240 250 260 270 280 290
pF1KA1 TVHQECEQGFDRNASLSVYPKTHTGYKFYVCNEYGTTFSQSTYLWHQKTHTGEKPCKSQD
::. ... : .. . ::. ::..
CCDS62 VYKCNWDDDSFCWISCHVDHRFPEIDKPCGCNKCRKDCIKNSVL--HRINPGENGLKSNE
210 220 230 240 250 260
300 310 320 330 340 350
pF1KA1 SDHPPSHDTQPGEHQKTHTDSKSYNCNECGKAFTRIFHLTRHQKIHTRKRYECSKCQATF
. :.. : .. : . .: .... . ::.:::.. : .. .. .
CCDS62 YRNGFRDDADLPPHPRVPLKEKLCQYDEFSEGLRHSAHLNRHQRVPTGEK-SVKSLERGR
270 280 290 300 310 320
360 370 380 390 400 410
pF1KA1 NLRK--HLIQHQKTHAAKTTSECQECGKIFRHSSLLIEHQALHAGEEPYKCNERGKSFRH
..:. :. .: .. .. .:. ::: ::..:.:. ::..:.:..::::.: ::.: .
CCDS62 GVRQNTHIRNHPRAPVGDMPYRCDVCGKGFRYKSVLLIHQGVHTGRRPYKCEECGKAFGR
330 340 350 360 370 380
420 430 440 450 460 470
pF1KA1 NSTLKIHQRVHSGEKPYKCSECGKAFHRHTHLNEHRRIHTGYRPHKCQECVRSFSRPSHL
.:.: .:::::.::::::::::::.: . :. :.:.::: .:. :.:: ..: : :
CCDS62 SSNLLVHQRVHTGEKPYKCSECGKGFSYSSVLQVHQRLHTGEKPYTCSECGKGFCAKSAL
390 400 410 420 430 440
480 490 500 510 520 530
pF1KA1 MRHQAIHTAEKPYSCAECKETFSDNNRLVQHQKMHTVKTPYECQECGERFICGSTLKCHE
.:: :: .::::::.:: . :: ...: .::: :: . ::.:..::. : .: :. :.
CCDS62 HKHQHIHPGEKPYSCGECGKGFSCSSHLSSHQKTHTGERPYQCDKCGKGFSHNSYLQAHQ
450 460 470 480 490 500
540 550 560 570 580 590
pF1KA1 SVHAREKQGFFVSGKILDQNPEQKEKCFKCNKCEKTFSCSKYLTQHERIHTRGMKPFECD
:: :. : .::: : :.:: :. : .:.:.:: : ::..:.
CCDS62 RVHM---------GQHL----------YKCNVCGKSFSYSSGLLMHQRLHT-GEKPYKCE
510 520 530 540
600 610 620 630 640 650
pF1KA1 QCGKAFGQSTRLIHHQRIHSRVRLYKWGEQGKAISSAS-LIKLQSFHTKEHPFKCNECGK
:::.::.:. : :::.:. . :: .: ::.. : : . : :: :.:. :. :::
CCDS62 -CGKSFGRSSDLHIHQRVHTGEKPYKCSECGKGFRRNSDLHSHQRVHTGERPYVCDVCGK
550 560 570 580 590 600
660 670 680 690 700 710
pF1KA1 TFSHSAHLSKHQLIHAGENPFKCSKCDRVFTQRNYLVQHERTHARKKPLVCNECGKTFRQ
: .:. : :: .:.::.:.::..: . :. . :. :.:.:. .:: :.:::: ::
CCDS62 GFIYSSDLLIHQRVHTGEKPYKCAECGKGFSYSSGLLIHQRVHTGEKPYRCQECGKGFRC
610 620 630 640 650 660
720 730 740 750 760 770
pF1KA1 SSCLSKHQRIHSGEKPYVCDYCGKAFGLSAELVRHQRIHTGEKPYVCQECGKAFTQSSCL
.: : ::::.:.:.:::.:: :::.:. ...: :::.:::::::.: ::::.: .: :
CCDS62 TSSLHKHQRVHTGKKPYTCDQCGKGFSYGSNLRTHQRLHTGEKPYTCCECGKGFRYGSGL
670 680 690 700 710 720
780 790 800 810 820 830
pF1KA1 SIHRRVHTGEKPYRCGECGKAFAQKANLTQHQRIHTGEKPYSCNVCGKAFVLSAHLNQHL
:.::::::::::: :::...:...: :::.:::::::.:. :::.: .. :. :
CCDS62 LSHKRVHTGEKPYRCHVCGKGYSQSSHLQGHQRVHTGEKPYKCEECGKGFGRNSCLHVHQ
730 740 750 760 770 780
840 850 860 870
pF1KA1 RVHTQETLYQCQRCQKAFRCHSSLSRHQRVHNKQQYCL
:::: : : : : :.: :.: :::::
CCDS62 RVHTGEKPYTCGVCGKGFSYTSGLRNHQRVHLGENPYK
790 800 810
>>CCDS42574.1 ZNF229 gene_id:7772|Hs108|chr19 (825 aa)
initn: 4250 init1: 983 opt: 1636 Z-score: 1102.6 bits: 215.0 E(32554): 4.3e-55
Smith-Waterman score: 1781; 43.8% identity (69.2% similar) in 601 aa overlap (267-864:242-818)
240 250 260 270 280 290
pF1KA1 TVHQECEQGFDRNASLSVYPKTHTGYKFYVCNEYGTTFSQSTYLWHQKTHTGEKPCKSQD
::. ... : .. . ::. ::..
CCDS42 VYKCNWDDDSFCWISCHVDHRFPEIDKPCGCNKCRKDCIKNSVL--HRINPGENGLKSNE
220 230 240 250 260
300 310 320 330 340 350
pF1KA1 SDHPPSHDTQPGEHQKTHTDSKSYNCNECGKAFTRIFHLTRHQKIHTRKRYECSKCQATF
. :.. : .. : . .: .... . ::.:::.. : .. .. .
CCDS42 YRNGFRDDADLPPHPRVPLKEKLCQYDEFSEGLRHSAHLNRHQRVPTGEK-SVKSLERGR
270 280 290 300 310 320
360 370 380 390 400 410
pF1KA1 NLRK--HLIQHQKTHAAKTTSECQECGKIFRHSSLLIEHQALHAGEEPYKCNERGKSFRH
..:. :. .: .. .. .:. ::: ::..:.:. ::..:.:..::::.: ::.: .
CCDS42 GVRQNTHIRNHPRAPVGDMPYRCDVCGKGFRYKSVLLIHQGVHTGRRPYKCEECGKAFGR
330 340 350 360 370 380
420 430 440 450 460 470
pF1KA1 NSTLKIHQRVHSGEKPYKCSECGKAFHRHTHLNEHRRIHTGYRPHKCQECVRSFSRPSHL
.:.: .:::::.::::::::::::.: . :. :.:.::: .:. :.:: ..: : :
CCDS42 SSNLLVHQRVHTGEKPYKCSECGKGFSYSSVLQVHQRLHTGEKPYTCSECGKGFCAKSAL
390 400 410 420 430 440
480 490 500 510 520 530
pF1KA1 MRHQAIHTAEKPYSCAECKETFSDNNRLVQHQKMHTVKTPYECQECGERFICGSTLKCHE
.:: :: .::::::.:: . :: ...: .::: :: . ::.:..::. : .: :. :.
CCDS42 HKHQHIHPGEKPYSCGECGKGFSCSSHLSSHQKTHTGERPYQCDKCGKGFSHNSYLQAHQ
450 460 470 480 490 500
540 550 560 570 580 590
pF1KA1 SVHAREKQGFFVSGKILDQNPEQKEKCFKCNKCEKTFSCSKYLTQHERIHTRGMKPFECD
:: :. : .::: : :.:: :. : .:.:.:: : ::..:.
CCDS42 RVHM---------GQHL----------YKCNVCGKSFSYSSGLLMHQRLHT-GEKPYKCE
510 520 530 540
600 610 620 630 640 650
pF1KA1 QCGKAFGQSTRLIHHQRIHSRVRLYKWGEQGKAISSAS-LIKLQSFHTKEHPFKCNECGK
:::.::.:. : :::.:. . :: .: ::.. : : . : :: :.:. :. :::
CCDS42 -CGKSFGRSSDLHIHQRVHTGEKPYKCSECGKGFRRNSDLHSHQRVHTGERPYVCDVCGK
550 560 570 580 590 600
660 670 680 690 700 710
pF1KA1 TFSHSAHLSKHQLIHAGENPFKCSKCDRVFTQRNYLVQHERTHARKKPLVCNECGKTFRQ
: .:. : :: .:.::.:.::..: . :. . :. :.:.:. .:: :.:::: ::
CCDS42 GFIYSSDLLIHQRVHTGEKPYKCAECGKGFSYSSGLLIHQRVHTGEKPYRCQECGKGFRC
610 620 630 640 650 660
720 730 740 750 760 770
pF1KA1 SSCLSKHQRIHSGEKPYVCDYCGKAFGLSAELVRHQRIHTGEKPYVCQECGKAFTQSSCL
.: : ::::.:.:.:::.:: :::.:. ...: :::.:::::::.: ::::.: .: :
CCDS42 TSSLHKHQRVHTGKKPYTCDQCGKGFSYGSNLRTHQRLHTGEKPYTCCECGKGFRYGSGL
670 680 690 700 710 720
780 790 800 810 820 830
pF1KA1 SIHRRVHTGEKPYRCGECGKAFAQKANLTQHQRIHTGEKPYSCNVCGKAFVLSAHLNQHL
:.::::::::::: :::...:...: :::.:::::::.:. :::.: .. :. :
CCDS42 LSHKRVHTGEKPYRCHVCGKGYSQSSHLQGHQRVHTGEKPYKCEECGKGFGRNSCLHVHQ
730 740 750 760 770 780
840 850 860 870
pF1KA1 RVHTQETLYQCQRCQKAFRCHSSLSRHQRVHNKQQYCL
:::: : : : : :.: :.: :::::
CCDS42 RVHTGEKPYTCGVCGKGFSYTSGLRNHQRVHLGENPYK
790 800 810 820
>>CCDS12944.1 ZNF667 gene_id:63934|Hs108|chr19 (610 aa)
initn: 2354 init1: 930 opt: 1505 Z-score: 1017.2 bits: 198.8 E(32554): 2.4e-50
Smith-Waterman score: 1510; 41.1% identity (70.7% similar) in 547 aa overlap (300-839:77-608)
270 280 290 300 310 320
pF1KA1 YGTTFSQSTYLWHQKTHTGEKPCKSQDSDHPPSHDTQPGEHQKTHTDSKSYN-CNECGKA
: . : .: .: . : ::. :..
CCDS12 YRNLVSLGLSFRRPNVITLLEKGKAPWMVEPVRRRRAPDSGSKCETKKLPPNQCNKSGQS
50 60 70 80 90 100
330 340 350 360 370 380
pF1KA1 FTRIFHLTRHQKIHTRKRYECSKCQATFNLRKHLIQHQKTHAAKTTSECQECGKIFRHSS
. . . .. .:: ::: : : : . :.. .: :..: .:..::: : .:
CCDS12 ICQKL-VSAQQKAPTRK----SGC----NKNSVLVKPKKGHSGKKPLKCNDCGKTFSRSF
110 120 130 140 150
390 400 410 420 430 440
pF1KA1 LLIEHQALHAGEEPYKCNERGKSFRHNSTLKIHQRVHSGEKPYKCSECGKAFHRHTHLNE
: :: .:.::.:..:.. :.::. :.. .:::.:::.: ..:..::..:...: :
CCDS12 SLKLHQNIHTGEKPFECSNCRKAFRQISSILLHQRIHSGKKSHECNKCGESFNQRTTLIL
160 170 180 190 200 210
450 460 470 480 490 500
pF1KA1 HRRIHTGYRPHKCQECVRSFSRPSHLMRHQAIHTAEKPYSCAECKETFSDNNRLVQHQKM
: ::: : .. .: ...:. . . :: ::.. . .: .: ..:.. . :. :.:.
CCDS12 HMRIHDG---KEILDCGKALSQCQSFNIHQKIHVVGNVCQCRKCGKAFNQMSSLLLHKKI
220 230 240 250 260 270
510 520 530 540 550 560
pF1KA1 HTVKTPYECQECGERFICGSTLKCHESVHAREKQGFFVSGKILDQNPEQK----EKCFKC
:. : .. ..::. : :.. :. .:: :: . ..: :.:. .:. :. :::
CCDS12 HNGKKTHKYNKCGRGFKKKSVFVVHKRIHAGEK--IPENAKALSQSLQQRSHHLENPFKC
280 290 300 310 320 330
570 580 590 600 610 620
pF1KA1 NKCEKTFSCSKYLTQHERIHTRGMKPFECDQCGKAFGQSTRLIHHQRIHSRVRLYKWGEQ
:: : :. . : :.:::: . ::..::.: : : . . :: : :::. .::. ..
CCDS12 RKCGKLFNRISPLMLHQRIHT-SEKPYKCDKCDKFFRRLSTLILHLRIHNGEKLYRCNKC
340 350 360 370 380 390
630 640 650 660 670 680
pF1KA1 GKAISS-ASLIKLQSFHTKEHP-FKCNECGKTFSHSAHLSKHQLIHAGENPFKCSKCDRV
:. . .:::. :. :::.. :.:.:::: :: .:.:. :: ::. :.::::.::..:
CCDS12 EKVCNRHSSLIQHQKVHTKKKKLFECKECGKMFSGTANLKIHQNIHSEEKPFKCNKCSKV
400 410 420 430 440 450
690 700 710 720 730 740
pF1KA1 FTQRNYLVQHERTHARKKPLVCNECGKTFRQSSCLSKHQRIHSGEKPYVCDYCGKAFGLS
: ....:..:.: :. .:: :.::::.: . :..:.:::. ..:: :: :::::. :
CCDS12 FGRQSFLIEHQRIHTGEKPYQCEECGKAFSHRISLTRHKRIHTEDRPYECDQCGKAFSQS
460 470 480 490 500 510
750 760 770 780 790 800
pF1KA1 AELVRHQRIHTGEKPYVCQECGKAFTQSSCLSIHRRVHTGEKPYRCGECGKAFAQKANLT
:.:..:.:::::::::.:. :::::.: . : .:.: :::::::.:.::::::.. ..:
CCDS12 AHLAQHERIHTGEKPYTCKTCGKAFSQRTSLILHERSHTGEKPYECNECGKAFSSGSDLI
520 530 540 550 560 570
810 820 830 840 850 860
pF1KA1 QHQRIHTGEKPYSCNVCGKAFVLSAHLNQHLRVHTQETLYQCQRCQKAFRCHSSLSRHQR
.::: :..:::: :. ::::. :. : .: .:..:
CCDS12 RHQRSHSSEKPYECSKCGKAYSRSSSLIRHQNTHSEEKA
580 590 600 610
870
pF1KA1 VHNKQQYCL
>>CCDS75846.1 ZNF658 gene_id:26149|Hs108|chr9 (1059 aa)
initn: 6439 init1: 1001 opt: 1456 Z-score: 982.2 bits: 193.1 E(32554): 2.2e-48
Smith-Waterman score: 1965; 41.7% identity (69.7% similar) in 689 aa overlap (187-868:302-964)
160 170 180 190 200 210
pF1KA1 SPVSTVSTGEDSMVHNVSEKTLTPAKSKEYRGEFFSY-SDHSQQDSVQEGEKPYQCSECG
:: :: : .:.. . : . .. ..:
CCDS75 LNEYGTSCDKTTAVEYNKVHMAMTHYECNERGINFSRKSPLTQSQRTITGWSAFESNKCE
280 290 300 310 320 330
220 230 240 250 260 270
pF1KA1 KSFSGSYRLTQHWITHTREKPTVHQECEQGFDRNASLSVYPKTHTGYKFYVCNEYGT---
..:: : : :.. .: :.:: ... .. ..... . :: :::. .:.:
CCDS75 ENFSQSSAHIVHQKTQAGDKFGEHNECTDALYQKLDFTAHQRIHTEDKFYLSDEHGKCRK
340 350 360 370 380 390
280 290 300 310 320 330
pF1KA1 TFSQSTYL-WHQKTHTGEKPCKSQDSDHPPSHDTQPGEHQKTHTDSKSYNCNECGKAFTR
.: ....: ::. :.::: . .. . ...: .: :.. : :.:::::::: .
CCDS75 SFYRKAHLIQHQRPHSGEKTYQYEECAKSFCSSSHPIQHPGTYVGFKLYECNECGKAFCQ
400 410 420 430 440 450
340 350 360 370 380 390
pF1KA1 IFHLTRHQKIHTRKRYECSKCQATFNLRKHLIQHQKTHAAKTTSECQECG-KIFRHSSLL
.:..: .:::... :.. . .. :: :::: : : . :: . . ..: :
CCDS75 NSNLSKHLRIHTKEK-PCDNNGCGRSYKSPLIGHQKTDA-----EMELCGGSEYGKTSHL
460 470 480 490 500
400 410 420 430 440 450
pF1KA1 IEHQALHAGEEPYKCNERGKSFRHNSTLKIHQRVHSGEKPYKCSECGKAFHRHTHLNEHR
:: . ::.::.: : ::.: ..: :. :::.:.:::::.: :: :.: ..:::. :.
CCDS75 KGHQRILMGEKPYECIECGKTFSKTSHLRAHQRIHTGEKPYECVECEKTFSHKTHLSVHQ
510 520 530 540 550 560
460 470 480 490 500 510
pF1KA1 RIHTGYRPHKCQECVRSFSRPSHLMRHQAIHTAEKPYSCAECKETFSDNNRLVQHQKMHT
:.::: .:..:..: .::. : : :: :::.:::: :..:..::. :. : :...::
CCDS75 RVHTGEKPYECNDCGKSFTYNSALRAHQRIHTGEKPYECSDCEKTFAHNSALRAHHRIHT
570 580 590 600 610 620
520 530 540 550 560 570
pF1KA1 VKTPYECQECGERFICGSTLKCHESVHAREKQGFFVSGKILDQNPEQKEKCFKCNKCEKT
. ::::.:::. : :.:: :. .:. :: : ..::.: ..
CCDS75 GEKPYECNECGRSFAHISVLKAHQRIHTGEK-------------P------YECNECGRS
630 640 650 660
580 590 600 610 620 630
pF1KA1 FSCSKYLTQHERIHTRGMKPFECDQCGKAFGQSTRLIHHQRIHSRVRLYKWGEQGKAISS
:. .. : :.:::: : ::.::..: :.:.... : :::::. . :. .: :...
CCDS75 FTYNSALRAHQRIHT-GRKPYECSDCEKTFAHNSALKIHQRIHTGEKPYECNECEKTFAH
670 680 690 700 710 720
640 650 660 670 680
pF1KA1 ASLIKL-QSFHTKEHPFKCNECGKTFSHSAHLSKHQLIHAGENPFKCSKCDRVFTQRNYL
: .. :..:: :. ..:.:::::: ....:: :. ::.::.:..:::: ..:.:..::
CCDS75 NSALRAHQNIHTGEKLYECSECGKTFFQKTRLSTHRRIHTGEKPYECSKCGKTFSQKSYL
730 740 750 760 770 780
690 700 710 720 730 740
pF1KA1 VQHERTHARKKPLVCNECGKTFRQSSCLSKHQRIHSGEKPYVCDYCGKAFGLSAELVRHQ
::: :. .:: :: ::::: .. : :::::.::::: :. :::.:. ..: ::
CCDS75 SGHERIHTGEKPYECNVCGKTFVYKAALIVHQRIHTGEKPYECNQCGKTFSQRTHLCAHQ
790 800 810 820 830 840
750 760 770 780 790 800
pF1KA1 RIHTGEKPYVCQECGKAFTQSSCLSIHRRVHTGEKPYRCGECGKAFAQKANLTQHQRIHT
::::::::: :.::::.:...: : :.:.:::::::.:..:::.:.. ..: : : ..
CCDS75 RIHTGEKPYECNECGKTFADNSALRAHHRIHTGEKPYECNDCGKTFSKTSHLRAHLRTRS
850 860 870 880 890 900
810 820 830 840 850 860
pF1KA1 GEKPYSCNVCGKAFVLSAHLNQHLRVHTQETLYQCQRCQKAFRCHSSLSRHQRVHNKQQY
::::: :. :::.: ..... : :::: : :.:. : : : .:.: :::.:. ..
CCDS75 GEKPYECSECGKTFSEKSYVSAHQRVHTGEKPYECNVCGKPFAHNSTLRVHQRIHTGEKS
910 920 930 940 950 960
870
pF1KA1 CL
CCDS75 YECNDCGKTFSQKSHLSAHQRIHTGEKPYECNECGKAFAQNSTLRVHQRIHTGEKPYECD
970 980 990 1000 1010 1020
>>CCDS12637.1 ZNF112 gene_id:7771|Hs108|chr19 (907 aa)
initn: 5245 init1: 948 opt: 1426 Z-score: 963.1 bits: 189.4 E(32554): 2.5e-47
Smith-Waterman score: 1512; 33.0% identity (59.2% similar) in 861 aa overlap (6-847:2-804)
10 20 30 40 50
pF1KA1 MAEEFVTLKDVGMDFTLGDWEQLGLE---QGDTFWDTALDNCQDLFLL--DPPRPNLTSH
::.:::.. :: :.::: : . :. :.: ..:.:. .: .:.: :.
CCDS12 MVTFKDVAVVFTE---EELGLLDSVQRKLYRDVMLENFRNLLLVAHQPFKPDLISQ
10 20 30 40 50
60 70 80 90 100 110
pF1KA1 PDGSEDLEPLAGGSPEATSPDVTETKNSPLMEDFFEEGFSQEIIEMLSKDGFWNSNFGEA
. : : . .:. . ::. ::.. : : . ::. :... :
CCDS12 LEREEKLLMVETETPR---DGCSGRKNQQKMESIQEVTVSYFSPKELSSRQTWQQSAGGL
60 70 80 90 100 110
120 130 140 150 160 170
pF1KA1 CIEDTWLDSLLGDPESLLRSDIATNGESPTECKSHELKRGLSPVSTVSTGEDSMVHNVSE
. .: . : :.. .:.: . . :. ::. .: .. . ....
CCDS12 IRCQDFLKVFQGK-----NSQLQEQGNSLGQVWA-----GI-PVQ-ISEDKNYIFTHIGN
120 130 140 150
180 190 200 210 220 230
pF1KA1 KTLTPAKSKEYRGEFFSYSDHSQQDSVQEGEKPYQCSECGKSFSGSYRLTQ----HWITH
. . ::. : . . :: . . . ::: .: ...: . .. . :..:
CCDS12 GS-NYIKSQGYPSW---RAHHSWRKMYLKESHNYQC-RC-QQISMKNHFCKCDSVSWLSH
160 170 180 190 200 210
240 250 260 270 280 290
pF1KA1 TREKPTVHQECEQGFDRNASLSVYPKTHTGYKFYVCNEYGTTFSQSTYLWHQKTHTGEKP
.: ::.. .: : :.. : . . . : ... .: :::
CCDS12 HNDKLEVHRK------EN---------------YSCHDCGEDIMKVSLLNQESIQTEEKP
220 230 240 250
300 310 320 330 340
pF1KA1 CKSQDSDHPPSHDTQPGEHQKTHTDSKSYNCNECGKA--FTRIFHLTRHQKIHTRKRYEC
. :.:.. ::. : ..: :. . :::. .. ..:. ::.:. . :
CCDS12 YPCTGYRKAFSNDSSSEVHQQFHLEGKPYTYSSCGKGCNYSSLLHI--HQNIEREDDIEN
260 270 280 290 300
350 360 370 380 390 400
pF1KA1 SKCQATFNLRKHLIQHQKTHAAKTTSECQECGKIFRHSSLLIEHQALHAGEEPYKCNERG
: :: ..:..:. . .: : :. : : : : .. .:.:: :. :
CCDS12 S----------HLKSYQRVHTEEKPCKCGEYGENFNHCSPLNTYELIHTGEMSYRHNIYE
310 320 330 340 350
410 420 430 440 450 460
pF1KA1 KSFRHNSTLKIHQRVHSGEKPYKCSECGKAFHRHTHLNEHRRIHTGYRPHKCQECVRSFS
:.: :. :. :::. ..:.. : ..:.. . :. :..::: . . : .::
CCDS12 KAFSHSLDLNSIFRVHTRDEPHEYEENENVFNQSSCLQVHQKIHTEEKLYTDIEYGKSFI
360 370 380 390 400 410
470 480 490 500 510 520
pF1KA1 RPSHLMRHQAIHTAEKPYSCAECKETFSDNNRLVQHQKMHTVKTPYECQECGERFICGST
:.: .. .: :. :. :: . :: ... . : .:: . ::. :.. : .
CCDS12 CSSNLDIQHRVHMEENSYNSEECGNGFSLASHFQDLQIVHTKEQPYKRYVCSNSFSHNLY
420 430 440 450 460 470
530 540 550 560 570 580
pF1KA1 LKCHESVHAREK------QGFFVSGKILD-QNPEQKEKCFKCNKCEKTFSCSKYLTQHER
:. : ..: :: .:: :.:. : : . .: .::: : : :. . :. :.:
CCDS12 LQGHPKIHIGEKPRKEHGNGFNWSSKLKDHQRVHTGQKPYKCNICGKGFNHRSVLNVHQR
480 490 500 510 520 530
590 600 610 620 630 640
pF1KA1 IHTRGMKPFECDQCGKAFGQSTRLIHHQRIHSRVRLYKWGEQGKAISSASLIK-LQSFHT
.:: : ::..:..: :.:..:. : :::.:. . :: : ::..: : .. : ::
CCDS12 VHT-GEKPYKCEECDKGFSRSSYLQAHQRVHTGEKPYKCEECGKGFSRNSYLQGHQRVHT
540 550 560 570 580 590
650 660 670 680 690 700
pF1KA1 KEHPFKCNECGKTFSHSAHLSKHQLIHAGENPFKCSKCDRVFTQRNYLVQHERTHARKKP
:.:.::.:::: ::.:.::. :: .:.::.:::: .: . :. : :.:.:. .::
CCDS12 GEKPYKCEECGKGFSRSSHLQGHQRVHTGEKPFKCEECGKGFSWSFNLQIHQRVHTGEKP
600 610 620 630 640 650
710 720 730 740 750 760
pF1KA1 LVCNECGKTFRQSSCLSKHQRIHSGEKPYVCDYCGKAFGLSAELVRHQRIHTGEKPYVCQ
:.:::: : ..: : :::.:.::::: :: :::.:. . : :: .:.::.::.:.
CCDS12 YKCEECGKGFSKASTLLAHQRVHTGEKPYQCDECGKSFSQRSYLQSHQSVHSGERPYICE
660 670 680 690 700 710
770 780 790 800 810 820
pF1KA1 ECGKAFTQSSCLSIHRRVHTGEKPYRCGECGKAFAQKANLTQHQRIHTGEKPYSCNVCGK
:::.:.: . :. :.:::: :::.: :::.:.:.. : :.:.::: :::.:.:: :
CCDS12 VCGKGFSQRAYLQGHQRVHTRVKPYKCEMCGKGFSQSSRLEAHRRVHTGGKPYKCEVCTK
720 730 740 750 760 770
830 840 850 860 870
pF1KA1 AFVLSAHLNQHLRVHTQETLYQCQRCQKAFRCHSSLSRHQRVHNKQQYCL
.: :..:. : :::.. :.:..:
CCDS12 GFSESSRLQAHQRVHVEGRPYKCEQCGKGFSGYSSLQAHHRVHTGEKPYKCEVCGKGFSQ
780 790 800 810 820 830
>>CCDS54276.1 ZNF112 gene_id:7771|Hs108|chr19 (913 aa)
initn: 5245 init1: 948 opt: 1426 Z-score: 963.1 bits: 189.4 E(32554): 2.5e-47
Smith-Waterman score: 1520; 32.9% identity (59.3% similar) in 864 aa overlap (3-847:5-810)
10 20 30 40 50
pF1KA1 MAEEFVTLKDVGMDFTLGDWEQLGLE---QGDTFWDTALDNCQDLFLL--DPPRPNLT
.:.::.:::.. :: :.::: : . :. :.: ..:.:. .: .:.:
CCDS54 MTKFQEMVTFKDVAVVFTE---EELGLLDSVQRKLYRDVMLENFRNLLLVAHQPFKPDLI
10 20 30 40 50
60 70 80 90 100 110
pF1KA1 SHPDGSEDLEPLAGGSPEATSPDVTETKNSPLMEDFFEEGFSQEIIEMLSKDGFWNSNFG
:. . : : . .:. . ::. ::.. : : . ::. :... :
CCDS54 SQLEREEKLLMVETETPR---DGCSGRKNQQKMESIQEVTVSYFSPKELSSRQTWQQSAG
60 70 80 90 100 110
120 130 140 150 160 170
pF1KA1 EACIEDTWLDSLLGDPESLLRSDIATNGESPTECKSHELKRGLSPVSTVSTGEDSMVHNV
. .: . : :.. .:.: . . :. ::. .: .. . ..
CCDS54 GLIRCQDFLKVFQGK-----NSQLQEQGNSLGQVWA-----GI-PVQ-ISEDKNYIFTHI
120 130 140 150 160
180 190 200 210 220
pF1KA1 SEKTLTPAKSKEYRGEFFSYSDHSQQDSVQEGEKPYQCSECGKSFSGSYRLTQ----HWI
.. . . ::. : . . :: . . . ::: .: ...: . .. . :.
CCDS54 GNGS-NYIKSQGYPSW---RAHHSWRKMYLKESHNYQC-RC-QQISMKNHFCKCDSVSWL
170 180 190 200 210
230 240 250 260 270 280
pF1KA1 THTREKPTVHQECEQGFDRNASLSVYPKTHTGYKFYVCNEYGTTFSQSTYLWHQKTHTGE
.: .: ::.. . : :.. : . . . : ... .: :
CCDS54 SHHNDKLEVHRKEN---------------------YSCHDCGEDIMKVSLLNQESIQTEE
220 230 240 250
290 300 310 320 330 340
pF1KA1 KPCKSQDSDHPPSHDTQPGEHQKTHTDSKSYNCNECGKA--FTRIFHLTRHQKIHTRKRY
:: . :.:.. ::. : ..: :. . :::. .. ..:. ::.:. .
CCDS54 KPYPCTGYRKAFSNDSSSEVHQQFHLEGKPYTYSSCGKGCNYSSLLHI--HQNIEREDDI
260 270 280 290 300 310
350 360 370 380 390 400
pF1KA1 ECSKCQATFNLRKHLIQHQKTHAAKTTSECQECGKIFRHSSLLIEHQALHAGEEPYKCNE
: : :: ..:..:. . .: : :. : : : : .. .:.:: :. :
CCDS54 ENS----------HLKSYQRVHTEEKPCKCGEYGENFNHCSPLNTYELIHTGEMSYRHNI
320 330 340 350 360
410 420 430 440 450 460
pF1KA1 RGKSFRHNSTLKIHQRVHSGEKPYKCSECGKAFHRHTHLNEHRRIHTGYRPHKCQECVRS
:.: :. :. :::. ..:.. : ..:.. . :. :..::: . . : .:
CCDS54 YEKAFSHSLDLNSIFRVHTRDEPHEYEENENVFNQSSCLQVHQKIHTEEKLYTDIEYGKS
370 380 390 400 410 420
470 480 490 500 510 520
pF1KA1 FSRPSHLMRHQAIHTAEKPYSCAECKETFSDNNRLVQHQKMHTVKTPYECQECGERFICG
: :.: .. .: :. :. :: . :: ... . : .:: . ::. :.. : .
CCDS54 FICSSNLDIQHRVHMEENSYNSEECGNGFSLASHFQDLQIVHTKEQPYKRYVCSNSFSHN
430 440 450 460 470 480
530 540 550 560 570 580
pF1KA1 STLKCHESVHAREK------QGFFVSGKILD-QNPEQKEKCFKCNKCEKTFSCSKYLTQH
:. : ..: :: .:: :.:. : : . .: .::: : : :. . :. :
CCDS54 LYLQGHPKIHIGEKPRKEHGNGFNWSSKLKDHQRVHTGQKPYKCNICGKGFNHRSVLNVH
490 500 510 520 530 540
590 600 610 620 630
pF1KA1 ERIHTRGMKPFECDQCGKAFGQSTRLIHHQRIHSRVRLYKWGEQGKAISSASLIK-LQSF
.:.:: : ::..:..: :.:..:. : :::.:. . :: : ::..: : .. :
CCDS54 QRVHT-GEKPYKCEECDKGFSRSSYLQAHQRVHTGEKPYKCEECGKGFSRNSYLQGHQRV
550 560 570 580 590 600
640 650 660 670 680 690
pF1KA1 HTKEHPFKCNECGKTFSHSAHLSKHQLIHAGENPFKCSKCDRVFTQRNYLVQHERTHARK
:: :.:.::.:::: ::.:.::. :: .:.::.:::: .: . :. : :.:.:. .
CCDS54 HTGEKPYKCEECGKGFSRSSHLQGHQRVHTGEKPFKCEECGKGFSWSFNLQIHQRVHTGE
610 620 630 640 650 660
700 710 720 730 740 750
pF1KA1 KPLVCNECGKTFRQSSCLSKHQRIHSGEKPYVCDYCGKAFGLSAELVRHQRIHTGEKPYV
:: :.:::: : ..: : :::.:.::::: :: :::.:. . : :: .:.::.::.
CCDS54 KPYKCEECGKGFSKASTLLAHQRVHTGEKPYQCDECGKSFSQRSYLQSHQSVHSGERPYI
670 680 690 700 710 720
760 770 780 790 800 810
pF1KA1 CQECGKAFTQSSCLSIHRRVHTGEKPYRCGECGKAFAQKANLTQHQRIHTGEKPYSCNVC
:. :::.:.: . :. :.:::: :::.: :::.:.:.. : :.:.::: :::.:.::
CCDS54 CEVCGKGFSQRAYLQGHQRVHTRVKPYKCEMCGKGFSQSSRLEAHRRVHTGGKPYKCEVC
730 740 750 760 770 780
820 830 840 850 860 870
pF1KA1 GKAFVLSAHLNQHLRVHTQETLYQCQRCQKAFRCHSSLSRHQRVHNKQQYCL
:.: :..:. : :::.. :.:..:
CCDS54 TKGFSESSRLQAHQRVHVEGRPYKCEQCGKGFSGYSSLQAHHRVHTGEKPYKCEVCGKGF
790 800 810 820 830 840
>>CCDS64999.1 ZNF7 gene_id:7553|Hs108|chr8 (590 aa)
initn: 2536 init1: 949 opt: 1396 Z-score: 945.2 bits: 185.4 E(32554): 2.5e-46
Smith-Waterman score: 1557; 43.7% identity (68.1% similar) in 542 aa overlap (284-822:65-574)
260 270 280 290 300 310
pF1KA1 VYPKTHTGYKFYVCNEYGTTFSQSTYLWHQKTHTGEKP--CKSQDSDHPPSHDTQPGEHQ
:: : . : :: :. . : :: : :
CCDS64 WLDSHLGSPGLKVTGFTFQNNCLNEETVVPKTFTKDAPQGCKELGSS---GLDCQPLESQ
40 50 60 70 80 90
320 330 340 350 360 370
pF1KA1 KTHTDSKSYNCNECGKAFTRIFHLTRHQKIHTRKRYECSKCQATFNLRKHLIQHQKTHAA
... : :.::::.. .. : .:.:.: .:..:: .. . . .. :.
CCDS64 GESAEGMSQRCEECGKGIRATSDIALHWEINTQKISRCQECQKKLSDCLQGKHTNNCHGE
100 110 120 130 140 150
380 390 400 410 420 430
pF1KA1 KTTSECQECGKIFRHSSLLIEHQALHAGEEPYKCNERGKSFRHNSTLKIHQRVHSGEKPY
: :: ::::.:: : : .:: .:.::.:.::.: ::.:: .: : :::.:.:::::
CCDS64 KPY-ECAECGKVFRLCSQLNQHQRIHTGEKPFKCTECGKAFRLSSKLIQHQRIHTGEKPY
160 170 180 190 200 210
440 450 460 470 480 490
pF1KA1 KCSECGKAFHRHTHLNEHRRIHTGYRPHKCQECVRSFSRPSHLMRHQAIHTAEKPYSCAE
.: :::::: . . : .:.::::: ::. :.:: ..::. :.:.::: ::.:.:: : :
CCDS64 RCEECGKAFGQSSSLIHHQRIHTGERPYGCRECGKAFSQQSQLVRHQRTHTGERPYPCKE
220 230 240 250 260 270
500 510 520 530 540 550
pF1KA1 CKETFSDNNRLVQHQKMHTVKTPYECQECGERFICGSTLKCHESVHAREKQGFFVSGKIL
: ..::... :.:::.::: . . . .: :. .:: ::
CCDS64 CGKAFSQSSTLAQHQRMHTGEKAQILKASD-----SPSLVAHQRIHAVEK----------
280 290 300 310
560 570 580 590 600 610
pF1KA1 DQNPEQKEKCFKCNKCEKTFSCSKYLTQHERIHTRGMKPFECDQCGKAFGQSTRLIHHQR
: :::..: :.: . :.::. ::: : ::..:..: :::: :.:::.:::
CCDS64 ---P------FKCDECGKAFRWISRLSQHQLIHT-GEKPYKCNKCTKAFGCSSRLIRHQR
320 330 340 350 360
620 630 640 650 660 670
pF1KA1 IHSRVRLYKWGEQGKA-ISSASLIKLQSFHTKEHPFKCNECGKTFSHSAHLSKHQLIHAG
:. . .: : ::. .... ::. : .:: :.:. ::.:::.::.:. : :: :: :
CCDS64 THTGEKPFKCDECGKGFVQGSHLIQHQRIHTGEKPYVCNDCGKAFSQSSSLIYHQRIHKG
370 380 390 400 410 420
680 690 700 710 720 730
pF1KA1 ENPFKCSKCDRVFTQRNYLVQHERTHARKKPLVCNECGKTFRQSSCLSKHQRIHSGEKPY
:.:..: .: ..:.. . :. :.:.:. ..: ::::::.: :.: : .:: ::.: :::
CCDS64 EKPYECLQCGKAFSMSTQLTIHQRVHTGERPYKCNECGKAFSQNSTLFQHQIIHAGVKPY
430 440 450 460 470 480
740 750 760 770 780 790
pF1KA1 VCDYCGKAFGLSAELVRHQRIHTGEKPYVCQECGKAFTQSSCLSIHRRVHTGEKPYRCGE
:. :::::. :. :..:::::: . . : :.:. :. .: ...:.: .: ..: .
CCDS64 ECSECGKAFSRSSYLIEHQRIHTRAQWF--YEYGNALEGSTFVS-RKKVNTIKKLHQCED
490 500 510 520 530 540
800 810 820 830 840 850
pF1KA1 CGKAFAQKANLTQHQRIHTGEKPYSCNVCGKAFVLSAHLNQHLRVHTQETLYQCQRCQKA
: : : ...: :::::::::::.:: ::::
CCDS64 CEKIFRWRSHLIIHQRIHTGEKPYKCNDCGKAFNRSSRLTQHQKIHMG
550 560 570 580 590
860 870
pF1KA1 FRCHSSLSRHQRVHNKQQYCL
871 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 20:35:32 2016 done: Wed Nov 2 20:35:32 2016
Total Scan time: 2.960 Total Display time: 0.200
Function used was FASTA [36.3.4 Apr, 2011]