FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7824, 604 aa
1>>>pF1KB7824 604 - 604 aa - 604 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.2518+/-0.00175; mu= 11.6854+/- 0.105
mean_var=278.9313+/-55.502, 0's: 0 Z-trim(107.6): 952 B-trim: 66 in 2/48
Lambda= 0.076794
statistics sampled from 8600 (9665) to 8600 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.63), E-opt: 0.2 (0.297), width: 16
Scan time: 3.680
The best scores are: opt bits E(32554)
CCDS6709.2 ZNF169 gene_id:169841|Hs108|chr9 ( 603) 4252 485.7 7.3e-137
CCDS82337.1 HKR1 gene_id:284459|Hs108|chr19 ( 641) 1903 225.5 1.7e-58
CCDS43307.1 PRDM9 gene_id:56979|Hs108|chr5 ( 894) 1841 218.8 2.3e-56
CCDS13174.1 ZNF337 gene_id:26152|Hs108|chr20 ( 751) 1838 218.4 2.7e-56
CCDS31940.1 ZNF84 gene_id:7637|Hs108|chr12 ( 738) 1797 213.8 6.2e-55
CCDS74693.1 ZNF343 gene_id:79175|Hs108|chr20 ( 640) 1698 202.8 1.1e-51
CCDS63235.1 ZNF133 gene_id:7692|Hs108|chr20 ( 591) 1691 202.0 1.9e-51
CCDS74704.1 ZNF133 gene_id:7692|Hs108|chr20 ( 635) 1691 202.0 1.9e-51
CCDS13134.1 ZNF133 gene_id:7692|Hs108|chr20 ( 653) 1691 202.0 2e-51
CCDS63234.1 ZNF133 gene_id:7692|Hs108|chr20 ( 654) 1691 202.0 2e-51
CCDS63233.1 ZNF133 gene_id:7692|Hs108|chr20 ( 657) 1691 202.0 2e-51
CCDS74703.1 ZNF133 gene_id:7692|Hs108|chr20 ( 667) 1691 202.0 2e-51
CCDS47539.1 ZNF12 gene_id:7559|Hs108|chr7 ( 659) 1632 195.5 1.8e-49
CCDS4624.1 ZNF184 gene_id:7738|Hs108|chr6 ( 751) 1630 195.3 2.3e-49
CCDS74692.1 ZNF343 gene_id:79175|Hs108|chr20 ( 509) 1575 189.0 1.3e-47
CCDS11179.2 ZNF287 gene_id:57336|Hs108|chr17 ( 761) 1577 189.5 1.4e-47
CCDS13028.1 ZNF343 gene_id:79175|Hs108|chr20 ( 599) 1575 189.1 1.4e-47
CCDS12846.1 ZNF615 gene_id:284370|Hs108|chr19 ( 731) 1576 189.3 1.4e-47
CCDS82387.1 ZNF615 gene_id:284370|Hs108|chr19 ( 736) 1576 189.4 1.4e-47
CCDS59418.1 ZNF615 gene_id:284370|Hs108|chr19 ( 742) 1576 189.4 1.5e-47
CCDS12495.1 ZNF567 gene_id:163081|Hs108|chr19 ( 616) 1569 188.5 2.2e-47
CCDS74349.1 ZNF567 gene_id:163081|Hs108|chr19 ( 647) 1569 188.5 2.3e-47
CCDS7198.1 ZNF33B gene_id:7582|Hs108|chr10 ( 778) 1556 187.2 6.9e-47
CCDS75075.1 ZNF595 gene_id:152687|Hs108|chr4 ( 648) 1551 186.5 9.2e-47
CCDS12848.1 ZNF432 gene_id:9668|Hs108|chr19 ( 652) 1551 186.5 9.2e-47
CCDS32991.1 ZNF599 gene_id:148103|Hs108|chr19 ( 588) 1546 185.9 1.3e-46
CCDS33046.1 ZNF224 gene_id:7767|Hs108|chr19 ( 707) 1537 185.0 2.8e-46
CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 1535 184.7 3e-46
CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 1535 184.7 3.2e-46
CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 1535 184.8 3.2e-46
CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 1535 184.8 3.2e-46
CCDS42537.1 ZNF429 gene_id:353088|Hs108|chr19 ( 674) 1525 183.6 6.9e-46
CCDS12955.1 ZNF530 gene_id:348327|Hs108|chr19 ( 599) 1512 182.1 1.8e-45
CCDS82339.1 HKR1 gene_id:284459|Hs108|chr19 ( 598) 1510 181.9 2e-45
CCDS82338.1 HKR1 gene_id:284459|Hs108|chr19 ( 640) 1510 182.0 2.1e-45
CCDS12502.1 HKR1 gene_id:284459|Hs108|chr19 ( 659) 1510 182.0 2.2e-45
CCDS4439.1 ZNF354B gene_id:117608|Hs108|chr5 ( 612) 1503 181.1 3.5e-45
CCDS14279.1 ZNF41 gene_id:7592|Hs108|chrX ( 779) 1497 180.6 6.4e-45
CCDS33006.1 ZNF607 gene_id:84775|Hs108|chr19 ( 696) 1495 180.3 7e-45
CCDS42642.1 ZNF418 gene_id:147686|Hs108|chr19 ( 676) 1491 179.9 9.4e-45
CCDS82410.1 ZNF418 gene_id:147686|Hs108|chr19 ( 697) 1491 179.9 9.6e-45
CCDS35067.1 ZNF484 gene_id:83744|Hs108|chr9 ( 816) 1491 180.0 1e-44
CCDS35066.1 ZNF484 gene_id:83744|Hs108|chr9 ( 852) 1491 180.0 1.1e-44
CCDS59136.1 ZNF484 gene_id:83744|Hs108|chr9 ( 854) 1491 180.0 1.1e-44
CCDS73089.1 ZNF33A gene_id:7581|Hs108|chr10 ( 699) 1484 179.1 1.6e-44
CCDS31182.1 ZNF33A gene_id:7581|Hs108|chr10 ( 810) 1484 179.2 1.8e-44
CCDS44372.1 ZNF33A gene_id:7581|Hs108|chr10 ( 811) 1484 179.2 1.8e-44
CCDS60514.1 ZNF33A gene_id:7581|Hs108|chr10 ( 817) 1484 179.2 1.8e-44
CCDS73088.1 ZNF33A gene_id:7581|Hs108|chr10 ( 829) 1484 179.2 1.8e-44
CCDS45463.1 ZNF629 gene_id:23361|Hs108|chr16 ( 869) 1483 179.2 2e-44
>>CCDS6709.2 ZNF169 gene_id:169841|Hs108|chr9 (603 aa)
initn: 3705 init1: 3705 opt: 4252 Z-score: 2570.6 bits: 485.7 E(32554): 7.3e-137
Smith-Waterman score: 4252; 99.8% identity (99.8% similar) in 604 aa overlap (1-604:1-603)
10 20 30 40 50 60
pF1KB7 MSPGLLTTRKEALMAFRDVAVAFTQKEWKLLSSAQRTLYREVMLENYSHLVSLGIAFSKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 MSPGLLTTRKEALMAFRDVAVAFTQKEWKLLSSAQRTLYREVMLENYSHLVSLGIAFSKP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 KLIEQLEQGDEPWREENEHLLDLCPAEPRTEFQPSFPHLVAFSSSQLLRQYALSGHPTQI
::::::::::::::::::::::::: ::::::::::::::::::::::::::::::::::
CCDS67 KLIEQLEQGDEPWREENEHLLDLCP-EPRTEFQPSFPHLVAFSSSQLLRQYALSGHPTQI
70 80 90 100 110
130 140 150 160 170 180
pF1KB7 FPSSSAGGDFQLEAPRCSSEKGESGETEGPDSSLRKRPSRISRTFFSPHQGDPVEWVEGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 FPSSSAGGDFQLEAPRCSSEKGESGETEGPDSSLRKRPSRISRTFFSPHQGDPVEWVEGN
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB7 REGGTDLRLAQRMSLGGSDTMLKGADTSESGAVIRGNYRLGLSKKSSLFSHQKHHVCPEC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 REGGTDLRLAQRMSLGGSDTMLKGADTSESGAVIRGNYRLGLSKKSSLFSHQKHHVCPEC
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB7 GRGFCQRSDLIKHQRTHTGEKPYLCPECGRRFSQKASLSIHQRKHSGEKPYVCRECGRHF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 GRGFCQRSDLIKHQRTHTGEKPYLCPECGRRFSQKASLSIHQRKHSGEKPYVCRECGRHF
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB7 RYTSSLTNHKRIHSGERPFVCQECGRGFRQKIALLLHQRTHLEEKPFVCPECGRGFCQKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 RYTSSLTNHKRIHSGERPFVCQECGRGFRQKIALLLHQRTHLEEKPFVCPECGRGFCQKA
300 310 320 330 340 350
370 380 390 400 410 420
pF1KB7 SLLQHQSSHTGERPFLCLECGRSFRQQSLLLSHQVTHSGEKPYVCAECGHSFRQKVTLIR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 SLLQHQSSHTGERPFLCLECGRSFRQQSLLLSHQVTHSGEKPYVCAECGHSFRQKVTLIR
360 370 380 390 400 410
430 440 450 460 470 480
pF1KB7 HQRTHTGEKPYLCPQCGRGFSQKVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 HQRTHTGEKPYLCPQCGRGFSQKVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRT
420 430 440 450 460 470
490 500 510 520 530 540
pF1KB7 HTGEKPYLCPKCGRAFGFKSLLTRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 HTGEKPYLCPKCGRAFGFKSLLTRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGE
480 490 500 510 520 530
550 560 570 580 590 600
pF1KB7 KPCICDECGRGFGFKSALIRHQRTHSGEKPYVCRECGRGFSQKSHLHRHRRTKSGHQLLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 KPCICDECGRGFGFKSALIRHQRTHSGEKPYVCRECGRGFSQKSHLHRHRRTKSGHQLLP
540 550 560 570 580 590
pF1KB7 QEVF
::::
CCDS67 QEVF
600
>>CCDS82337.1 HKR1 gene_id:284459|Hs108|chr19 (641 aa)
initn: 1386 init1: 1386 opt: 1903 Z-score: 1163.8 bits: 225.5 E(32554): 1.7e-58
Smith-Waterman score: 2094; 50.9% identity (69.4% similar) in 633 aa overlap (1-582:1-628)
10 20 30 40 50 60
pF1KB7 MSPGLLTTRKEALMAFRDVAVAFTQKEWKLLSSAQRTLYREVMLENYSHLVSLGIAFSKP
:. ::: ..:::..::::::: :::.::.::: :::::.::::::.:.::::: : :::
CCDS82 MATGLLRAKKEAFVAFRDVAVYFTQEEWRLLSPAQRTLHREVMLETYNHLVSLEIPSSKP
10 20 30 40 50 60
70 80 90 100 110
pF1KB7 KLIEQLEQGDEPWREENEHLLDLCPAEPRTEFQ--PSFPHLVAFSSSQLLRQYALSGHPT
::: :::.:. ::::: . ::::::: . :.: :: : . :::.: : :.. .: .
CCDS82 KLIAQLERGEAPWREERKCPLDLCPAESKPEIQLSPSCP--LIFSSQQALSQHVWLSHLS
70 80 90 100 110
120 130 140 150 160
pF1KB7 QIFPSSSAGGDFQL-----------EAPRCSSEKGESGETEGPDSSL---RKRPSRISRT
:.: : ::. ..: . : : : :.: . :: :: : : . :..
CCDS82 QLFSSLWAGNPLHLGKHYPEDQKQQQDPFCFSGKAEWIQ-EGEDSRLLFGRVSKNGTSKA
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB7 FFSP-HQGDPVEWVEGNREGGTDLRLAQRMSLGGSDTMLKGADTSESGAVIRGNYRLGLS
. :: .. .:.. : : .: .: .: .:.: ..: : . .. :.
CCDS82 LSSPPEEQQPAQSKEDNTVVDIGSSPERRADLEETDKVLHGLEVSGFGEIKYEEFGPGFI
180 190 200 210 220 230
230 240
pF1KB7 KKSSLFSHQK-----------------------------H-----HVCPECGRGFCQRSD
:.:.:.: :: : .:: :::::: .:.
CCDS82 KESNLLSLQKTQTGETPYMYTEWGDSFGSMSVLIKNPRTHSGGKPYVCRECGRGFTWKSN
240 250 260 270 280 290
250 260 270 280 290 300
pF1KB7 LIKHQRTHTGEKPYLCPECGRRFSQKASLSIHQRKHSGEKPYVCRECGRHFRYTSSLTNH
:: :::::.:::::.: .::: :. :..: ::: ::: :::::.:::. : :.: .:
CCDS82 LITHQRTHSGEKPYVCKDCGRGFTWKSNLFTHQRTHSGLKPYVCKECGQSFSLKSNLITH
300 310 320 330 340 350
310 320 330 340 350 360
pF1KB7 KRIHSGERPFVCQECGRGFRQKIALLLHQRTHLEEKPFVCPECGRGFCQKASLLQHQSSH
.: :.::.:.::.::::::::. :. :.::: :::..: :: .:: ::. :..: .:
CCDS82 QRAHTGEKPYVCRECGRGFRQHSHLVRHKRTHSGEKPYICRECEQGFSQKSHLIRHLRTH
360 370 380 390 400 410
370 380 390 400 410 420
pF1KB7 TGERPFLCLECGRSFRQQSLLLSHQVTHSGEKPYVCAECGHSFRQKVTLIRHQRTHTGEK
:::.:..: :::: : .: : .:: :::: ::::: :::. : : .: .:::.:::::
CCDS82 TGEKPYVCTECGRHFSWKSNLKTHQRTHSGVKPYVCLECGQCFSLKSNLNKHQRSHTGEK
420 430 440 450 460 470
430 440 450 460 470 480
pF1KB7 PYLCPQCGRGFSQKVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRTHTGEKPYLC
:..: .:::::..: :: :::::.::::..: .:::::..: ::: :::::.::::..:
CCDS82 PFVCTECGRGFTRKSTLSTHQRTHSGEKPFVCAECGRGFNDKSTLISHQRTHSGEKPFMC
480 490 500 510 520 530
490 500 510 520 530 540
pF1KB7 PKCGRAFGFKSLLTRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGEKPCICDECG
.::: : : : ::.:.:: .: : ::::. : ::. ::.:.: :: .: :::
CCDS82 RECGRRFRQKPNLFRHKRAHSGA--FVCRECGQGFCAKLTLIKHQRAHAGGKPHVCRECG
540 550 560 570 580 590
550 560 570 580 590 600
pF1KB7 RGFGFKSALIRHQRTHSGEKPYVCRECGRGFSQKSHLHRHRRTKSGHQLLPQEVF
.::. .: ::::::::::::::.::.::::::.
CCDS82 QGFSRQSHLIRHQRTHSGEKPYICRKCGRGFSRKSNLIRHQRTHSG
600 610 620 630 640
>>CCDS43307.1 PRDM9 gene_id:56979|Hs108|chr5 (894 aa)
initn: 1754 init1: 1754 opt: 1841 Z-score: 1125.3 bits: 218.8 E(32554): 2.3e-56
Smith-Waterman score: 1855; 51.9% identity (70.3% similar) in 528 aa overlap (87-597:382-886)
60 70 80 90 100 110
pF1KB7 FSKPKLIEQLEQGDEPWREENEHLLDLCPAEPRTEFQPSFPHLVAFSSSQLLRQYALSGH
::. :..: .::::...: :.. .:
CCDS43 ELLVWYGDEYGQELGIKWGSKWKKELMAGREPKPEIHPCPSCCLAFSSQKFLSQHVERNH
360 370 380 390 400 410
120 130 140 150
pF1KB7 PTQIFPSSSAGGDFQLEAPRCSSEKGESGETEGPDSS---------------LRKRP--S
.: ::. :: .: : : : ..... . : : : ::
CCDS43 SSQNFPGPSARKLLQPENP-CPGDQNQEQQYPDPHSRNDKTKGQEIKERSKLLNKRTWQR
420 430 440 450 460 470
160 170 180 190 200 210
pF1KB7 RISRTFFSPHQGDPVEWVEGNREGGTDLRLAQRMSLGGSDTMLKGADTSESGAVIRGNYR
.:::.: :: .:. :.: . : .:... :.. .. :. :. . : :
CCDS43 EISRAFSSPPKGQMGSCRVGKRIMEEESRTGQKVNPGNTGKLFVGVGISRIAKVKYG---
480 490 500 510 520
220 230 240 250 260 270
pF1KB7 LGLSKKSSLFSHQKHHVCPECGRGFCQRSDLIKHQRTHTGEKPYLCPECGRRFSQKASLS
:::.:: .::.: ::::::::: :.: :::: :: :. :
CCDS43 -------------------ECGQGFSVKSDVITHQRTHTGEKLYVCRECGRGFSWKSHLL
530 540 550 560
280 290 300 310 320 330
pF1KB7 IHQRKHSGEKPYVCRECGRHFRYTSSLTNHKRIHSGERPFVCQECGRGFRQKIALLLHQR
:::: :.:::::::::::: : . : : .:.: :.::.:.::.:::::: .. .:: :::
CCDS43 IHQRIHTGEKPYVCRECGRGFSWQSVLLTHQRTHTGEKPYVCRECGRGFSRQSVLLTHQR
570 580 590 600 610 620
340 350 360 370 380 390
pF1KB7 THLEEKPFVCPECGRGFCQKASLLQHQSSHTGERPFLCLECGRSFRQQSLLLSHQVTHSG
: :::.:: :::::: ... :: :: ::::.:..: ::::.: ::.::.:: ::.:
CCDS43 RHTGEKPYVCRECGRGFSRQSVLLTHQRRHTGEKPYVCRECGRGFSWQSVLLTHQRTHTG
630 640 650 660 670 680
400 410 420 430 440 450
pF1KB7 EKPYVCAECGHSFRQKVTLIRHQRTHTGEKPYLCPQCGRGFSQKVTLIGHQRTHTGEKPY
:::::: :::..: . .:. :::::::::::.: .::::::.: :. :::::::::::
CCDS43 EKPYVCRECGRGFSWQSVLLTHQRTHTGEKPYVCRECGRGFSNKSHLLRHQRTHTGEKPY
690 700 710 720 730 740
460 470 480 490 500 510
pF1KB7 LCPDCGRGFGQKVTLIRHQRTHTGEKPYLCPKCGRAFGFKSLLTRHQRTHSEEELYVDRV
.: .::::: .: :.::::::::::::.: .:::.: :: : :::::. :. :: :
CCDS43 VCRECGRGFRDKSHLLRHQRTHTGEKPYVCRECGRGFRDKSNLLSHQRTHTGEKPYVCRE
750 760 770 780 790 800
520 530 540 550 560 570
pF1KB7 CGQGLGQKSHLISDQRTHSGEKPCICDECGRGFGFKSALIRHQRTHSGEKPYVCRECGRG
::.:...::::. ::::.:::: .: :::::: :: :.::::::.:::::::::::::
CCDS43 CGRGFSNKSHLLRHQRTHTGEKPYVCRECGRGFRNKSHLLRHQRTHTGEKPYVCRECGRG
810 820 830 840 850 860
580 590 600
pF1KB7 FSQKSHLHRHRRTKSGHQLLPQEVF
::..: : :.::..:..
CCDS43 FSDRSSLCYHQRTHTGEKPYVCREDE
870 880 890
>>CCDS13174.1 ZNF337 gene_id:26152|Hs108|chr20 (751 aa)
initn: 4518 init1: 1538 opt: 1838 Z-score: 1124.2 bits: 218.4 E(32554): 2.7e-56
Smith-Waterman score: 1853; 46.4% identity (69.4% similar) in 605 aa overlap (9-597:7-598)
10 20 30 40 50 60
pF1KB7 MSPGLLTTRKEALMAFRDVAVAFTQKEWKLLSSAQRTLYREVMLENYSHLVSLGIAFSKP
:..:..:: ::.: ::::::.::: :::.::::: :::::::::::: :::
CCDS13 MGPQGARRQAFLAFGDVTVDFTQKEWRLLSPAQRALYREVTLENYSHLVSLGILHSKP
10 20 30 40 50
70 80 90 100 110
pF1KB7 KLIEQLEQGDEPWREENEHLLDLCPA-EPRTEFQPSFPHLVAFSSSQLLRQYALSGHPTQ
.::..::::. :: :: .. : . . ..:. :. ..:: :.. :
CCDS13 ELIRRLEQGEVPWGEERRRRPGPCAGIYAEHVLRPKNLGLAHQRQQQL--QFS-----DQ
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB7 IFPSSSAGGDFQLEAPRCSSEKGESGETEGPDSSLRKRPSRISRTFFSPHQGDPVEW---
: :..: :. : . .. . :. : :.: : . . .. .:.:
CCDS13 SFQSDTAEGQ---EKEKSTKPMAFSSPPLRHAVSSRRRNSVVEIESSQGQRENPTEIDKV
120 130 140 150 160
180 190 200 210 220 230
pF1KB7 ---VEGNREGGTDLRLAQRMSLGGSDTML---KGADTSESGAVIRGNYRLGLSKKSSLFS
.:..: :. .. :.: . . :. : : . .. . : .. :. .:.:.
CCDS13 LKGIENSRWGA--FKCAERGQDFSRKMMVIIHKKAHSRQKLFTCRECHQ-GFRDESALLL
170 180 190 200 210 220
240 250 260 270 280
pF1KB7 HQKHH------VCPECGRGFCQRSDLIKHQRTHTGEKPYLCPECGRRFSQKASLSIHQRK
::. : :: ::::: ...:..:::::.::::.:: ::: ...:. :..:.:
CCDS13 HQNTHTGEKSYVCSVCGRGFSLKANLLRHQRTHSGEKPFLCKVCGRGYTSKSYLTVHERT
230 240 250 260 270 280
290 300 310 320 330 340
pF1KB7 HSGEKPYVCRECGRHFRYTSSLTNHKRIHSGERPFVCQECGRGFRQKIALLLHQRTHLEE
:.::::: :.::::.: :: ..: . ::::.::::.:::::. .: ...:.: : :
CCDS13 HTGEKPYECQECGRRFNDKSSYNKHLKAHSGEKPFVCKECGRGYTNKSYFVVHKRIHSGE
290 300 310 320 330 340
350 360 370 380 390 400
pF1KB7 KPFVCPECGRGFCQKASLLQHQSSHTGERPFLCLECGRSFRQQSLLLSHQVTHSGEKPYV
::. : :::::: .:. :. :: .:.::.:: : .: .:: .. :: :: :::::::.:
CCDS13 KPYRCQECGRGFSNKSHLITHQRTHSGEKPFACRQCKQSFSVKGSLLRHQRTHSGEKPFV
350 360 370 380 390 400
410 420 430 440 450 460
pF1KB7 CAECGHSFRQKVTLIRHQRTHTGEKPYLCPQCGRGFSQKVTLIGHQRTHTGEKPYLCPDC
: .: .:: :: ::. :::::.::::..: .::.:: :: ::. :: ::. :::..: ::
CCDS13 CKDCERSFSQKSTLVYHQRTHSGEKPFVCRECGQGFIQKSTLVKHQITHSEEKPFVCKDC
410 420 430 440 450 460
470 480 490 500 510 520
pF1KB7 GRGFGQKVTLIRHQRTHTGEKPYLCPKCGRAFGFKSLLTRHQRTHSEEELYVDRVCGQGL
:::: :: :. :::::. :::: : .::: : :: ..: :.: :. . : ::.:.
CCDS13 GRGFIQKSTFTLHQRTHSEEKPYGCRECGRRFRDKSSYNKHLRAHLGEKRFFCRDCGRGF
470 480 490 500 510 520
530 540 550 560 570 580
pF1KB7 GQKSHLISDQRTHSGEKPCICDECGRGFGFKSALIRHQRTHSGEKPYVCRECGRGFSQKS
: .: ::::::::: .: .: ..:..:. :.::: :::::.:. :..::::: ::
CCDS13 TLKPNLTIHQRTHSGEKPFMCKQCEKSFSLKANLLRHQWTHSGERPFNCKDCGRGFILKS
530 540 550 560 570 580
590 600
pF1KB7 HLHRHRRTKSGHQLLPQEVF
: :..:.::..
CCDS13 TLLFHQKTHSGEKPFICSECGQGFIWKSNLVKHQLAHSGKQPFVCKECGRGFNWKGNLLT
590 600 610 620 630 640
>--
initn: 622 init1: 344 opt: 574 Z-score: 367.4 bits: 78.4 E(32554): 3.8e-14
Smith-Waterman score: 574; 48.3% identity (72.8% similar) in 151 aa overlap (346-495:599-749)
320 330 340 350 360 370
pF1KB7 ERPFVCQECGRGFRQKIALLLHQRTHLEEKPFVCPECGRGFCQKASLLQHQSSHTGERPF
::.: :::.:: :..:..:: .:.:..::
CCDS13 ERPFNCKDCGRGFILKSTLLFHQKTHSGEKPFICSECGQGFIWKSNLVKHQLAHSGKQPF
570 580 590 600 610 620
380 390 400 410 420 430
pF1KB7 LCLECGRSFRQQSLLLSHQVTHSGEKPYVCAECGHSFRQKVTLIRHQ-RTHTGEKPYLCP
.: ::::.: .. ::.:: :::::::.:: ::..: : .: ::. : :. :::..:
CCDS13 VCKECGRGFNWKGNLLTHQRTHSGEKPFVCNVCGQGFSWKRSLTRHHWRIHSKEKPFVCQ
630 640 650 660 670 680
440 450 460 470 480 490
pF1KB7 QCGRGFSQKVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRTHTGEKPYLCPKCGR
.: ::...: : :.: ::::.:: : .::: :..: .: . : :: . . :.
CCDS13 ECKRGYTSKSDLTVHERIHTGERPYECQECGRKFSNKSYYSKHLKRHLREKRFCTGSVGE
690 700 710 720 730 740
500 510 520 530 540 550
pF1KB7 AFGFKSLLTRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGEKPCICDECGRGFGF
:
CCDS13 ASS
750
>>CCDS31940.1 ZNF84 gene_id:7637|Hs108|chr12 (738 aa)
initn: 8614 init1: 1572 opt: 1797 Z-score: 1099.8 bits: 213.8 E(32554): 6.2e-55
Smith-Waterman score: 1819; 45.8% identity (67.5% similar) in 627 aa overlap (6-602:1-600)
10 20 30 40 50 60
pF1KB7 MSPGLLTTRKEALMAFRDVAVAFTQKEWKLLSSAQRTLYREVMLENYSHLVSLGIAFSKP
.: .:.. .: :..: ::::::.::. .:..::..::::::: ::::: ::
CCDS31 MTMLQESF-SFDDLSVDFTQKEWQLLDPSQKNLYKDVMLENYSSLVSLGYEVMKP
10 20 30 40 50
70 80 90 100 110 120
pF1KB7 KLIEQLEQGDEPWREENEHLLDLCPAEPRTEFQPSFPHLVAFSSSQLLRQYALSGHPTQI
.: .::::.::: ..: :. : ... ...: . :: .
CCDS31 DVIFKLEQGEEPWVGDGE-----IPSSDSPEVWKVDGNMMWHQDNQDKLKIIKRGHECDA
60 70 80 90 100
130 140 150 160 170
pF1KB7 FPSSSAGGDFQLEAPRCSSEKGESGETEGP-DSSLRKRPSRISRTFFSPHQGDPVEWVEG
: : .:.:. .:..: :: :. . :. .. : .:: :
CCDS31 F-----GKNFNLNMNFVPLRKSNS---EGDLDGLILKH----HLDLLIP-KGD-----YG
110 120 130 140 150
180 190 200 210 220
pF1KB7 NREGGTDLRLAQRMSLGG----SDTMLKGADTSE-------SGAVIRGNYRLG-------
. :. :. . . . : . .:: :: : .. : .: :::
CCDS31 KAESD-DFNVFDNFFLHSKPEDTDTWLKYYDCDKYKESYKKSQIIIYHRNRLGEKLYECS
160 170 180 190 200 210
230 240 250 260 270
pF1KB7 -----LSKKSSLFSHQKHHV------CPECGRGFCQRSDLIKHQRTHTGEKPYLCPECGR
.::: ::..::..:. : .::. : :.:..: :.::::::::: : .::.
CCDS31 ECRKRFSKKPSLIKHQSRHIRDIAFGCGNCGKTFPQKSQFITHHRTHTGEKPYNCSQCGK
220 230 240 250 260 270
280 290 300 310 320 330
pF1KB7 RFSQKASLSIHQRKHSGEKPYVCRECGRHFRYTSSLTNHKRIHSGERPFVCQECGRGFRQ
::::..:. ::: :.::::: : :::. : : : .: : :.::.:. :.::::.: .
CCDS31 AFSQKSQLTSHQRTHTGEKPYECGECGKAFSRKSHLISHWRTHTGEKPYGCNECGRAFSE
280 290 300 310 320 330
340 350 360 370 380 390
pF1KB7 KIALLLHQRTHLEEKPFVCPECGRGFCQKASLLQHQSSHTGERPFLCLECGRSFRQQSLL
: :. ::: : :::: : :::..: .:..:. :. .::: .:: : .: ..: ..: :
CCDS31 KSNLINHQRIHTGEKPFECRECGKAFSRKSQLVTHHRTHTGTKPFGCSDCRKAFFEKSEL
340 350 360 370 380 390
400 410 420 430 440 450
pF1KB7 LSHQVTHSGEKPYVCAECGHSFRQKVTLIRHQRTHTGEKPYLCPQCGRGFSQKVTLIGHQ
. ::. :.::::: :.:: ..::.. .:: ::::::::::. : :::..:::: ::.::
CCDS31 IRHQTIHTGEKPYECSECRKAFRERSSLINHQRTHTGEKPHGCIQCGKAFSQKSHLISHQ
400 410 420 430 440 450
460 470 480 490 500 510
pF1KB7 RTHTGEKPYLCPDCGRGFGQKVTLIRHQRTHTGEKPYLCPKCGRAFGFKSLLTRHQRTHS
:::::::..: ::..:..: :.:::::::::::: : .::.::. : :: ::: :.
CCDS31 MTHTGEKPFICSKCGKAFSRKSQLVRHQRTHTGEKPYECSECGKAFSEKLSLTNHQRIHT
460 470 480 490 500 510
520 530 540 550 560 570
pF1KB7 EEELYVDRVCGQGLGQKSHLISDQRTHSGEKPCICDECGRGFGFKSALIRHQRTHSGEKP
:. :: ::... ::::::: ::::.:::: :.:::..:: ::.: :::::.::::
CCDS31 GEKPYVCSECGKAFCQKSHLISHQRTHTGEKPYECSECGKAFGEKSSLATHQRTHTGEKP
520 530 540 550 560 570
580 590 600
pF1KB7 YVCRECGRGFSQKSHLHRHRRTKSGHQLLPQEVF
: ::.: ..:::::.:. :.: ..:.. : :
CCDS31 YECRDCEKAFSQKSQLNTHQRIHTGEK--PYECSLCRKAFFEKSELIRHLRTHTGEKPYE
580 590 600 610 620
CCDS31 CNECRKAFREKSSLINHQRIHTGEKPFECSECGKAFSRKSHLIPHQRTHTGEKPYGCSEC
630 640 650 660 670 680
>--
initn: 2032 init1: 546 opt: 546 Z-score: 350.7 bits: 75.2 E(32554): 3.2e-13
Smith-Waterman score: 589; 55.5% identity (78.1% similar) in 137 aa overlap (349-485:601-737)
320 330 340 350 360 370
pF1KB7 FVCQECGRGFRQKIALLLHQRTHLEEKPFVCPECGRGFCQKASLLQHQSSHTGERPFLCL
: : ..: .:. :..: .::::.:. :
CCDS31 YECRDCEKAFSQKSQLNTHQRIHTGEKPYECSLCRKAFFEKSELIRHLRTHTGEKPYECN
580 590 600 610 620 630
380 390 400 410 420 430
pF1KB7 ECGRSFRQQSLLLSHQVTHSGEKPYVCAECGHSFRQKVTLIRHQRTHTGEKPYLCPQCGR
:: ..::..: :..:: :.::::. :.:::..: .: :: ::::::::::: : .: .
CCDS31 ECRKAFREKSSLINHQRIHTGEKPFECSECGKAFSRKSHLIPHQRTHTGEKPYGCSECRK
640 650 660 670 680 690
440 450 460 470 480 490
pF1KB7 GFSQKVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRTHTGEKPYLCPKCGRAFGF
.:::: :..::: ::::::: : .::..:.:: :: :::::: .:
CCDS31 AFSQKSQLVNHQRIHTGEKPYRCIECGKAFSQKSQLINHQRTHTVKKS
700 710 720 730
500 510 520 530 540 550
pF1KB7 KSLLTRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGEKPCICDECGRGFGFKSAL
>>CCDS74693.1 ZNF343 gene_id:79175|Hs108|chr20 (640 aa)
initn: 1574 init1: 1574 opt: 1698 Z-score: 1041.1 bits: 202.8 E(32554): 1.1e-51
Smith-Waterman score: 1771; 47.7% identity (68.3% similar) in 600 aa overlap (14-592:62-639)
10 20 30 40
pF1KB7 MSPGLLTTRKEALMAFRDVAVAFTQKEWKLLSSAQRTLYREVM
..::::.: ::. ::: :: ::.::.:::
CCDS74 LTQNHKAKGLPSNDTDCPQKKEGKAQIVVPVTFRDVTVIFTEAEWKRLSPEQRNLYKEVM
40 50 60 70 80 90
50 60 70 80 90
pF1KB7 LENYSHLVSL-GIAFSKPKL-----IEQLEQGDEPWREENEHLLDLC---PAEPRTEFQP
:::: .:.:: :... :.: : .. : .. . :::. :.
CCDS74 LENYRNLLSLDGVSLLLPRLECNRAISAHHNLCLPGSSNSPATASRVVGITAEPKPEIYT
100 110 120 130 140 150
100 110 120 130 140
pF1KB7 SFPHLVAFSSSQLLRQYALS---G--HPTQIFPSSSAGGDFQLEAPR-----CSSEKGES
:.::: .:.: :..:. : ... :..:. : .. .. . : :..:.
CCDS74 CSSCLLAFSCQQFLSQHVLQIFLGLCAENHFHPGNSSPGHWKQQGQQYSHVSCWFENAEG
160 170 180 190 200 210
150 160 170 180 190 200
pF1KB7 GETEGPDS--SLRKRPSRISRTFFSPHQGDPVEWVEGNREGGTDLRLAQRMSLGGSDTML
: : .. : : . . ::.: :: : . . .:: :. ::: . : :
CCDS74 QERGGGSKPWSARTEERETSRAFPSPLQRQSASPRKGNMVVETEPSSAQRPNPVQLDKGL
220 230 240 250 260 270
210 220 230 240 250 260
pF1KB7 KGADTSESGAVIRGNYRLGLSKKSSLFSHQKHHVCPECGRGFCQRSDLIKHQRTHTGEKP
: .: . ::. : : .. : .:..: . :: :.::
CCDS74 KELETLRFGAI---NCR----------EYEPDH---------NLESNFITNPRTLLGKKP
280 290 300
270 280 290 300 310 320
pF1KB7 YLCPECGRRFSQKASLSIHQRKHSGEKPYVCRECGRHFRYTSSLTNHKRIHSGERPFVCQ
:.: .::: :.....: :.: :: :::::: :::: : :.:. :.: :: :.:..:.
CCDS74 YICSDCGRSFKDRSTLIRHHRIHSMEKPYVCSECGRGFSQKSNLSRHQRTHSEEKPYLCR
310 320 330 340 350 360
330 340 350 360 370 380
pF1KB7 ECGRGFRQKIALLLHQRTHLEEKPFVCPECGRGFCQKASLLQHQSSHTGERPFLCLECGR
:::..::.: : :: :: ::::.:: :::::: .:.:...:: .:.::.:..::::::
CCDS74 ECGQSFRSKSILNRHQWTHSEEKPYVCSECGRGFSEKSSFIRHQRTHSGEKPYVCLECGR
370 380 390 400 410 420
390 400 410 420 430 440
pF1KB7 SFRQQSLLLSHQVTHSGEKPYVCAECGHSFRQKVTLIRHQRTHTGEKPYLCPQCGRGFSQ
:: ..: : .:: ::::::::: :::..: :. ::.::::: ::::.: .::::: .
CCDS74 SFCDKSTLRKHQRIHSGEKPYVCRECGRGFSQNSDLIKHQRTHLDEKPYVCRECGRGFCD
430 440 450 460 470 480
450 460 470 480 490 500
pF1KB7 KVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRTHTGEKPYLCPKCGRAFGFKSLL
: ::: :.:::.:::::.: .:::::..: :. :::::.::: :.: .: :.:. :: :
CCDS74 KSTLIIHERTHSGEKPYVCGECGRGFSRKSLLLVHQRTHSGEKHYVCRECRRGFSQKSNL
490 500 510 520 530 540
510 520 530 540 550 560
pF1KB7 TRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGEKPCICDECGRGFGFKSALIRHQ
:::::::.:. :. : ::.:. .:: :: .:::::::: .:.::::::. :: :. ::
CCDS74 IRHQRTHSNEKPYICRECGRGFCDKSTLIVHERTHSGEKPYVCSECGRGFSRKSLLLVHQ
550 560 570 580 590 600
570 580 590 600
pF1KB7 RTHSGEKPYVCRECGRGFSQKSHLHRHRRTKSGHQLLPQEVF
::::::: :::::::::::.::.: ::.::
CCDS74 RTHSGEKHYVCRECGRGFSHKSNLIRHQRTH
610 620 630 640
>>CCDS63235.1 ZNF133 gene_id:7692|Hs108|chr20 (591 aa)
initn: 1659 init1: 1659 opt: 1691 Z-score: 1037.3 bits: 202.0 E(32554): 1.9e-51
Smith-Waterman score: 1788; 47.9% identity (68.0% similar) in 568 aa overlap (83-600:9-572)
60 70 80 90 100 110
pF1KB7 LGIAFSKPKLIEQLEQGDEPWREENEHLLDLCPAEPRTEFQPSFPHLVAFSSSQLLRQYA
: ::. ..: : .:::... :..
CCDS63 MCNGRKTVLADPEPELYLDPFCPP--GFSSQKFPMQHV
10 20 30
120 130 140 150
pF1KB7 LSGHPTQIFPSSSAGGDFQLEAP--------------RCSSEKGESGETEGPDSSLRKRP
: .:: :: : :..: : : :...:. : :: . .
CCDS63 LCNHPPWIFTCLCAEGNIQPGDPGPGDQEKQQQASEGRPWSDQAEGPEGEGAMPLFGRTK
40 50 60 70 80 90
160 170 180 190 200 210
pF1KB7 SRISRTFFSPHQGDPVEWVEGNREGGTDLRL--AQRMSLGGSDTMLKGADTSESGAVIRG
.: .: : : .:: .: : :..:. :: . .: .:: .. :.: :
CCDS63 KRTLGAFSRPPQRQPVSSRNGLR--GVELEASPAQSGNPEETDKLLKRIEVLGFGTVNCG
100 110 120 130 140 150
220 230 240 250 260 270
pF1KB7 NYRLGLSKKSSLFSHQKHH------VCPECGRGFCQRSDLIKHQRTHTGEKPYLCPECGR
. :..:: ..:.:::. : :: : .:: ...: .::..:.:::: .: ::::
CCDS63 ECGLSFSKMTNLLSHQRIHSGEKPYVCGVCEKGFSLKKSLARHQKAHSGEKPIVCRECGR
160 170 180 190 200 210
280 290 300 310 320 330
pF1KB7 RFSQKASLSIHQRKHSGEKPYVCRECGRHFRYTSSLTNHKRIHSGERPFVCQECGRGFRQ
:..:..: ::.: :::::::.: :::: : :.: :.: ::::.:.::.:::.:: :
CCDS63 GFNRKSTLIIHERTHSGEKPYMCSECGRGFSQKSNLIIHQRTHSGEKPYVCRECGKGFSQ
220 230 240 250 260 270
340 350 360 370 380 390
pF1KB7 KIALLLHQRTHLEEKPFVCPECGRGFCQKASLLQHQSSHTGERPFLCLECGRSFRQQSLL
: :.. ::::::::: .:: .:: :: ....:..:: .:.::.:. : :::: :::.. :
CCDS63 KSAVVRHQRTHLEEKTIVCSDCGLGFSDRSNLISHQRTHSGEKPYACKECGRCFRQRTTL
280 290 300 310 320 330
400 410 420 430
pF1KB7 LSHQVTHSGEKPYVCAECGHSFRQKVTLIRHQRTHTGEKPYLC-----------------
..:: ::: ::::::. ::::: :. ::: :.:::::::::.:
CCDS63 VNHQRTHSKEKPYVCGVCGHSFSQNSTLISHRRTHTGEKPYVCGVCGRGFSLKSHLNRHQ
340 350 360 370 380 390
440 450 460 470 480
pF1KB7 -------P----QCGRGFSQKVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRTHT
: .:::::::. .:: :::::.::::..: .:::::.:: .:. :::::.
CCDS63 NIHSGEKPIVCKDCGRGFSQQSNLIRHQRTHSGEKPMVCGECGRGFSQKSNLVAHQRTHS
400 410 420 430 440 450
490 500 510 520 530 540
pF1KB7 GEKPYLCPKCGRAFGFKSLLTRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGEKP
::.::.: .:::.:. .. : ::.: ::.:. :. : :: :.:.:: ::. .:.:: :::
CCDS63 GERPYVCRECGRGFSHQAGLIRHKRKHSREKPYMCRQCGLGFGNKSALITHKRAHSEEKP
460 470 480 490 500 510
550 560 570 580 590 600
pF1KB7 CICDECGRGFGFKSALIRHQRTHSGEKPYVCRECGRGFSQKSHLHRHRRTKSGHQLLPQE
:.: :::.:: :: : :: ::.:::::::. :::::: :::: :::.: : :. ::
CCDS63 CVCRECGQGFLQKSHLTLHQMTHTGEKPYVCKTCGRGFSLKSHLSRHRKTTSVHHRLPVQ
520 530 540 550 560 570
pF1KB7 VF
CCDS63 PDPEPCAGQPSDSLYSL
580 590
>>CCDS74704.1 ZNF133 gene_id:7692|Hs108|chr20 (635 aa)
initn: 1659 init1: 1659 opt: 1691 Z-score: 1036.9 bits: 202.0 E(32554): 1.9e-51
Smith-Waterman score: 1786; 48.0% identity (68.3% similar) in 564 aa overlap (87-600:57-616)
60 70 80 90 100 110
pF1KB7 FSKPKLIEQLEQGDEPWREENEHLLDLCPAEPRTEFQPSFPHLVAFSSSQLLRQYALSGH
::. ..: : .:::... :..: .:
CCDS74 IRGSVVLAPRWRSSPAGGWSDPLFFGGADPEPELYLDPFCPP--GFSSQKFPMQHVLCNH
30 40 50 60 70 80
120 130 140 150 160
pF1KB7 PTQIFPSSSAGGDFQLEAP--------------RCSSEKGESGETEGPDSSLRKRPSRIS
: :: : :..: : : :...:. : :: . . .:
CCDS74 PPWIFTCLCAEGNIQPGDPGPGDQEKQQQASEGRPWSDQAEGPEGEGAMPLFGRTKKRTL
90 100 110 120 130 140
170 180 190 200 210 220
pF1KB7 RTFFSPHQGDPVEWVEGNREGGTDLRL--AQRMSLGGSDTMLKGADTSESGAVIRGNYRL
.: : : .:: .: : :..:. :: . .: .:: .. :.: :. :
CCDS74 GAFSRPPQRQPVSSRNGLR--GVELEASPAQSGNPEETDKLLKRIEVLGFGTVNCGECGL
150 160 170 180 190 200
230 240 250 260 270
pF1KB7 GLSKKSSLFSHQKHH------VCPECGRGFCQRSDLIKHQRTHTGEKPYLCPECGRRFSQ
..:: ..:.:::. : :: : .:: ...: .::..:.:::: .: :::: :..
CCDS74 SFSKMTNLLSHQRIHSGEKPYVCGVCEKGFSLKKSLARHQKAHSGEKPIVCRECGRGFNR
210 220 230 240 250 260
280 290 300 310 320 330
pF1KB7 KASLSIHQRKHSGEKPYVCRECGRHFRYTSSLTNHKRIHSGERPFVCQECGRGFRQKIAL
:..: ::.: :::::::.: :::: : :.: :.: ::::.:.::.:::.:: :: :.
CCDS74 KSTLIIHERTHSGEKPYMCSECGRGFSQKSNLIIHQRTHSGEKPYVCRECGKGFSQKSAV
270 280 290 300 310 320
340 350 360 370 380 390
pF1KB7 LLHQRTHLEEKPFVCPECGRGFCQKASLLQHQSSHTGERPFLCLECGRSFRQQSLLLSHQ
. ::::::::: .:: .:: :: ....:..:: .:.::.:. : :::: :::.. :..::
CCDS74 VRHQRTHLEEKTIVCSDCGLGFSDRSNLISHQRTHSGEKPYACKECGRCFRQRTTLVNHQ
330 340 350 360 370 380
400 410 420 430
pF1KB7 VTHSGEKPYVCAECGHSFRQKVTLIRHQRTHTGEKPYLC---------------------
::: ::::::. ::::: :. ::: :.:::::::::.:
CCDS74 RTHSKEKPYVCGVCGHSFSQNSTLISHRRTHTGEKPYVCGVCGRGFSLKSHLNRHQNIHS
390 400 410 420 430 440
440 450 460 470 480
pF1KB7 ---P----QCGRGFSQKVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRTHTGEKP
: .:::::::. .:: :::::.::::..: .:::::.:: .:. :::::.::.:
CCDS74 GEKPIVCKDCGRGFSQQSNLIRHQRTHSGEKPMVCGECGRGFSQKSNLVAHQRTHSGERP
450 460 470 480 490 500
490 500 510 520 530 540
pF1KB7 YLCPKCGRAFGFKSLLTRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGEKPCICD
:.: .:::.:. .. : ::.: ::.:. :. : :: :.:.:: ::. .:.:: ::::.:
CCDS74 YVCRECGRGFSHQAGLIRHKRKHSREKPYMCRQCGLGFGNKSALITHKRAHSEEKPCVCR
510 520 530 540 550 560
550 560 570 580 590 600
pF1KB7 ECGRGFGFKSALIRHQRTHSGEKPYVCRECGRGFSQKSHLHRHRRTKSGHQLLPQEVF
:::.:: :: : :: ::.:::::::. :::::: :::: :::.: : :. ::
CCDS74 ECGQGFLQKSHLTLHQMTHTGEKPYVCKTCGRGFSLKSHLSRHRKTTSVHHRLPVQPDPE
570 580 590 600 610 620
CCDS74 PCAGQPSDSLYSL
630
>>CCDS13134.1 ZNF133 gene_id:7692|Hs108|chr20 (653 aa)
initn: 1659 init1: 1659 opt: 1691 Z-score: 1036.8 bits: 202.0 E(32554): 2e-51
Smith-Waterman score: 2115; 50.9% identity (69.8% similar) in 636 aa overlap (16-600:3-634)
10 20 30 40 50 60
pF1KB7 MSPGLLTTRKEALMAFRDVAVAFTQKEWKLLSSAQRTLYREVMLENYSHLVSLGIAFSKP
:::::: ::: ::.::: :::::::::::::::.::::::.::::
CCDS13 MAFRDVAVDFTQDEWRLLSPAQRTLYREVMLENYSNLVSLGISFSKP
10 20 30 40
70 80 90 100 110
pF1KB7 KLIEQLEQGDEPWREENEHLLDLCP-AEPRTEFQPSFPHLVAFSSSQLLRQYALSGHPTQ
.:: ::::: : ::::.. :: ::. ..: : .:::... :..: .::
CCDS13 ELITQLEQGKETWREEKKCSPATCPDPEPELYLDPFCPP--GFSSQKFPMQHVLCNHPPW
50 60 70 80 90 100
120 130 140 150 160
pF1KB7 IFPSSSAGGDFQLEAP--------------RCSSEKGESGETEGPDSSLRKRPSRISRTF
:: : :..: : : :...:. : :: . . .: .:
CCDS13 IFTCLCAEGNIQPGDPGPGDQEKQQQASEGRPWSDQAEGPEGEGAMPLFGRTKKRTLGAF
110 120 130 140 150 160
170 180 190 200 210 220
pF1KB7 FSPHQGDPVEWVEGNREGGTDLRL--AQRMSLGGSDTMLKGADTSESGAVIRGNYRLGLS
: : .:: .: : :..:. :: . .: .:: .. :.: :. :..:
CCDS13 SRPPQRQPVSSRNGLR--GVELEASPAQSGNPEETDKLLKRIEVLGFGTVNCGECGLSFS
170 180 190 200 210 220
230 240 250 260 270
pF1KB7 KKSSLFSHQKHH------VCPECGRGFCQRSDLIKHQRTHTGEKPYLCPECGRRFSQKAS
: ..:.:::. : :: : .:: ...: .::..:.:::: .: :::: :..:..
CCDS13 KMTNLLSHQRIHSGEKPYVCGVCEKGFSLKKSLARHQKAHSGEKPIVCRECGRGFNRKST
230 240 250 260 270 280
280 290 300 310 320 330
pF1KB7 LSIHQRKHSGEKPYVCRECGRHFRYTSSLTNHKRIHSGERPFVCQECGRGFRQKIALLLH
: ::.: :::::::.: :::: : :.: :.: ::::.:.::.:::.:: :: :.. :
CCDS13 LIIHERTHSGEKPYMCSECGRGFSQKSNLIIHQRTHSGEKPYVCRECGKGFSQKSAVVRH
290 300 310 320 330 340
340 350 360 370 380 390
pF1KB7 QRTHLEEKPFVCPECGRGFCQKASLLQHQSSHTGERPFLCLECGRSFRQQSLLLSHQVTH
:::::::: .:: .:: :: ....:..:: .:.::.:. : :::: :::.. :..:: ::
CCDS13 QRTHLEEKTIVCSDCGLGFSDRSNLISHQRTHSGEKPYACKECGRCFRQRTTLVNHQRTH
350 360 370 380 390 400
400 410 420 430
pF1KB7 SGEKPYVCAECGHSFRQKVTLIRHQRTHTGEKPYLC------------------------
: ::::::. ::::: :. ::: :.:::::::::.:
CCDS13 SKEKPYVCGVCGHSFSQNSTLISHRRTHTGEKPYVCGVCGRGFSLKSHLNRHQNIHSGEK
410 420 430 440 450 460
440 450 460 470 480
pF1KB7 P----QCGRGFSQKVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRTHTGEKPYLC
: .:::::::. .:: :::::.::::..: .:::::.:: .:. :::::.::.::.:
CCDS13 PIVCKDCGRGFSQQSNLIRHQRTHSGEKPMVCGECGRGFSQKSNLVAHQRTHSGERPYVC
470 480 490 500 510 520
490 500 510 520 530 540
pF1KB7 PKCGRAFGFKSLLTRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGEKPCICDECG
.:::.:. .. : ::.: ::.:. :. : :: :.:.:: ::. .:.:: ::::.: :::
CCDS13 RECGRGFSHQAGLIRHKRKHSREKPYMCRQCGLGFGNKSALITHKRAHSEEKPCVCRECG
530 540 550 560 570 580
550 560 570 580 590 600
pF1KB7 RGFGFKSALIRHQRTHSGEKPYVCRECGRGFSQKSHLHRHRRTKSGHQLLPQEVF
.:: :: : :: ::.:::::::. :::::: :::: :::.: : :. ::
CCDS13 QGFLQKSHLTLHQMTHTGEKPYVCKTCGRGFSLKSHLSRHRKTTSVHHRLPVQPDPEPCA
590 600 610 620 630 640
CCDS13 GQPSDSLYSL
650
>>CCDS63234.1 ZNF133 gene_id:7692|Hs108|chr20 (654 aa)
initn: 1659 init1: 1659 opt: 1691 Z-score: 1036.8 bits: 202.0 E(32554): 2e-51
Smith-Waterman score: 2115; 50.9% identity (70.0% similar) in 636 aa overlap (17-600:4-635)
10 20 30 40 50 60
pF1KB7 MSPGLLTTRKEALMAFRDVAVAFTQKEWKLLSSAQRTLYREVMLENYSHLVSLGIAFSKP
::::: ::: ::.::: :::::::::::::::.::::::.::::
CCDS63 MAFRDVAVDFTQDEWRLLSPAQRTLYREVMLENYSNLVSLGISFSKP
10 20 30 40
70 80 90 100 110
pF1KB7 KLIEQLEQGDEPWREENEHLLDLCPAEPRTEF--QPSFPHLVAFSSSQLLRQYALSGHPT
.:: ::::: : ::::.. :::.:. :. .: : .:::... :..: .::
CCDS63 ELITQLEQGKETWREEKKCSPATCPADPEPELYLDPFCPP--GFSSQKFPMQHVLCNHPP
50 60 70 80 90 100
120 130 140 150 160
pF1KB7 QIFPSSSAGGDFQLEAP--------------RCSSEKGESGETEGPDSSLRKRPSRISRT
:: : :..: : : :...:. : :: . . .: .
CCDS63 WIFTCLCAEGNIQPGDPGPGDQEKQQQASEGRPWSDQAEGPEGEGAMPLFGRTKKRTLGA
110 120 130 140 150 160
170 180 190 200 210 220
pF1KB7 FFSPHQGDPVEWVEGNREGGTDLRL--AQRMSLGGSDTMLKGADTSESGAVIRGNYRLGL
: : : .:: .: : :..:. :: . .: .:: .. :.: :. :..
CCDS63 FSRPPQRQPVSSRNGLR--GVELEASPAQSGNPEETDKLLKRIEVLGFGTVNCGECGLSF
170 180 190 200 210 220
230 240 250 260 270
pF1KB7 SKKSSLFSHQKHH------VCPECGRGFCQRSDLIKHQRTHTGEKPYLCPECGRRFSQKA
:: ..:.:::. : :: : .:: ...: .::..:.:::: .: :::: :..:.
CCDS63 SKMTNLLSHQRIHSGEKPYVCGVCEKGFSLKKSLARHQKAHSGEKPIVCRECGRGFNRKS
230 240 250 260 270 280
280 290 300 310 320 330
pF1KB7 SLSIHQRKHSGEKPYVCRECGRHFRYTSSLTNHKRIHSGERPFVCQECGRGFRQKIALLL
.: ::.: :::::::.: :::: : :.: :.: ::::.:.::.:::.:: :: :..
CCDS63 TLIIHERTHSGEKPYMCSECGRGFSQKSNLIIHQRTHSGEKPYVCRECGKGFSQKSAVVR
290 300 310 320 330 340
340 350 360 370 380 390
pF1KB7 HQRTHLEEKPFVCPECGRGFCQKASLLQHQSSHTGERPFLCLECGRSFRQQSLLLSHQVT
::::::::: .:: .:: :: ....:..:: .:.::.:. : :::: :::.. :..:: :
CCDS63 HQRTHLEEKTIVCSDCGLGFSDRSNLISHQRTHSGEKPYACKECGRCFRQRTTLVNHQRT
350 360 370 380 390 400
400 410 420 430
pF1KB7 HSGEKPYVCAECGHSFRQKVTLIRHQRTHTGEKPYLC-----------------------
:: ::::::. ::::: :. ::: :.:::::::::.:
CCDS63 HSKEKPYVCGVCGHSFSQNSTLISHRRTHTGEKPYVCGVCGRGFSLKSHLNRHQNIHSGE
410 420 430 440 450 460
440 450 460 470 480
pF1KB7 -P----QCGRGFSQKVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRTHTGEKPYL
: .:::::::. .:: :::::.::::..: .:::::.:: .:. :::::.::.::.
CCDS63 KPIVCKDCGRGFSQQSNLIRHQRTHSGEKPMVCGECGRGFSQKSNLVAHQRTHSGERPYV
470 480 490 500 510 520
490 500 510 520 530 540
pF1KB7 CPKCGRAFGFKSLLTRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGEKPCICDEC
: .:::.:. .. : ::.: ::.:. :. : :: :.:.:: ::. .:.:: ::::.: ::
CCDS63 CRECGRGFSHQAGLIRHKRKHSREKPYMCRQCGLGFGNKSALITHKRAHSEEKPCVCREC
530 540 550 560 570 580
550 560 570 580 590 600
pF1KB7 GRGFGFKSALIRHQRTHSGEKPYVCRECGRGFSQKSHLHRHRRTKSGHQLLPQEVF
:.:: :: : :: ::.:::::::. :::::: :::: :::.: : :. ::
CCDS63 GQGFLQKSHLTLHQMTHTGEKPYVCKTCGRGFSLKSHLSRHRKTTSVHHRLPVQPDPEPC
590 600 610 620 630 640
CCDS63 AGQPSDSLYSL
650
604 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 09:51:29 2016 done: Sat Nov 5 09:51:30 2016
Total Scan time: 3.680 Total Display time: 0.200
Function used was FASTA [36.3.4 Apr, 2011]