FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9664, 458 aa
1>>>pF1KB9664 458 - 458 aa - 458 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.9962+/-0.0014; mu= 11.0474+/- 0.083
mean_var=227.7233+/-45.826, 0's: 0 Z-trim(106.0): 944 B-trim: 5 in 1/51
Lambda= 0.084991
statistics sampled from 7700 (8718) to 7700 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.6), E-opt: 0.2 (0.268), width: 16
Scan time: 2.710
The best scores are: opt bits E(32554)
CCDS41502.1 ZNF239 gene_id:8187|Hs108|chr10 ( 458) 3237 410.7 1.6e-114
CCDS31418.1 ZNF214 gene_id:7761|Hs108|chr11 ( 606) 1382 183.4 5.5e-46
CCDS74388.1 ZNF227 gene_id:7770|Hs108|chr19 ( 748) 1335 177.8 3.4e-44
CCDS12636.1 ZNF227 gene_id:7770|Hs108|chr19 ( 799) 1335 177.8 3.5e-44
CCDS62706.1 ZNF229 gene_id:7772|Hs108|chr19 ( 819) 1330 177.2 5.5e-44
CCDS42574.1 ZNF229 gene_id:7772|Hs108|chr19 ( 825) 1330 177.2 5.5e-44
CCDS12632.1 ZNF45 gene_id:7596|Hs108|chr19 ( 682) 1312 174.9 2.3e-43
CCDS46102.1 ZNF226 gene_id:7769|Hs108|chr19 ( 803) 1301 173.7 6.4e-43
CCDS33048.1 ZNF235 gene_id:9310|Hs108|chr19 ( 738) 1300 173.5 6.6e-43
CCDS54939.1 ZNF300 gene_id:91975|Hs108|chr5 ( 568) 1295 172.7 8.6e-43
CCDS12637.1 ZNF112 gene_id:7771|Hs108|chr19 ( 907) 1298 173.4 8.8e-43
CCDS54276.1 ZNF112 gene_id:7771|Hs108|chr19 ( 913) 1298 173.4 8.9e-43
CCDS4311.2 ZNF300 gene_id:91975|Hs108|chr5 ( 604) 1295 172.8 8.9e-43
CCDS54940.1 ZNF300 gene_id:91975|Hs108|chr5 ( 620) 1295 172.8 9.1e-43
CCDS62707.1 ZNF180 gene_id:7733|Hs108|chr19 ( 665) 1289 172.1 1.6e-42
CCDS62708.1 ZNF180 gene_id:7733|Hs108|chr19 ( 667) 1289 172.1 1.6e-42
CCDS12639.1 ZNF180 gene_id:7733|Hs108|chr19 ( 692) 1289 172.1 1.6e-42
CCDS4440.1 ZFP2 gene_id:80108|Hs108|chr5 ( 461) 1269 169.4 6.9e-42
CCDS233.1 ZNF436 gene_id:80818|Hs108|chr1 ( 470) 1267 169.2 8.3e-42
CCDS46101.1 ZNF234 gene_id:10780|Hs108|chr19 ( 700) 1266 169.3 1.1e-41
CCDS35075.1 ZNF782 gene_id:158431|Hs108|chr9 ( 699) 1262 168.8 1.6e-41
CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 1260 168.5 1.8e-41
CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 1260 168.5 1.8e-41
CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 1260 168.5 1.9e-41
CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 1260 168.5 1.9e-41
CCDS47352.1 ZNF879 gene_id:345462|Hs108|chr5 ( 563) 1254 167.7 2.8e-41
CCDS10329.2 ZSCAN2 gene_id:54993|Hs108|chr15 ( 614) 1253 167.6 3.2e-41
CCDS75971.1 ZNF630 gene_id:57232|Hs108|chrX ( 533) 1250 167.2 3.8e-41
CCDS2715.1 ZKSCAN7 gene_id:55888|Hs108|chr3 ( 754) 1251 167.5 4.3e-41
CCDS35237.2 ZNF630 gene_id:57232|Hs108|chrX ( 657) 1250 167.3 4.3e-41
CCDS12498.1 ZNF420 gene_id:147923|Hs108|chr19 ( 688) 1250 167.3 4.4e-41
CCDS82413.1 ZNF544 gene_id:27300|Hs108|chr19 ( 687) 1247 166.9 5.7e-41
CCDS12973.1 ZNF544 gene_id:27300|Hs108|chr19 ( 715) 1247 167.0 5.8e-41
CCDS75904.1 ZNF79 gene_id:7633|Hs108|chr9 ( 364) 1238 165.5 8.4e-41
CCDS69664.1 ZNF79 gene_id:7633|Hs108|chr9 ( 474) 1238 165.6 9.8e-41
CCDS74322.1 ZNF91 gene_id:7644|Hs108|chr19 (1159) 1244 166.9 1e-40
CCDS6871.1 ZNF79 gene_id:7633|Hs108|chr9 ( 498) 1238 165.6 1e-40
CCDS42541.1 ZNF91 gene_id:7644|Hs108|chr19 (1191) 1244 166.9 1e-40
CCDS6437.1 ZNF16 gene_id:7564|Hs108|chr8 ( 682) 1240 166.1 1e-40
CCDS11180.1 ZNF624 gene_id:57547|Hs108|chr17 ( 865) 1238 166.0 1.4e-40
CCDS56092.1 ZNF568 gene_id:374900|Hs108|chr19 ( 580) 1232 165.0 1.8e-40
CCDS42558.1 ZNF568 gene_id:374900|Hs108|chr19 ( 644) 1232 165.1 2e-40
CCDS32977.1 ZNF85 gene_id:7639|Hs108|chr19 ( 595) 1231 164.9 2e-40
CCDS82341.1 ZNF569 gene_id:148266|Hs108|chr19 ( 527) 1230 164.7 2.1e-40
CCDS12503.1 ZNF569 gene_id:148266|Hs108|chr19 ( 686) 1230 164.9 2.4e-40
CCDS2718.2 ZNF35 gene_id:7584|Hs108|chr3 ( 527) 1226 164.2 2.9e-40
CCDS12501.1 ZNF383 gene_id:163087|Hs108|chr19 ( 475) 1225 164.0 3e-40
CCDS11067.1 ZFP3 gene_id:124961|Hs108|chr17 ( 502) 1224 163.9 3.3e-40
CCDS33090.1 ZNF616 gene_id:90317|Hs108|chr19 ( 781) 1226 164.4 3.7e-40
CCDS32981.1 ZNF675 gene_id:171392|Hs108|chr19 ( 568) 1223 163.9 3.9e-40
>>CCDS41502.1 ZNF239 gene_id:8187|Hs108|chr10 (458 aa)
initn: 3237 init1: 3237 opt: 3237 Z-score: 2169.6 bits: 410.7 E(32554): 1.6e-114
Smith-Waterman score: 3237; 99.6% identity (99.8% similar) in 458 aa overlap (1-458:1-458)
10 20 30 40 50 60
pF1KB9 MASTITGSQDCIVNHRGEVDGEPELDISPCQQWGEASSPISRNRDSVMTLQSGCFENIES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 MASTITGSQDCIVNHRGEVDGEPELDISPCQQWGEASSPISRNRDSVMTLQSGCFENIES
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 ETYLPLKVSSQIDTQDSSVKFCKNEPQDHQESRRLFVMEESTERKVIKGESCSENLQVKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 ETYLPLKVSSQIDTQDSSVKFCKNEPQDHQESRRLFVMEESTERKVIKGESCSENLQVKL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 VSDGQELASPLLNGEATCQNGQLKESLDPIDCNCKDIHGWKSQVVSCSQQRGHTEEKPCD
:::::::::::::::::::::::::::::::::::::::::::::::::::.::::::::
CCDS41 VSDGQELASPLLNGEATCQNGQLKESLDPIDCNCKDIHGWKSQVVSCSQQRAHTEEKPCD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 HNNCGKILNTSPDGHPYEKIHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQC
:::::::::::::::::::::::::::: :::::::::::::::::::::::::::::::
CCDS41 HNNCGKILNTSPDGHPYEKIHTAEKQYECSQCGKNFSQSSELLLHQRDHTEEKPYKCEQC
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 GKGFTRSSSLLIHQAVHTDEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 GKGFTRSSSLLIHQAVHTDEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGF
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 SQSSKLHIHQRVHTGEKPYECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 SQSSKLHIHQRVHTGEKPYECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 NLHIHRCIHTGEKPYQCYECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 NLHIHRCIHTGEKPYQCYECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLI
370 380 390 400 410 420
430 440 450
pF1KB9 HQRVHTGEKPYECSKCGKGFSQSSNLHIHQRVHKKDPR
::::::::::::::::::::::::::::::::::::::
CCDS41 HQRVHTGEKPYECSKCGKGFSQSSNLHIHQRVHKKDPR
430 440 450
>>CCDS31418.1 ZNF214 gene_id:7761|Hs108|chr11 (606 aa)
initn: 3477 init1: 1295 opt: 1382 Z-score: 939.1 bits: 183.4 E(32554): 5.5e-46
Smith-Waterman score: 1405; 48.7% identity (68.3% similar) in 458 aa overlap (26-453:99-548)
10 20 30 40 50
pF1KB9 MASTITGSQDCIVNHRGEVDGEPELDISPCQQWGEASSPISRNRDSVMTLQSGCF
: : ::.: :. . . .:..: .
CCDS31 GWWNAGAQMYENQNYGETVQGTDSKDLTQQDRSQCQEWLILSTQVPGYGNYELTFESKSL
70 80 90 100 110 120
60 70 80 90 100 110
pF1KB9 ENIESETYLPLKVSSQIDTQDSSVKFCKNEPQDHQESR-RLFVMEESTERKVIKGESCSE
.:.. ....: . ::: . .. . . : .: :: . :: .. :. .
CCDS31 RNLKYKNFMPWQSLETKTTQDYGREIYMSGSHGFQGGRYRLGI-----SRKNLSMEK-EQ
130 140 150 160 170 180
120 130 140 150 160
pF1KB9 NLQVKLVSDGQELASPLLNGEATCQNGQLKESLDPIDCNC---KDIHGWKSQVV------
.: :. : : : : . ::. :..:.. :.: : :. :.:. :
CCDS31 KLIVQHSYIPVEEALPQYVG-VICQEDLLRDSMEEKYCGCNKCKGIYYWNSRCVFHKRNQ
190 200 210 220 230 240
170 180 190 200
pF1KB9 ------------SCSQQRGHTEEKPCDH-----NNCGKI---LNTSPDGHPYEKIHTAEK
.: .::. ..: .: .: .. .. : : ....: .:
CCDS31 PGENLCQCSICKACFSQRSDLYRHPRNHIGKKLYGCDEVDGNFHQSSGVHFHQRVHIGEV
250 260 270 280 290 300
210 220 230 240 250 260
pF1KB9 QYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGKGFTRSSSLLIHQAVHTDEKPYKC
: . :::.::: : : ::: ::::: :: : : : ..:.: : ::: .: :::.::
CCDS31 PYSCNACGKSFSQISSLHNHQRVHTEEKFYKIE-CDKDLSRNSLLHIHQRLHIGEKPFKC
310 320 330 340 350 360
270 280 290 300 310 320
pF1KB9 DKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQSSKLHIHQRVHTGEKPYECEECG
..:::.:.::: : .:. :::::::::::.:::::::::.:.::: :::::: :.::.::
CCDS31 NQCGKSFNRSSVLHVHQRVHTGEKPYKCDECGKGFSQSSNLRIHQLVHTGEKSYKCEDCG
370 380 390 400 410 420
330 340 350 360 370 380
pF1KB9 MSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNLHIHRCIHTGEKPYQCYECGKGFS
.:.:::::.:::::::::.:::: .::: ::.::.:.::. .::::::: : :::::::
CCDS31 KGFTQRSNLQIHQRVHTGEKPYKCDDCGKDFSHSSDLRIHQRVHTGEKPYTCPECGKGFS
430 440 450 460 470 480
390 400 410 420 430 440
pF1KB9 QSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQRVHTGEKPYECSKCGKGFSQSSN
.:: :. : :::::::::.: .::::::: :.::::::::::::::.: ::::::.:::
CCDS31 KSSKLHTHQRVHTGEKPYKCEECGKGFSQRSHLLIHQRVHTGEKPYKCHDCGKGFSHSSN
490 500 510 520 530 540
450
pF1KB9 LHIHQRVHKKDPR
::::::::
CCDS31 LHIHQRVHTGEKPYQCAKCGKGFSHSSALRIHQRVHAGEKPYKCREYYKGFDHNSHLHNN
550 560 570 580 590 600
>>CCDS74388.1 ZNF227 gene_id:7770|Hs108|chr19 (748 aa)
initn: 2601 init1: 1334 opt: 1335 Z-score: 906.9 bits: 177.8 E(32554): 3.4e-44
Smith-Waterman score: 1341; 48.1% identity (70.6% similar) in 428 aa overlap (34-453:107-519)
10 20 30 40 50 60
pF1KB9 TITGSQDCIVNHRGEVDGEPELDISPCQQWGEASSPISRNRDSVMTLQSGCFENIESETY
:..: : .. : .: ..::
CCDS74 TRCLQGKSSQLLQGDSIQVSENENNIMNPKGDSSIYIENQEFPFWRTQHSC-----GNTY
80 90 100 110 120 130
70 80 90 100 110
pF1KB9 LPLKVSSQIDTQDSSVKFCKNEPQDHQESRRLFVMEESTERKVIKGES----CSENLQVK
: :::... ... ::. : :.. :..: .. :: .. :. : :
CCDS74 LS---ESQIQSRGKQIDV-KNNLQIHED-----FMKKSPFHEHIKTDTEPKPCKGNEYGK
140 150 160 170 180
120 130 140 150 160 170
pF1KB9 LVSDGQELASPLLNGEATCQNGQLKESLDPIDCNCKDIHGWKSQVVSCSQQRGHTEEKPC
..:::.. :: . : . : .: ..: .. . :. : : . .:
CCDS74 IISDGSNQKLPLGEKPHPCGECGRGFSYSPRLPLHPNVHTGEKCFSQSSHLRTHQRIHPG
190 200 210 220 230 240
180 190 200 210 220 230
pF1KB9 DH-NNC---GKILNTSPDGHPYEKIHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPY
.. : : : .: : . : :.. ::.::.:. ..:::.::.:. :..: : :: ::::
CCDS74 EKLNRCHESGDCFNKS-SFHSYQSNHTGEKSYRCDSCGKGFSSSTGLIIHYRTHTGEKPY
250 260 270 280 290 300
240 250 260 270 280 290
pF1KB9 KCEQCGKGFTRSSSLLIHQAVHTDEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDK
:::.::: :..::.. :: :::.::::::..::::: : .: .:. :: :::::::..
CCDS74 KCEECGKCFSQSSNFQCHQRVHTEEKPYKCEECGKGFGWSVNLRVHQRVHRGEKPYKCEE
310 320 330 340 350 360
300 310 320 330 340 350
pF1KB9 CGKGFSQSSKLHIHQRVHTGEKPYECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKG
:::::.:....:::::::::::::.:. :: .::. : : :.::::::.:::: ::::
CCDS74 CGKGFTQAAHFHIHQRVHTGEKPYKCDVCGKGFSHNSPLICHRRVHTGEKPYKCEACGKG
370 380 390 400 410 420
360 370 380 390 400 410
pF1KB9 FSQSSNLHIHRCIHTGEKPYQCYECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQS
:.....:::: .:::::::.: ::::::::.:.:..: :::::: ..: ::::::::
CCDS74 FTRNTDLHIHFRVHTGEKPYKCKECGKGFSQASNLQVHQNVHTGEKRFKCETCGKGFSQS
430 440 450 460 470 480
420 430 440 450
pF1KB9 SKLLIHQRVHTGEKPYECSKCGKGFSQSSNLHIHQRVHKKDPR
::: :::::::::::.:. ::: :: ::::..:: .:
CCDS74 SKLQTHQRVHTGEKPYRCDVCGKDFSYSSNLKLHQVIHTGEKPYKCEECGKGFSWRSNLH
490 500 510 520 530 540
CCDS74 AHQRVHSGEKPYKCEQCDKSFSQAIDFRVHQRVHTGEKPYKCGVCGKGFSQSSGLQSHQR
550 560 570 580 590 600
>--
initn: 2719 init1: 1041 opt: 1041 Z-score: 712.1 bits: 141.7 E(32554): 2.4e-33
Smith-Waterman score: 1041; 62.5% identity (79.9% similar) in 224 aa overlap (230-453:520-743)
200 210 220 230 240 250
pF1KB9 IHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGKGFTRSSSLLIHQAVHTD
: :::::::.:::::. :.: :: ::.
CCDS74 VHTGEKPYRCDVCGKDFSYSSNLKLHQVIHTGEKPYKCEECGKGFSWRSNLHAHQRVHSG
490 500 510 520 530 540
260 270 280 290 300 310
pF1KB9 EKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQSSKLHIHQRVHTGEKPY
::::::..: :.:... .. .:. :::::::::: ::::::::: :. :::::::::::
CCDS74 EKPYKCEQCDKSFSQAIDFRVHQRVHTGEKPYKCGVCGKGFSQSSGLQSHQRVHTGEKPY
550 560 570 580 590 600
320 330 340 350 360 370
pF1KB9 ECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNLHIHRCIHTGEKPYQCYE
.:. :: .: :.. ::: ::::.:::: ::::::..: ::. :. .::::::. : :
CCDS74 KCDVCGKGFRYSSQFIYHQRGHTGEKPYKCEECGKGFGRSLNLRHHQRVHTGEKPHICEE
610 620 630 640 650 660
380 390 400 410 420 430
pF1KB9 CGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQRVHTGEKPYECSKCGKG
:::.:: :.::.:: ::: :: ..: .::::::::..: :::::::::::.:. : :
CCDS74 CGKAFSLPSNLRVHLGVHTREKLFKCEECGKGFSQSARLEAHQRVHTGEKPYKCDICDKD
670 680 690 700 710 720
440 450
pF1KB9 FSQSSNLHIHQRVHKKDPR
: . : : ::.::
CCDS74 FRHRSRLTYHQKVHTGKKL
730 740
>>CCDS12636.1 ZNF227 gene_id:7770|Hs108|chr19 (799 aa)
initn: 2601 init1: 1334 opt: 1335 Z-score: 906.6 bits: 177.8 E(32554): 3.5e-44
Smith-Waterman score: 1341; 48.1% identity (70.6% similar) in 428 aa overlap (34-453:158-570)
10 20 30 40 50 60
pF1KB9 TITGSQDCIVNHRGEVDGEPELDISPCQQWGEASSPISRNRDSVMTLQSGCFENIESETY
:..: : .. : .: ..::
CCDS12 TRCLQGKSSQLLQGDSIQVSENENNIMNPKGDSSIYIENQEFPFWRTQHSC-----GNTY
130 140 150 160 170 180
70 80 90 100 110
pF1KB9 LPLKVSSQIDTQDSSVKFCKNEPQDHQESRRLFVMEESTERKVIKGES----CSENLQVK
: :::... ... ::. : :.. :..: .. :: .. :. : :
CCDS12 LS---ESQIQSRGKQIDV-KNNLQIHED-----FMKKSPFHEHIKTDTEPKPCKGNEYGK
190 200 210 220 230
120 130 140 150 160 170
pF1KB9 LVSDGQELASPLLNGEATCQNGQLKESLDPIDCNCKDIHGWKSQVVSCSQQRGHTEEKPC
..:::.. :: . : . : .: ..: .. . :. : : . .:
CCDS12 IISDGSNQKLPLGEKPHPCGECGRGFSYSPRLPLHPNVHTGEKCFSQSSHLRTHQRIHPG
240 250 260 270 280 290
180 190 200 210 220 230
pF1KB9 DH-NNC---GKILNTSPDGHPYEKIHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPY
.. : : : .: : . : :.. ::.::.:. ..:::.::.:. :..: : :: ::::
CCDS12 EKLNRCHESGDCFNKS-SFHSYQSNHTGEKSYRCDSCGKGFSSSTGLIIHYRTHTGEKPY
300 310 320 330 340 350
240 250 260 270 280 290
pF1KB9 KCEQCGKGFTRSSSLLIHQAVHTDEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDK
:::.::: :..::.. :: :::.::::::..::::: : .: .:. :: :::::::..
CCDS12 KCEECGKCFSQSSNFQCHQRVHTEEKPYKCEECGKGFGWSVNLRVHQRVHRGEKPYKCEE
360 370 380 390 400 410
300 310 320 330 340 350
pF1KB9 CGKGFSQSSKLHIHQRVHTGEKPYECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKG
:::::.:....:::::::::::::.:. :: .::. : : :.::::::.:::: ::::
CCDS12 CGKGFTQAAHFHIHQRVHTGEKPYKCDVCGKGFSHNSPLICHRRVHTGEKPYKCEACGKG
420 430 440 450 460 470
360 370 380 390 400 410
pF1KB9 FSQSSNLHIHRCIHTGEKPYQCYECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQS
:.....:::: .:::::::.: ::::::::.:.:..: :::::: ..: ::::::::
CCDS12 FTRNTDLHIHFRVHTGEKPYKCKECGKGFSQASNLQVHQNVHTGEKRFKCETCGKGFSQS
480 490 500 510 520 530
420 430 440 450
pF1KB9 SKLLIHQRVHTGEKPYECSKCGKGFSQSSNLHIHQRVHKKDPR
::: :::::::::::.:. ::: :: ::::..:: .:
CCDS12 SKLQTHQRVHTGEKPYRCDVCGKDFSYSSNLKLHQVIHTGEKPYKCEECGKGFSWRSNLH
540 550 560 570 580 590
CCDS12 AHQRVHSGEKPYKCEQCDKSFSQAIDFRVHQRVHTGEKPYKCGVCGKGFSQSSGLQSHQR
600 610 620 630 640 650
>--
initn: 2719 init1: 1041 opt: 1041 Z-score: 711.8 bits: 141.8 E(32554): 2.5e-33
Smith-Waterman score: 1041; 62.5% identity (79.9% similar) in 224 aa overlap (230-453:571-794)
200 210 220 230 240 250
pF1KB9 IHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGKGFTRSSSLLIHQAVHTD
: :::::::.:::::. :.: :: ::.
CCDS12 VHTGEKPYRCDVCGKDFSYSSNLKLHQVIHTGEKPYKCEECGKGFSWRSNLHAHQRVHSG
550 560 570 580 590 600
260 270 280 290 300 310
pF1KB9 EKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQSSKLHIHQRVHTGEKPY
::::::..: :.:... .. .:. :::::::::: ::::::::: :. :::::::::::
CCDS12 EKPYKCEQCDKSFSQAIDFRVHQRVHTGEKPYKCGVCGKGFSQSSGLQSHQRVHTGEKPY
610 620 630 640 650 660
320 330 340 350 360 370
pF1KB9 ECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNLHIHRCIHTGEKPYQCYE
.:. :: .: :.. ::: ::::.:::: ::::::..: ::. :. .::::::. : :
CCDS12 KCDVCGKGFRYSSQFIYHQRGHTGEKPYKCEECGKGFGRSLNLRHHQRVHTGEKPHICEE
670 680 690 700 710 720
380 390 400 410 420 430
pF1KB9 CGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQRVHTGEKPYECSKCGKG
:::.:: :.::.:: ::: :: ..: .::::::::..: :::::::::::.:. : :
CCDS12 CGKAFSLPSNLRVHLGVHTREKLFKCEECGKGFSQSARLEAHQRVHTGEKPYKCDICDKD
730 740 750 760 770 780
440 450
pF1KB9 FSQSSNLHIHQRVHKKDPR
: . : : ::.::
CCDS12 FRHRSRLTYHQKVHTGKKL
790
>>CCDS62706.1 ZNF229 gene_id:7772|Hs108|chr19 (819 aa)
initn: 2214 init1: 1294 opt: 1330 Z-score: 903.2 bits: 177.2 E(32554): 5.5e-44
Smith-Waterman score: 1330; 54.8% identity (74.4% similar) in 356 aa overlap (108-453:462-812)
80 90 100 110 120 130
pF1KB9 SVKFCKNEPQDHQESRRLFVMEESTERKVIKGESCSENLQV-KLVSDGQELASPLLNGEA
:: ::: .:. . . :.. . :..
CCDS62 CGKGFCAKSALHKHQHIHPGEKPYSCGECGKGFSCSSHLSSHQKTHTGERPYQCDKCGKG
440 450 460 470 480 490
140 150 160 170 180
pF1KB9 TCQNGQLKE------SLDPIDCN-CKDIHGWKSQVVSCSQQRGHTEEKP--CDHNNCGKI
.:. :. . :: : ...: .. .:: :: ::: :. :::
CCDS62 FSHNSYLQAHQRVHMGQHLYKCNVCGKSFSYSSGLLM--HQRLHTGEKPYKCE---CGKS
500 510 520 530 540
190 200 210 220 230 240
pF1KB9 LNTSPDGHPYEKIHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGKGFTRS
.. : : : ....::.:: :. :.:::.: ..:.: ::: :: :.:: :. ::::: :
CCDS62 FGRSSDLHIHQRVHTGEKPYKCSECGKGFRRNSDLHSHQRVHTGERPYVCDVCGKGFIYS
550 560 570 580 590 600
250 260 270 280 290 300
pF1KB9 SSLLIHQAVHTDEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQSSKLH
:.::::: ::: :::::: .:::::. ::.::::. ::::::::.:..::::: .:.::
CCDS62 SDLLIHQRVHTGEKPYKCAECGKGFSYSSGLLIHQRVHTGEKPYRCQECGKGFRCTSSLH
610 620 630 640 650 660
310 320 330 340 350 360
pF1KB9 IHQRVHTGEKPYECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNLHIHRC
:::::::.::: :..:: .:: :::. :::.::::.:: : :::::: .:.: :.
CCDS62 KHQRVHTGKKPYTCDQCGKGFSYGSNLRTHQRLHTGEKPYTCCECGKGFRYGSGLLSHKR
670 680 690 700 710 720
370 380 390 400 410 420
pF1KB9 IHTGEKPYQCYECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQRVHTG
.:::::::.:. ::::.:::: :. : :::::::::.: .:::::...: : .:::::::
CCDS62 VHTGEKPYRCHVCGKGYSQSSHLQGHQRVHTGEKPYKCEECGKGFGRNSCLHVHQRVHTG
730 740 750 760 770 780
430 440 450
pF1KB9 EKPYECSKCGKGFSQSSNLHIHQRVHKKDPR
:::: :. :::::: .:.:. :::::
CCDS62 EKPYTCGVCGKGFSYTSGLRNHQRVHLGENPYK
790 800 810
>--
initn: 1199 init1: 711 opt: 730 Z-score: 505.6 bits: 103.7 E(32554): 7.7e-22
Smith-Waterman score: 803; 37.1% identity (64.3% similar) in 361 aa overlap (1-353:106-461)
10 20 30
pF1KB9 MASTITGSQDCIVNHRGEVDGEPELDISPC
.:. . ::::: :: .:. : . : .:
CCDS62 KNGKDTEYIQDEELRFFSHKELSSCKIWEEVAGELPGSQDCRVNLQGK-DFQFSEDAAPH
80 90 100 110 120 130
40 50 60 70 80 90
pF1KB9 QQWGEASSPISRNRDSVMTLQSGCFENIESETYLPLKVSSQIDTQDSSVKFCKNEPQDHQ
: : ::.: .. . .::. . ..:.. . .. : : : .: :. : :
CCDS62 QGWEGASTPCFPIENFLDSLQGDGLIGLENQQFPAWRAIRPIPIQGSWAKAFVNQLGDVQ
140 150 160 170 180 190
100 110 120 130 140
pF1KB9 ESRRLFVMEESTERKVIKGES-CSENLQVKLVSDGQELASPLLNGEATCQNGQLKES---
: . . :... . .: : . .: :. .: : :.. .:.:
CCDS62 ERCKNLDTEDTVYKCNWDDDSFCWISCHVD--HRFPEIDKP--CGCNKCRKDCIKNSVLH
200 210 220 230 240 250
150 160 170 180 190 200
pF1KB9 -LDPIDCNCKDI---HGWKSQVVSCSQQRGHTEEKPCDHNNCGKILNTSPDGHPYEKIHT
..: . . :. .:..... . : .:: :.... .. : : . .... :
CCDS62 RINPGENGLKSNEYRNGFRDDADLPPHPRVPLKEKLCQYDEFSEGLRHSAHLNRHQRVPT
260 270 280 290 300 310
210 220 230 240 250 260
pF1KB9 AEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGKGFTRSSSLLIHQAVHTDEKP
.::. .. . :.. :.... : : . . ::.:. ::::: .: :::::.::: ..:
CCDS62 GEKSVKSLERGRGVRQNTHIRNHPRAPVGDMPYRCDVCGKGFRYKSVLLIHQGVHTGRRP
320 330 340 350 360 370
270 280 290 300 310 320
pF1KB9 YKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQSSKLHIHQRVHTGEKPYECE
:::..:::.: :::.::.:. ::::::::::..:::::: :: :..:::.::::::: :
CCDS62 YKCEECGKAFGRSSNLLVHQRVHTGEKPYKCSECGKGFSYSSVLQVHQRLHTGEKPYTCS
380 390 400 410 420 430
330 340 350 360 370 380
pF1KB9 ECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNLHIHRCIHTGEKPYQCYECGK
::: .: .: :: ::..: ::.::.:::::
CCDS62 ECGKGFCAKSALHKHQHIHPGEKPYSCGECGKGFSCSSHLSSHQKTHTGERPYQCDKCGK
440 450 460 470 480 490
390 400 410 420 430 440
pF1KB9 GFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQRVHTGEKPYECSKCGKGFSQ
CCDS62 GFSHNSYLQAHQRVHMGQHLYKCNVCGKSFSYSSGLLMHQRLHTGEKPYKCECGKSFGRS
500 510 520 530 540 550
>>CCDS42574.1 ZNF229 gene_id:7772|Hs108|chr19 (825 aa)
initn: 2214 init1: 1294 opt: 1330 Z-score: 903.2 bits: 177.2 E(32554): 5.5e-44
Smith-Waterman score: 1330; 54.8% identity (74.4% similar) in 356 aa overlap (108-453:468-818)
80 90 100 110 120 130
pF1KB9 SVKFCKNEPQDHQESRRLFVMEESTERKVIKGESCSENLQV-KLVSDGQELASPLLNGEA
:: ::: .:. . . :.. . :..
CCDS42 CGKGFCAKSALHKHQHIHPGEKPYSCGECGKGFSCSSHLSSHQKTHTGERPYQCDKCGKG
440 450 460 470 480 490
140 150 160 170 180
pF1KB9 TCQNGQLKE------SLDPIDCN-CKDIHGWKSQVVSCSQQRGHTEEKP--CDHNNCGKI
.:. :. . :: : ...: .. .:: :: ::: :. :::
CCDS42 FSHNSYLQAHQRVHMGQHLYKCNVCGKSFSYSSGLLM--HQRLHTGEKPYKCE---CGKS
500 510 520 530 540 550
190 200 210 220 230 240
pF1KB9 LNTSPDGHPYEKIHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGKGFTRS
.. : : : ....::.:: :. :.:::.: ..:.: ::: :: :.:: :. ::::: :
CCDS42 FGRSSDLHIHQRVHTGEKPYKCSECGKGFRRNSDLHSHQRVHTGERPYVCDVCGKGFIYS
560 570 580 590 600 610
250 260 270 280 290 300
pF1KB9 SSLLIHQAVHTDEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQSSKLH
:.::::: ::: :::::: .:::::. ::.::::. ::::::::.:..::::: .:.::
CCDS42 SDLLIHQRVHTGEKPYKCAECGKGFSYSSGLLIHQRVHTGEKPYRCQECGKGFRCTSSLH
620 630 640 650 660 670
310 320 330 340 350 360
pF1KB9 IHQRVHTGEKPYECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNLHIHRC
:::::::.::: :..:: .:: :::. :::.::::.:: : :::::: .:.: :.
CCDS42 KHQRVHTGKKPYTCDQCGKGFSYGSNLRTHQRLHTGEKPYTCCECGKGFRYGSGLLSHKR
680 690 700 710 720 730
370 380 390 400 410 420
pF1KB9 IHTGEKPYQCYECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQRVHTG
.:::::::.:. ::::.:::: :. : :::::::::.: .:::::...: : .:::::::
CCDS42 VHTGEKPYRCHVCGKGYSQSSHLQGHQRVHTGEKPYKCEECGKGFGRNSCLHVHQRVHTG
740 750 760 770 780 790
430 440 450
pF1KB9 EKPYECSKCGKGFSQSSNLHIHQRVHKKDPR
:::: :. :::::: .:.:. :::::
CCDS42 EKPYTCGVCGKGFSYTSGLRNHQRVHLGENPYK
800 810 820
>--
initn: 1199 init1: 711 opt: 730 Z-score: 505.6 bits: 103.7 E(32554): 7.7e-22
Smith-Waterman score: 803; 37.1% identity (64.3% similar) in 361 aa overlap (1-353:112-467)
10 20 30
pF1KB9 MASTITGSQDCIVNHRGEVDGEPELDISPC
.:. . ::::: :: .:. : . : .:
CCDS42 KNGKDTEYIQDEELRFFSHKELSSCKIWEEVAGELPGSQDCRVNLQGK-DFQFSEDAAPH
90 100 110 120 130 140
40 50 60 70 80 90
pF1KB9 QQWGEASSPISRNRDSVMTLQSGCFENIESETYLPLKVSSQIDTQDSSVKFCKNEPQDHQ
: : ::.: .. . .::. . ..:.. . .. : : : .: :. : :
CCDS42 QGWEGASTPCFPIENFLDSLQGDGLIGLENQQFPAWRAIRPIPIQGSWAKAFVNQLGDVQ
150 160 170 180 190 200
100 110 120 130 140
pF1KB9 ESRRLFVMEESTERKVIKGES-CSENLQVKLVSDGQELASPLLNGEATCQNGQLKES---
: . . :... . .: : . .: :. .: : :.. .:.:
CCDS42 ERCKNLDTEDTVYKCNWDDDSFCWISCHVD--HRFPEIDKP--CGCNKCRKDCIKNSVLH
210 220 230 240 250
150 160 170 180 190 200
pF1KB9 -LDPIDCNCKDI---HGWKSQVVSCSQQRGHTEEKPCDHNNCGKILNTSPDGHPYEKIHT
..: . . :. .:..... . : .:: :.... .. : : . .... :
CCDS42 RINPGENGLKSNEYRNGFRDDADLPPHPRVPLKEKLCQYDEFSEGLRHSAHLNRHQRVPT
260 270 280 290 300 310
210 220 230 240 250 260
pF1KB9 AEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGKGFTRSSSLLIHQAVHTDEKP
.::. .. . :.. :.... : : . . ::.:. ::::: .: :::::.::: ..:
CCDS42 GEKSVKSLERGRGVRQNTHIRNHPRAPVGDMPYRCDVCGKGFRYKSVLLIHQGVHTGRRP
320 330 340 350 360 370
270 280 290 300 310 320
pF1KB9 YKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQSSKLHIHQRVHTGEKPYECE
:::..:::.: :::.::.:. ::::::::::..:::::: :: :..:::.::::::: :
CCDS42 YKCEECGKAFGRSSNLLVHQRVHTGEKPYKCSECGKGFSYSSVLQVHQRLHTGEKPYTCS
380 390 400 410 420 430
330 340 350 360 370 380
pF1KB9 ECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNLHIHRCIHTGEKPYQCYECGK
::: .: .: :: ::..: ::.::.:::::
CCDS42 ECGKGFCAKSALHKHQHIHPGEKPYSCGECGKGFSCSSHLSSHQKTHTGERPYQCDKCGK
440 450 460 470 480 490
390 400 410 420 430 440
pF1KB9 GFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQRVHTGEKPYECSKCGKGFSQ
CCDS42 GFSHNSYLQAHQRVHMGQHLYKCNVCGKSFSYSSGLLMHQRLHTGEKPYKCECGKSFGRS
500 510 520 530 540 550
>>CCDS12632.1 ZNF45 gene_id:7596|Hs108|chr19 (682 aa)
initn: 4809 init1: 1307 opt: 1312 Z-score: 892.1 bits: 174.9 E(32554): 2.3e-43
Smith-Waterman score: 1315; 53.5% identity (72.6% similar) in 361 aa overlap (100-453:251-606)
70 80 90 100 110 120
pF1KB9 SQIDTQDSSVKFCKNEPQDHQESRRLFVMEESTERKVIKGESCSENLQVKLVSDGQELAS
: :.: :. :. : .: :.. .
CCDS12 TNDASYRSFSQRSHLPHHQRVPTGENPYKYEECGRNVGKSSHCQAPL---IVHTGEKPYK
230 240 250 260 270
130 140 150 160 170 180
pF1KB9 PLLNGEATCQNGQLKESLD------PIDCN-CKDIHGWKSQVVSCSQQRGHTEEKPCDHN
: . : . :. : : :. : .:.:.. ...: :: ::: :
CCDS12 CEECGVGFSQRSYLQVHLKVHTGKKPYKCEECGKSFSWRSRLQ--AHERIHTGEKPYKCN
280 290 300 310 320 330
190 200 210 220 230 240
pF1KB9 NCGKILNTSPDGHPYEKIHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGK
::: .. : . . .:::.:: :. .:::.:: .:.: :: .:: :::::::.:::
CCDS12 ACGKSFSYSSHLNIHCRIHTGEKPYKCEECGKGFSVGSHLQAHQISHTGEKPYKCEECGK
340 350 360 370 380 390
250 260 270 280 290 300
pF1KB9 GFTRSSSLLIHQAVHTDEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQ
:: :.:.:: :: :: ::::.:: :::::.:::.. :: ::::::::::..:::::::
CCDS12 GFCRASNLLDHQRGHTGEKPYQCDACGKGFSRSSDFNIHFRVHTGEKPYKCEECGKGFSQ
400 410 420 430 440 450
310 320 330 340 350 360
pF1KB9 SSKLHIHQRVHTGEKPYECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNL
.:.: ::: :::::::.: :: .::. :.:..: :.::::.:::: .:::.::: :.:
CCDS12 ASNLLAHQRGHTGEKPYKCGTCGKGFSRSSDLNVHCRIHTGEKPYKCERCGKAFSQFSSL
460 470 480 490 500 510
370 380 390 400 410 420
pF1KB9 HIHRCIHTGEKPYQCYECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQ
..:. .::::::::: ::::::: .:.:. : : :::::::.: .::::: ..:..: :.
CCDS12 QVHQRVHTGEKPYQCAECGKGFSVGSQLQAHQRCHTGEKPYQCEECGKGFCRASNFLAHR
520 530 540 550 560 570
430 440 450
pF1KB9 RVHTGEKPYECSKCGKGFSQSSNLHIHQRVHKKDPR
::::::::.:. ::: : : : :. :::::
CCDS12 GVHTGEKPYRCDVCGKRFRQRSYLQAHQRVHTGERPYKCEECGKVFSWSSYLQAHQRVHT
580 590 600 610 620 630
CCDS12 GEKPYKCEECGKGFSWSSSLIIHQRVHADDEGDKDFPSSEDSHRKTR
640 650 660 670 680
>>CCDS46102.1 ZNF226 gene_id:7769|Hs108|chr19 (803 aa)
initn: 2549 init1: 1293 opt: 1301 Z-score: 884.1 bits: 173.7 E(32554): 6.4e-43
Smith-Waterman score: 1301; 57.0% identity (78.6% similar) in 309 aa overlap (149-456:362-668)
120 130 140 150 160 170
pF1KB9 KLVSDGQELASPLLNGEATCQNGQLKESLDPIDCN-CKDIHGWKSQVVSCSQQRGHTEEK
: .:. : . :.. ..:: :: ::
CCDS46 EKPYKCKQCGKGFSRRSALNVHCKVHTAEKPYNCEECGRAFSQASHLQ--DHQRLHTGEK
340 350 360 370 380
180 190 200 210 220 230
pF1KB9 PCDHNNCGKILNTSPDGHPYEKIHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKC
: . ::: .. . . ....::.:: :. .:::.: ::.: .::: :: ::::::
CCDS46 PFKCDACGKSFSRNSHLQSHQRVHTGEKPYKCEECGKGFICSSNLYIHQRVHTGEKPYKC
390 400 410 420 430 440
240 250 260 270 280 290
pF1KB9 EQCGKGFTRSSSLLIHQAVHTDEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCG
:.:::::.: ::: ::.::: :: : : :::::: ::.: :. ::::::::::..::
CCDS46 EECGKGFSRPSSLQAHQGVHTGEKSYICTVCGKGFTLSSNLQAHQRVHTGEKPYKCNECG
450 460 470 480 490 500
300 310 320 330 340 350
pF1KB9 KGFSQSSKLHIHQRVHTGEKPYECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFS
:.: ..:. ..: ::::::::.:: :: .::: : :.:::..:. :.:.:: :::.::.
CCDS46 KSFRRNSHYQVHLVVHTGEKPYKCEICGKGFSQSSYLQIHQKAHSIEKPFKCEECGQGFN
510 520 530 540 550 560
360 370 380 390 400 410
pF1KB9 QSSNLHIHRCIHTGEKPYQCYECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSK
::: :.::. ::::::::.: :::::::. .::.:: :.:::::::.: .::: : :.:.
CCDS46 QSSRLQIHQLIHTGEKPYKCEECGKGFSRRADLKIHCRIHTGEKPYNCEECGKVFRQASN
570 580 590 600 610 620
420 430 440 450
pF1KB9 LLIHQRVHTGEKPYECSKCGKGFSQSSNLHIHQRVHKKDPR
:: :::::.::::..: .:::.:..:..:. ::.:: :
CCDS46 LLAHQRVHSGEKPFKCEECGKSFGRSAHLQAHQKVHTGDKPYKCDECGKGFKWSLNLDMH
630 640 650 660 670 680
CCDS46 QRVHTGEKPYKCGECGKYFSQASSLQLHQSVHTGEKPYKCDVCGKVFSRSSQLQSHQRVH
690 700 710 720 730 740
>--
initn: 1674 init1: 608 opt: 608 Z-score: 424.8 bits: 88.7 E(32554): 2.4e-17
Smith-Waterman score: 608; 63.3% identity (84.4% similar) in 128 aa overlap (233-360:669-796)
210 220 230 240 250 260
pF1KB9 AEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGKGFTRSSSLLIHQAVHTDEKP
:::::..::::: : .: .:: ::: :::
CCDS46 GEKPFKCEECGKSFGRSAHLQAHQKVHTGDKPYKCDECGKGFKWSLNLDMHQRVHTGEKP
640 650 660 670 680 690
270 280 290 300 310 320
pF1KB9 YKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQSSKLHIHQRVHTGEKPYECE
::: .::: :...::: .:..::::::::::: ::: ::.::.:. :::::::::::.::
CCDS46 YKCGECGKYFSQASSLQLHQSVHTGEKPYKCDVCGKVFSRSSQLQSHQRVHTGEKPYKCE
700 710 720 730 740 750
330 340 350 360 370 380
pF1KB9 ECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNLHIHRCIHTGEKPYQCYECGK
:: ::: :::: .:.:.:.:.. :: .. ::.. .:.
CCDS46 ICGKSFSWRSNLTVHHRIHVGDKSYKSNRGGKNIRESTQEKKSIK
760 770 780 790 800
390 400 410 420 430 440
pF1KB9 GFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQRVHTGEKPYECSKCGKGFSQ
>>CCDS33048.1 ZNF235 gene_id:9310|Hs108|chr19 (738 aa)
initn: 1296 init1: 1296 opt: 1300 Z-score: 883.8 bits: 173.5 E(32554): 6.6e-43
Smith-Waterman score: 1315; 46.0% identity (66.5% similar) in 465 aa overlap (10-453:226-677)
10 20 30
pF1KB9 MASTITGSQDCIVNHRGEVDGEPELDISPCQQWGEASSP
: ::..: .: .. : : . ::
CCDS33 RSCKQTQMKNKLCIFAPYVDIFSCISHHHDDNIVHKRDKVHSN-----SDCGKDTLKVSP
200 210 220 230 240 250
40 50 60 70 80 90
pF1KB9 ISRNRDSVMTLQSG-----CFENIESETYLPLKVSSQIDTQDSSVKFCKNEPQDHQESRR
... :. : :. : : ... . : :. . .. .. . :... .: . :
CCDS33 LTQR--SIHTGQKTYQGNECEEAFNDSSSLELHKQVHLGKKSPA---CSTHEKDTSYSSG
260 270 280 290 300
100 110 120 130 140
pF1KB9 LFVMEE-STERKVI------KGESCSENLQV-KLVSDGQELASPLLNGEATCQNGQLKES
. :.. : .: :: : : :::. . : :.. . :.. :...:
CCDS33 IPVQQSVRTGKKRYWCHECGKGFSQSSNLQTHQRVHTGEKPYTCHECGKSFNQSSHLYAH
310 320 330 340 350 360
150 160 170 180 190
pF1KB9 LD------PIDCN-CKDIHGWKSQV-VSCSQQRGHTEEKPCDHNNCGKILNTSPDGHPYE
: : :. : . .... . : : :: ::: . ::: .. . .:
CCDS33 LPIHTGEKPYRCDSCGKGFSRSTDLNIHC---RVHTGEKPYKCEVCGKGFTQRSHLQAHE
370 380 390 400 410 420
200 210 220 230 240 250
pF1KB9 KIHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGKGFTRSSSLLIHQAVHT
.:::.:: :. ..::: :: ::.: ::: :::::::::..::: :. : .: :: :::
CCDS33 RIHTGEKPYKCGDCGKRFSCSSNLHTHQRVHTEEKPYKCDECGKCFSLSFNLHSHQRVHT
430 440 450 460 470 480
260 270 280 290 300 310
pF1KB9 DEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQSSKLHIHQRVHTGEKP
::::::..:::::. .::. :. :::::::..:. ::::::::: .. ::::::::::
CCDS33 GEKPYKCEECGKGFSSASSFQSHQRVHTGEKPFRCNVCGKGFSQSSYFQAHQRVHTGEKP
490 500 510 520 530 540
320 330 340 350 360 370
pF1KB9 YECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNLHIHRCIHTGEKPYQCY
:.:: :: :. ::: ::::::::.:::: ::::::::.:::. :. .::::::..:
CCDS33 YKCEVCGKRFNWSLNLHNHQRVHTGEKPYKCEECGKGFSQASNLQAHQSVHTGEKPFKCD
550 560 570 580 590 600
380 390 400 410 420 430
pF1KB9 ECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQRVHTGEKPYECSKCGK
: : :::.: :. : :::::::::.: :::.::: :.: .:: .::::::..: .:::
CCDS33 ACQKRFSQASHLQAHQRVHTGEKPYKCDTCGKAFSQRSNLQVHQIIHTGEKPFKCEECGK
610 620 630 640 650 660
440 450
pF1KB9 GFSQSSNLHIHQRVHKKDPR
:: :..: :::::
CCDS33 EFSWSAGLSAHQRVHTGEKPYTCQQCGKGFSQASHFHTHQRVHTGERPYICDVCCKGFSQ
670 680 690 700 710 720
>>CCDS54939.1 ZNF300 gene_id:91975|Hs108|chr5 (568 aa)
initn: 6005 init1: 1277 opt: 1295 Z-score: 881.7 bits: 172.7 E(32554): 8.6e-43
Smith-Waterman score: 1295; 57.2% identity (81.7% similar) in 306 aa overlap (149-453:260-563)
120 130 140 150 160 170
pF1KB9 KLVSDGQELASPLLNGEATCQNGQLKESLDPIDCN-CKDIHGWKSQVVSCSQQRGHTEEK
: ::. : . : ..: .:: :: ::
CCDS54 EKSCVCVTCGKAFAKKSQLIVHQRIHTGKKPYDCGACGKAFSEKFHLV--VHQRTHTGEK
230 240 250 260 270 280
180 190 200 210 220 230
pF1KB9 PCDHNNCGKILNTSPDGHPYEKIHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKC
: : ..::: .. . . ....::.:: :: :.::: :::.: :..::: :: ::::.:
CCDS54 PYDCSECGKAFSQKSSLIIHQRVHTGEKPYECSECGKAFSQKSPLIIHQRIHTGEKPYEC
290 300 310 320 330 340
240 250 260 270 280 290
pF1KB9 EQCGKGFTRSSSLLIHQAVHTDEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCG
..:::.:...:.:.::. .:: ::::.: .:::.: ..: :.::. .::::::::: .:
CCDS54 RECGKAFSQKSQLIIHHRAHTGEKPYECTECGKAFCEKSHLIIHKRIHTGEKPYKCAQCE
350 360 370 380 390 400
300 310 320 330 340 350
pF1KB9 KGFSQSSKLHIHQRVHTGEKPYECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFS
..::....: :: :::::::::: ::: .::..:.: ::::.::::.::::.::::.:
CCDS54 EAFSRKTELITHQLVHTGEKPYECTECGKTFSRKSQLIIHQRTHTGEKPYKCSECGKAFC
410 420 430 440 450 460
360 370 380 390 400 410
pF1KB9 QSSNLHIHRCIHTGEKPYQCYECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSK
:.:.: :. :::::::: : ::::.:::.: : : :.::::::: :..:::.:::.:
CCDS54 QKSHLIGHQRIHTGEKPYICTECGKAFSQKSHLPGHQRIHTGEKPYICAECGKAFSQKSD
470 480 490 500 510 520
420 430 440 450
pF1KB9 LLIHQRVHTGEKPYECSKCGKGFSQSSNLHIHQRVHKKDPR
:..:::.::::.::.:. :::.: :.:.: .:::.:
CCDS54 LVLHQRIHTGERPYQCAICGKAFIQKSQLTVHQRIHTVVKS
530 540 550 560
458 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 18:03:50 2016 done: Fri Nov 4 18:03:50 2016
Total Scan time: 2.710 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]