FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7860, 599 aa
1>>>pF1KB7860 599 - 599 aa - 599 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.6475+/-0.00139; mu= 8.9247+/- 0.082
mean_var=222.6030+/-46.280, 0's: 0 Z-trim(107.3): 954 B-trim: 16 in 1/51
Lambda= 0.085962
statistics sampled from 8452 (9480) to 8452 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.625), E-opt: 0.2 (0.291), width: 16
Scan time: 3.310
The best scores are: opt bits E(32554)
CCDS75188.1 PRDM5 gene_id:11107|Hs108|chr4 ( 599) 4203 535.1 9.4e-152
CCDS75187.1 PRDM5 gene_id:11107|Hs108|chr4 ( 501) 3355 429.9 3.8e-120
CCDS3716.1 PRDM5 gene_id:11107|Hs108|chr4 ( 630) 2798 360.9 2.8e-99
CCDS46102.1 ZNF226 gene_id:7769|Hs108|chr19 ( 803) 1196 162.4 2.1e-39
CCDS74322.1 ZNF91 gene_id:7644|Hs108|chr19 (1159) 1135 155.0 5e-37
CCDS42541.1 ZNF91 gene_id:7644|Hs108|chr19 (1191) 1135 155.0 5.1e-37
CCDS32973.1 ZNF93 gene_id:81931|Hs108|chr19 ( 620) 1117 152.4 1.6e-36
CCDS54240.1 ZNF208 gene_id:7757|Hs108|chr19 (1280) 1111 152.1 4.2e-36
CCDS42537.1 ZNF429 gene_id:353088|Hs108|chr19 ( 674) 1094 149.6 1.2e-35
CCDS74388.1 ZNF227 gene_id:7770|Hs108|chr19 ( 748) 1084 148.4 3e-35
CCDS32977.1 ZNF85 gene_id:7639|Hs108|chr19 ( 595) 1082 148.1 3.1e-35
CCDS12636.1 ZNF227 gene_id:7770|Hs108|chr19 ( 799) 1084 148.5 3.2e-35
CCDS31938.1 ZNF605 gene_id:100289635|Hs108|chr12 ( 641) 1082 148.1 3.2e-35
CCDS53850.1 ZNF605 gene_id:100289635|Hs108|chr12 ( 672) 1082 148.1 3.3e-35
CCDS33048.1 ZNF235 gene_id:9310|Hs108|chr19 ( 738) 1077 147.6 5.5e-35
CCDS32440.1 ZNF267 gene_id:10308|Hs108|chr16 ( 743) 1074 147.2 7.1e-35
CCDS46170.1 ZNF845 gene_id:91664|Hs108|chr19 ( 970) 1076 147.6 7.1e-35
CCDS42504.1 ZNF709 gene_id:163051|Hs108|chr19 ( 641) 1072 146.9 7.6e-35
CCDS76895.1 ZNF23 gene_id:7571|Hs108|chr16 ( 585) 1066 146.1 1.2e-34
CCDS10900.1 ZNF23 gene_id:7571|Hs108|chr16 ( 643) 1066 146.1 1.3e-34
CCDS82391.1 ZNF160 gene_id:90338|Hs108|chr19 ( 782) 1066 146.2 1.5e-34
CCDS54238.1 ZNF737 gene_id:100129842|Hs108|chr19 ( 536) 1063 145.7 1.5e-34
CCDS12859.1 ZNF160 gene_id:90338|Hs108|chr19 ( 818) 1066 146.2 1.5e-34
CCDS74387.1 ZNF283 gene_id:284349|Hs108|chr19 ( 540) 1058 145.1 2.3e-34
CCDS33093.2 ZNF28 gene_id:7576|Hs108|chr19 ( 718) 1060 145.4 2.3e-34
CCDS46097.1 ZNF283 gene_id:284349|Hs108|chr19 ( 679) 1058 145.2 2.6e-34
CCDS46212.1 ZNF814 gene_id:730051|Hs108|chr19 ( 855) 1058 145.3 3.1e-34
CCDS12980.1 ZNF132 gene_id:7691|Hs108|chr19 ( 706) 1056 144.9 3.2e-34
CCDS46101.1 ZNF234 gene_id:10780|Hs108|chr19 ( 700) 1055 144.8 3.5e-34
CCDS46031.1 ZNF98 gene_id:148198|Hs108|chr19 ( 572) 1053 144.5 3.6e-34
CCDS59369.1 ZNF99 gene_id:7652|Hs108|chr19 ( 864) 1055 144.9 4e-34
CCDS32915.1 ZNF700 gene_id:90592|Hs108|chr19 ( 742) 1052 144.5 4.7e-34
CCDS74289.1 ZNF700 gene_id:90592|Hs108|chr19 ( 745) 1052 144.5 4.7e-34
CCDS12495.1 ZNF567 gene_id:163081|Hs108|chr19 ( 616) 1050 144.1 4.9e-34
CCDS74349.1 ZNF567 gene_id:163081|Hs108|chr19 ( 647) 1050 144.1 5.1e-34
CCDS46045.1 ZNF30 gene_id:90075|Hs108|chr19 ( 623) 1047 143.8 6.4e-34
CCDS46044.1 ZNF30 gene_id:90075|Hs108|chr19 ( 624) 1047 143.8 6.4e-34
CCDS59368.1 ZNF729 gene_id:100287226|Hs108|chr19 (1252) 1052 144.7 6.6e-34
CCDS62623.1 ZNF254 gene_id:9534|Hs108|chr19 ( 574) 1042 143.1 9.4e-34
CCDS74324.1 ZNF254 gene_id:9534|Hs108|chr19 ( 586) 1042 143.1 9.5e-34
CCDS74323.1 ZNF254 gene_id:9534|Hs108|chr19 ( 618) 1042 143.1 9.8e-34
CCDS32983.1 ZNF254 gene_id:9534|Hs108|chr19 ( 659) 1042 143.2 1e-33
CCDS12633.1 ZNF221 gene_id:7638|Hs108|chr19 ( 617) 1041 143.0 1.1e-33
CCDS35067.1 ZNF484 gene_id:83744|Hs108|chr9 ( 816) 1037 142.7 1.8e-33
CCDS33097.1 ZNF347 gene_id:84671|Hs108|chr19 ( 839) 1037 142.7 1.8e-33
CCDS35066.1 ZNF484 gene_id:83744|Hs108|chr9 ( 852) 1037 142.7 1.9e-33
CCDS59136.1 ZNF484 gene_id:83744|Hs108|chr9 ( 854) 1037 142.7 1.9e-33
CCDS12497.1 ZNF345 gene_id:25850|Hs108|chr19 ( 488) 1031 141.7 2.2e-33
CCDS45984.2 ZNF878 gene_id:729747|Hs108|chr19 ( 531) 1031 141.7 2.3e-33
CCDS12959.2 ZNF551 gene_id:90233|Hs108|chr19 ( 670) 1032 141.9 2.5e-33
>>CCDS75188.1 PRDM5 gene_id:11107|Hs108|chr4 (599 aa)
initn: 4203 init1: 4203 opt: 4203 Z-score: 2837.9 bits: 535.1 E(32554): 9.4e-152
Smith-Waterman score: 4203; 100.0% identity (100.0% similar) in 599 aa overlap (1-599:1-599)
10 20 30 40 50 60
pF1KB7 MLGMYVPDRFSLKSSRVQDGMGLYTARRVRKGEKFGPFAGEKRMPEDLDENMDYRLMWEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 MLGMYVPDRFSLKSSRVQDGMGLYTARRVRKGEKFGPFAGEKRMPEDLDENMDYRLMWEV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 RGSKGEVLYILDATNPRHSNWLRFVHEAPSQEQKNLAAIQEGENIFYLAVEDIETDTELL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 RGSKGEVLYILDATNPRHSNWLRFVHEAPSQEQKNLAAIQEGENIFYLAVEDIETDTELL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 IGYLDSDMEAEEEEQQIMTVIKEGEVENSRRQSTAGRKDRLGCKEDYACPQCESSFTSED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 IGYLDSDMEAEEEEQQIMTVIKEGEVENSRRQSTAGRKDRLGCKEDYACPQCESSFTSED
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 ILAEHLQTLHQKPTEEKEFKCKNCGKKFPVKQALQRHFEQHQETCRGDARFVCKADSCGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 ILAEHLQTLHQKPTEEKEFKCKNCGKKFPVKQALQRHFEQHQETCRGDARFVCKADSCGK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 RLKSKDALKRHQENVHTGDPKKKLICSVCNKKCSSASSLQEHRKIHEIFDCQECMKKFIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 RLKSKDALKRHQENVHTGDPKKKLICSVCNKKCSSASSLQEHRKIHEIFDCQECMKKFIS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 ANQLKRHMITHSEKRPYNCEICNKSFKRLDQVGAHKVIHSEDKPYKCKLCGKGFAHRNVY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 ANQLKRHMITHSEKRPYNCEICNKSFKRLDQVGAHKVIHSEDKPYKCKLCGKGFAHRNVY
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 KNHKKTHSEERPFQCEECKALFRTPFSLQRHLLIHNSERTFKCHHCDATFKRKDTLNVHV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 KNHKKTHSEERPFQCEECKALFRTPFSLQRHLLIHNSERTFKCHHCDATFKRKDTLNVHV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB7 QVVHERHKKYRCELCNKAFVTPSVLRSHKKTHTGEKEKICPYCGQKFASSGTLRVHIRSH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 QVVHERHKKYRCELCNKAFVTPSVLRSHKKTHTGEKEKICPYCGQKFASSGTLRVHIRSH
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB7 TGERPYQCPYCEKGFSKNDGLKMHIRTHTREKPYKCSECSKAFSQKRGLDEHKRTHTGEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 TGERPYQCPYCEKGFSKNDGLKMHIRTHTREKPYKCSECSKAFSQKRGLDEHKRTHTGEK
490 500 510 520 530 540
550 560 570 580 590
pF1KB7 PFQCDVCDLAFSLKKMLIRHKMTHNPNRPLAECQFCHKKFTRNDYLKVHMDNIHGVADS
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 PFQCDVCDLAFSLKKMLIRHKMTHNPNRPLAECQFCHKKFTRNDYLKVHMDNIHGVADS
550 560 570 580 590
>>CCDS75187.1 PRDM5 gene_id:11107|Hs108|chr4 (501 aa)
initn: 3355 init1: 3355 opt: 3355 Z-score: 2270.4 bits: 429.9 E(32554): 3.8e-120
Smith-Waterman score: 3355; 100.0% identity (100.0% similar) in 483 aa overlap (1-483:1-483)
10 20 30 40 50 60
pF1KB7 MLGMYVPDRFSLKSSRVQDGMGLYTARRVRKGEKFGPFAGEKRMPEDLDENMDYRLMWEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 MLGMYVPDRFSLKSSRVQDGMGLYTARRVRKGEKFGPFAGEKRMPEDLDENMDYRLMWEV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 RGSKGEVLYILDATNPRHSNWLRFVHEAPSQEQKNLAAIQEGENIFYLAVEDIETDTELL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 RGSKGEVLYILDATNPRHSNWLRFVHEAPSQEQKNLAAIQEGENIFYLAVEDIETDTELL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 IGYLDSDMEAEEEEQQIMTVIKEGEVENSRRQSTAGRKDRLGCKEDYACPQCESSFTSED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 IGYLDSDMEAEEEEQQIMTVIKEGEVENSRRQSTAGRKDRLGCKEDYACPQCESSFTSED
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 ILAEHLQTLHQKPTEEKEFKCKNCGKKFPVKQALQRHFEQHQETCRGDARFVCKADSCGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 ILAEHLQTLHQKPTEEKEFKCKNCGKKFPVKQALQRHFEQHQETCRGDARFVCKADSCGK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 RLKSKDALKRHQENVHTGDPKKKLICSVCNKKCSSASSLQEHRKIHEIFDCQECMKKFIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 RLKSKDALKRHQENVHTGDPKKKLICSVCNKKCSSASSLQEHRKIHEIFDCQECMKKFIS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 ANQLKRHMITHSEKRPYNCEICNKSFKRLDQVGAHKVIHSEDKPYKCKLCGKGFAHRNVY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 ANQLKRHMITHSEKRPYNCEICNKSFKRLDQVGAHKVIHSEDKPYKCKLCGKGFAHRNVY
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 KNHKKTHSEERPFQCEECKALFRTPFSLQRHLLIHNSERTFKCHHCDATFKRKDTLNVHV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 KNHKKTHSEERPFQCEECKALFRTPFSLQRHLLIHNSERTFKCHHCDATFKRKDTLNVHV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB7 QVVHERHKKYRCELCNKAFVTPSVLRSHKKTHTGEKEKICPYCGQKFASSGTLRVHIRSH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 QVVHERHKKYRCELCNKAFVTPSVLRSHKKTHTGEKEKICPYCGQKFASSGTLRVHIRSH
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB7 TGERPYQCPYCEKGFSKNDGLKMHIRTHTREKPYKCSECSKAFSQKRGLDEHKRTHTGEK
:::
CCDS75 TGEAVQVLRVQQGLQPEARPG
490 500
>>CCDS3716.1 PRDM5 gene_id:11107|Hs108|chr4 (630 aa)
initn: 2739 init1: 2739 opt: 2798 Z-score: 1895.9 bits: 360.9 E(32554): 2.8e-99
Smith-Waterman score: 4131; 95.1% identity (95.1% similar) in 630 aa overlap (1-599:1-630)
10 20 30 40 50 60
pF1KB7 MLGMYVPDRFSLKSSRVQDGMGLYTARRVRKGEKFGPFAGEKRMPEDLDENMDYRLMWEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS37 MLGMYVPDRFSLKSSRVQDGMGLYTARRVRKGEKFGPFAGEKRMPEDLDENMDYRLMWEV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 RGSKGEVLYILDATNPRHSNWLRFVHEAPSQEQKNLAAIQEGENIFYLAVEDIETDTELL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS37 RGSKGEVLYILDATNPRHSNWLRFVHEAPSQEQKNLAAIQEGENIFYLAVEDIETDTELL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 IGYLDSDMEAEEEEQQIMTVIKEGEVENSRRQSTAGRKDRLGCKEDYACPQCESSFTSED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS37 IGYLDSDMEAEEEEQQIMTVIKEGEVENSRRQSTAGRKDRLGCKEDYACPQCESSFTSED
130 140 150 160 170 180
190 200 210
pF1KB7 ILAEHLQTLHQKPTEEKEFKCKNCGKKFPVKQALQRH-----------------------
:::::::::::::::::::::::::::::::::::::
CCDS37 ILAEHLQTLHQKPTEEKEFKCKNCGKKFPVKQALQRHVLQCTAKSSLKESSRSFQCSVCN
190 200 210 220 230 240
220 230 240 250 260
pF1KB7 --------FEQHQETCRGDARFVCKADSCGKRLKSKDALKRHQENVHTGDPKKKLICSVC
::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS37 SSFSSASSFEQHQETCRGDARFVCKADSCGKRLKSKDALKRHQENVHTGDPKKKLICSVC
250 260 270 280 290 300
270 280 290 300 310 320
pF1KB7 NKKCSSASSLQEHRKIHEIFDCQECMKKFISANQLKRHMITHSEKRPYNCEICNKSFKRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS37 NKKCSSASSLQEHRKIHEIFDCQECMKKFISANQLKRHMITHSEKRPYNCEICNKSFKRL
310 320 330 340 350 360
330 340 350 360 370 380
pF1KB7 DQVGAHKVIHSEDKPYKCKLCGKGFAHRNVYKNHKKTHSEERPFQCEECKALFRTPFSLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS37 DQVGAHKVIHSEDKPYKCKLCGKGFAHRNVYKNHKKTHSEERPFQCEECKALFRTPFSLQ
370 380 390 400 410 420
390 400 410 420 430 440
pF1KB7 RHLLIHNSERTFKCHHCDATFKRKDTLNVHVQVVHERHKKYRCELCNKAFVTPSVLRSHK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS37 RHLLIHNSERTFKCHHCDATFKRKDTLNVHVQVVHERHKKYRCELCNKAFVTPSVLRSHK
430 440 450 460 470 480
450 460 470 480 490 500
pF1KB7 KTHTGEKEKICPYCGQKFASSGTLRVHIRSHTGERPYQCPYCEKGFSKNDGLKMHIRTHT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS37 KTHTGEKEKICPYCGQKFASSGTLRVHIRSHTGERPYQCPYCEKGFSKNDGLKMHIRTHT
490 500 510 520 530 540
510 520 530 540 550 560
pF1KB7 REKPYKCSECSKAFSQKRGLDEHKRTHTGEKPFQCDVCDLAFSLKKMLIRHKMTHNPNRP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS37 REKPYKCSECSKAFSQKRGLDEHKRTHTGEKPFQCDVCDLAFSLKKMLIRHKMTHNPNRP
550 560 570 580 590 600
570 580 590
pF1KB7 LAECQFCHKKFTRNDYLKVHMDNIHGVADS
::::::::::::::::::::::::::::::
CCDS37 LAECQFCHKKFTRNDYLKVHMDNIHGVADS
610 620 630
>>CCDS46102.1 ZNF226 gene_id:7769|Hs108|chr19 (803 aa)
initn: 3172 init1: 491 opt: 1196 Z-score: 821.0 bits: 162.4 E(32554): 2.1e-39
Smith-Waterman score: 1224; 35.7% identity (62.8% similar) in 594 aa overlap (24-598:212-780)
10 20 30 40 50
pF1KB7 MLGMYVPDRFSLKSSRVQDGMGLYTARRVRKGEK-FGPFAGEKRMPEDLDENM
. ..::.:.:: . : :: . : ..
CCDS46 QRLNRDQQISIKNKLCQCKKGVDPIGWISHHDGHRVHKSEKSYRPNDYEKDNMKIL--TF
190 200 210 220 230
60 70 80 90 100 110
pF1KB7 DYRLMWEVRGSKGEVLYILDATNPRHSNWLRF-VHEAPSQEQKNLAAIQEGENIFYLAVE
:. : .. :. : . . :. : .:. .. .:.:. ...:... : :
CCDS46 DHNSMIHT----GQKSYQCNECKKPFSDLSSFDLHQQLQSGEKSLTCVERGKGFCYSPV-
240 250 260 270 280 290
120 130 140 150 160
pF1KB7 DIETDTELLIGY-LDSDMEAEEEEQ--QIMTVIKEGEVENSRRQSTAG----RKDRLG--
. . .. .: : : ..: : ...: : .:. . . : :.. :.
CCDS46 -LPVHQKVHVGEKLKCDECGKEFSQGAHLQTHQKVHVIEKPYKCKQCGKGFSRRSALNVH
300 310 320 330 340 350
170 180 190 200 210
pF1KB7 CK-----EDYACPQCESSFTSEDILAEHLQTLHQKPTEEKEFKCKNCGKKFPVKQALQRH
:: . : : .: .:.. . : .: : :: : :: ::: :::.: . . :
CCDS46 CKVHTAEKPYNCEECGRAFSQASHLQDH-QRLH---TGEKPFKCDACGKSF----SRNSH
360 370 380 390 400
220 230 240 250 260 270
pF1KB7 FEQHQETCRGDARFVCKADSCGKRLKSKDALKRHQENVHTGDPKKKLICSVCNKKCSSAS
...::.. :. . : . ::: . .. : ::. ::::. : : :.: : :
CCDS46 LQSHQRVHTGEKPYKC--EECGKGFICSSNLYIHQR-VHTGEKPYK--CEECGKGFSRPS
410 420 430 440 450 460
280 290 300 310 320 330
pF1KB7 SLQEHRKIH---EIFDCQECMKKFISANQLKRHMITHSEKRPYNCEICNKSFKRLDQVGA
::: :. .: . . : : : : ...:. :. .:. ..::.:. :.:::.: .. .
CCDS46 SLQAHQGVHTGEKSYICTVCGKGFTLSSNLQAHQRVHTGEKPYKCNECGKSFRRNSHYQV
470 480 490 500 510 520
340 350 360 370 380 390
pF1KB7 HKVIHSEDKPYKCKLCGKGFAHRNVYKNHKKTHSEERPFQCEECKALFRTPFSLQRHLLI
: :.:. .:::::..:::::.. . . :.:.:: :.::.:::: : :: : ::
CCDS46 HLVVHTGEKPYKCEICGKGFSQSSYLQIHQKAHSIEKPFKCEECGQGFNQSSRLQIHQLI
530 540 550 560 570 580
400 410 420 430 440 450
pF1KB7 HNSERTFKCHHCDATFKRKDTLNVHVQVVHERHKKYRCELCNKAFVTPSVLRSHKKTHTG
:..:. .::..: :.:. :..: .. : .: : :: :.:.: : : .:...:.:
CCDS46 HTGEKPYKCEECGKGFSRRADLKIHCRI-HTGEKPYNCEECGKVFRQASNLLAHQRVHSG
590 600 610 620 630
460 470 480 490 500 510
pF1KB7 EKEKICPYCGQKFASSGTLRVHIRSHTGERPYQCPYCEKGFSKNDGLKMHIRTHTREKPY
:: : ::..:. :. :..: . :::..::.: : :::. . .: :: :.:: ::::
CCDS46 EKPFKCEECGKSFGRSAHLQAHQKVHTGDKPYKCDECGKGFKWSLNLDMHQRVHTGEKPY
640 650 660 670 680 690
520 530 540 550 560 570
pF1KB7 KCSECSKAFSQKRGLDEHKRTHTGEKPFQCDVCDLAFSLKKMLIRHKMTHNPNRPLAECQ
::.::.: ::: .:. :. .::::::..:::: .:: ...: :. .:. ..: .:.
CCDS46 KCGECGKYFSQASSLQLHQSVHTGEKPYKCDVCGKVFSRSSQLQSHQRVHTGEKPY-KCE
700 710 720 730 740 750
580 590
pF1KB7 FCHKKFTRNDYLKVHMDNIHGVADS
.: :.:. . : :: :: :.:
CCDS46 ICGKSFSWRSNLTVHH-RIH-VGDKSYKSNRGGKNIRESTQEKKSIK
760 770 780 790 800
>>CCDS74322.1 ZNF91 gene_id:7644|Hs108|chr19 (1159 aa)
initn: 4289 init1: 539 opt: 1135 Z-score: 778.2 bits: 155.0 E(32554): 5e-37
Smith-Waterman score: 1174; 40.6% identity (63.9% similar) in 446 aa overlap (153-594:611-1040)
130 140 150 160 170 180
pF1KB7 YLDSDMEAEEEEQQIMTVIKEGEVENSRRQSTAGRKDRLGCKED-YACPQCESSFTSEDI
:. ... :. : : : .: ..:.. .
CCDS74 WSSTLRRHKRIHTGEKPYKCEECGKAFSHSSALAKHKRIHTGEKPYKCKECGKAFSNSST
590 600 610 620 630 640
190 200 210 220 230 240
pF1KB7 LAEHLQTLHQKPTEEKEFKCKNCGKKFPVKQALQRHFEQHQETCRGDARFVCKADSCGKR
::.: . : :::: .:::.: : : ..: .: : :. . : . :::
CCDS74 LANH-KITH---TEEKPYKCKECDKTFKRLSTLTKHKIIHA----GEKLYKC--EECGKA
650 660 670 680 690
250 260 270 280 290
pF1KB7 LKSKDALKRHQENVHTGDPKKKLICSVCNKKCSSASSLQEHRKIH---EIFDCQECMKKF
.. .. : :. .:::. : : :.: . .::: .:..:: . : :.:: : :
CCDS74 FNRSSNLTIHKF-IHTGEKPYK--CEECGKAFNWSSSLTKHKRIHTREKPFKCKECGKAF
700 710 720 730 740
300 310 320 330 340 350
pF1KB7 ISANQLKRHMITHSEKRPYNCEICNKSFKRLDQVGAHKVIHSEDKPYKCKLCGKGFAHRN
: .. : :: :. ..::.:: :.:.:.: . . ::.::. .:::::: :::.: : .
CCDS74 IWSSTLTRHKRIHTGEKPYKCEECGKAFSRSSTLTKHKTIHTGEKPYKCKECGKAFKHSS
750 760 770 780 790 800
360 370 380 390 400 410
pF1KB7 VYKNHKKTHSEERPFQCEECKALFRTPFSLQRHLLIHNSERTFKCHHCDATFKRKDTLNV
. .:: :. :. ..:::: : .: : .::..:. : ..:: .: ..::.
CCDS74 ALAKHKIIHAGEKLYKCEECGKAFNQSSNLTTHKIIHTKEKPSKSEECDKAFIWSSTLTE
810 820 830 840 850 860
420 430 440 450 460 470
pF1KB7 HVQVVHERHKKYRCELCNKAFVTPSVLRSHKKTHTGEKEKICPYCGQKFASSGTLRVHIR
: . .: :.: :.:: :.::: :: : .::. ::::: : ::. :..:.:: .:
CCDS74 H-KRIHTREKTYKCEECGKAFSQPSHLTTHKRMHTGEKPYKCEECGKAFSQSSTLTTHKI
870 880 890 900 910 920
480 490 500 510 520 530
pF1KB7 SHTGERPYQCPYCEKGFSKNDGLKMHIRTHTREKPYKCSECSKAFSQKRGLDEHKRTHTG
::::.::.: : :.: :.. : : :: :::::: ::.:::::. : .: : :::
CCDS74 IHTGEKPYKCEECGKAFRKSSTLTEHKIIHTGEKPYKCEECGKAFSQSSTLTRHTRMHTG
930 940 950 960 970 980
540 550 560 570 580 590
pF1KB7 EKPFQCDVCDLAFSLKKMLIRHKMTHNPNRPLAECQFCHKKFTRNDYLKVHMDNIHGVAD
:::..:. : ::. .. : ::. :. ..: .:. : : : .. :. : ::
CCDS74 EKPYKCEECGKAFNRSSKLTTHKIIHTGEKPY-KCEECGKAFISSSTLNGH-KRIHTREK
990 1000 1010 1020 1030 1040
pF1KB7 S
CCDS74 PYKCEECGKAFSQSSTLTRHKRLHTGEKPYKCGECGKAFKESSALTKHKIIHTGEKPYKC
1050 1060 1070 1080 1090 1100
>--
initn: 3833 init1: 497 opt: 796 Z-score: 551.0 bits: 112.9 E(32554): 2.3e-24
Smith-Waterman score: 860; 33.6% identity (59.0% similar) in 437 aa overlap (120-547:12-435)
90 100 110 120 130 140
pF1KB7 SQEQKNLAAIQEGENIFYLAVEDIETDTELLIGYLDSDMEAEEEEQQIMTVIKEGEVENS
:. . : .: :: : . . ... .:
CCDS74 MPGTPGSLEMGLLTFRDVAIEFSPEEWQCLDTAQQNLYRNV
10 20 30 40
150 160 170 180 190 200
pF1KB7 RRQSTAGRKDRLGCKEDYACPQCESSFTSEDILAEHLQTLHQKPTEEKEFKCKNCGKKFP
.. . :: ::. ..: :. . . .: . . :. . . :
CCDS74 MLENYRNLA-FLG-----ICPHFPQDFWPEQSMEDSFQKVLLRKYEKCGHENLQLRKGCK
50 60 70 80 90
210 220 230 240 250 260
pF1KB7 VKQALQRHFEQHQETCRGDARFVCKADSCGKRLKS-KDALKRHQENV-HTGDPKKKLICS
. . : : ... . . :. .::: :: :. ..... ::: :: :
CCDS74 SVDECKVHKEGYNKLNQCLTTAQSKVFQCGKYLKVFYKFLNSNRHTIRHTG---KK--CF
100 110 120 130 140 150
270 280 290 300 310 320
pF1KB7 VCNKKCSSASSLQEHRKIHE-IF------DCQECMKKFISANQLKRHMITHSEKRPYNCE
: ::: .. .. :. :. .. :.:: : : .. : : :.: .::.::
CCDS74 KC-KKCVKSFCIRLHKTQHKCVYITEKSCKCKECEKTFHWSSTLTNHKEIHTEDKPYKCE
160 170 180 190 200
330 340 350 360 370 380
pF1KB7 ICNKSFKRLDQVGAHKVIHSEDKPYKCKLCGKGFAHRNVYKNHKKTHSEERPFQCEECKA
:.:.::.:. . .::.: ...: :::. :::.: .. ::. :. :.:..::::
CCDS74 ECGKAFKQLSTLTTHKIICAKEKIYKCEECGKAFLWSSTLTRHKRIHTGEKPYKCEECGK
210 220 230 240 250 260
390 400 410 420 430 440
pF1KB7 LFRTPFSLQRHLLIHNSERTFKCHHCDATFKRKDTLNVHVQVVHERHKKYRCELCNKAFV
: .: .: ::..:. .::..: .:.:..:: : . .: .: :.:. :.:::
CCDS74 AFSHSSTLAKHKRIHTGEKPYKCEECGKAFSRSSTLAKH-KRIHTGEKPYKCKECGKAFS
270 280 290 300 310 320
450 460 470 480 490 500
pF1KB7 TPSVLRSHKKTHTGEKEKICPYCGQKFASSGTLRVHIRSHTGERPYQCPYCEKGFSKNDG
. :.: .:: ::: :: : : . : .:: : :.::. :.: : :.:.....
CCDS74 NSSTLANHKITHTEEKPYKCKECDKAFKRLSTLTKHKIIHAGEKLYKCEECGKAFNRSSN
330 340 350 360 370 380
510 520 530 540 550 560
pF1KB7 LKMHIRTHTREKPYKCSECSKAFSQKRGLDEHKRTHTGEKPFQCDVCDLAFSLKKMLIRH
: .: :: :::::: ::.:::. . .: .::: :: ::::.: :
CCDS74 LTIHKFIHTGEKPYKCEECGKAFNWSSSLTKHKRFHTREKPFKCKECGKAFIWSSTLTRH
390 400 410 420 430 440
570 580 590
pF1KB7 KMTHNPNRPLAECQFCHKKFTRNDYLKVHMDNIHGVADS
CCDS74 KRIHTGEKPYKCEECGKAFRQSSTLTKHKIIHTGEKPYKFEECGKAFRQSLTLNKHKIIH
450 460 470 480 490 500
>>CCDS42541.1 ZNF91 gene_id:7644|Hs108|chr19 (1191 aa)
initn: 4289 init1: 539 opt: 1135 Z-score: 778.1 bits: 155.0 E(32554): 5.1e-37
Smith-Waterman score: 1174; 40.6% identity (63.9% similar) in 446 aa overlap (153-594:643-1072)
130 140 150 160 170 180
pF1KB7 YLDSDMEAEEEEQQIMTVIKEGEVENSRRQSTAGRKDRLGCKED-YACPQCESSFTSEDI
:. ... :. : : : .: ..:.. .
CCDS42 WSSTLRRHKRIHTGEKPYKCEECGKAFSHSSALAKHKRIHTGEKPYKCKECGKAFSNSST
620 630 640 650 660 670
190 200 210 220 230 240
pF1KB7 LAEHLQTLHQKPTEEKEFKCKNCGKKFPVKQALQRHFEQHQETCRGDARFVCKADSCGKR
::.: . : :::: .:::.: : : ..: .: : :. . : . :::
CCDS42 LANH-KITH---TEEKPYKCKECDKTFKRLSTLTKHKIIHA----GEKLYKC--EECGKA
680 690 700 710 720
250 260 270 280 290
pF1KB7 LKSKDALKRHQENVHTGDPKKKLICSVCNKKCSSASSLQEHRKIH---EIFDCQECMKKF
.. .. : :. .:::. : : :.: . .::: .:..:: . : :.:: : :
CCDS42 FNRSSNLTIHKF-IHTGEKPYK--CEECGKAFNWSSSLTKHKRIHTREKPFKCKECGKAF
730 740 750 760 770
300 310 320 330 340 350
pF1KB7 ISANQLKRHMITHSEKRPYNCEICNKSFKRLDQVGAHKVIHSEDKPYKCKLCGKGFAHRN
: .. : :: :. ..::.:: :.:.:.: . . ::.::. .:::::: :::.: : .
CCDS42 IWSSTLTRHKRIHTGEKPYKCEECGKAFSRSSTLTKHKTIHTGEKPYKCKECGKAFKHSS
780 790 800 810 820 830
360 370 380 390 400 410
pF1KB7 VYKNHKKTHSEERPFQCEECKALFRTPFSLQRHLLIHNSERTFKCHHCDATFKRKDTLNV
. .:: :. :. ..:::: : .: : .::..:. : ..:: .: ..::.
CCDS42 ALAKHKIIHAGEKLYKCEECGKAFNQSSNLTTHKIIHTKEKPSKSEECDKAFIWSSTLTE
840 850 860 870 880 890
420 430 440 450 460 470
pF1KB7 HVQVVHERHKKYRCELCNKAFVTPSVLRSHKKTHTGEKEKICPYCGQKFASSGTLRVHIR
: . .: :.: :.:: :.::: :: : .::. ::::: : ::. :..:.:: .:
CCDS42 H-KRIHTREKTYKCEECGKAFSQPSHLTTHKRMHTGEKPYKCEECGKAFSQSSTLTTHKI
900 910 920 930 940 950
480 490 500 510 520 530
pF1KB7 SHTGERPYQCPYCEKGFSKNDGLKMHIRTHTREKPYKCSECSKAFSQKRGLDEHKRTHTG
::::.::.: : :.: :.. : : :: :::::: ::.:::::. : .: : :::
CCDS42 IHTGEKPYKCEECGKAFRKSSTLTEHKIIHTGEKPYKCEECGKAFSQSSTLTRHTRMHTG
960 970 980 990 1000 1010
540 550 560 570 580 590
pF1KB7 EKPFQCDVCDLAFSLKKMLIRHKMTHNPNRPLAECQFCHKKFTRNDYLKVHMDNIHGVAD
:::..:. : ::. .. : ::. :. ..: .:. : : : .. :. : ::
CCDS42 EKPYKCEECGKAFNRSSKLTTHKIIHTGEKPY-KCEECGKAFISSSTLNGH-KRIHTREK
1020 1030 1040 1050 1060 1070
pF1KB7 S
CCDS42 PYKCEECGKAFSQSSTLTRHKRLHTGEKPYKCGECGKAFKESSALTKHKIIHTGEKPYKC
1080 1090 1100 1110 1120 1130
>--
initn: 3833 init1: 497 opt: 796 Z-score: 550.9 bits: 113.0 E(32554): 2.3e-24
Smith-Waterman score: 858; 35.6% identity (61.1% similar) in 388 aa overlap (169-547:87-467)
140 150 160 170 180 190
pF1KB7 TVIKEGEVENSRRQSTAGRKDRLGCKEDYACPQCESSFTSEDILAEHLQTLHQKPTEEKE
::. ..: :. . . .: . . :.
CCDS42 SKPDLITYLEQGKEPWNMKQHEMVDEPTGICPHFPQDFWPEQSMEDSFQKVLLRKYEKCG
60 70 80 90 100 110
200 210 220 230 240 250
pF1KB7 FKCKNCGKKFPVKQALQRHFEQHQETCRGDARFVCKADSCGKRLKS-KDALKRHQENV-H
. . : . . : : ... . . :. .::: :: :. ..... :
CCDS42 HENLQLRKGCKSVDECKVHKEGYNKLNQCLTTAQSKVFQCGKYLKVFYKFLNSNRHTIRH
120 130 140 150 160 170
260 270 280 290 300
pF1KB7 TGDPKKKLICSVCNKKCSSASSLQEHRKIHE-IF------DCQECMKKFISANQLKRHMI
:: :: : : ::: .. .. :. :. .. :.:: : : .. : :
CCDS42 TG--KK---CFKC-KKCVKSFCIRLHKTQHKCVYITEKSCKCKECEKTFHWSSTLTNHKE
180 190 200 210 220 230
310 320 330 340 350 360
pF1KB7 THSEKRPYNCEICNKSFKRLDQVGAHKVIHSEDKPYKCKLCGKGFAHRNVYKNHKKTHSE
:.: .::.:: :.:.::.:. . .::.: ...: :::. :::.: .. ::. :.
CCDS42 IHTEDKPYKCEECGKAFKQLSTLTTHKIICAKEKIYKCEECGKAFLWSSTLTRHKRIHTG
240 250 260 270 280 290
370 380 390 400 410 420
pF1KB7 ERPFQCEECKALFRTPFSLQRHLLIHNSERTFKCHHCDATFKRKDTLNVHVQVVHERHKK
:.:..:::: : .: .: ::..:. .::..: .:.:..:: : . .: .:
CCDS42 EKPYKCEECGKAFSHSSTLAKHKRIHTGEKPYKCEECGKAFSRSSTLAKH-KRIHTGEKP
300 310 320 330 340
430 440 450 460 470 480
pF1KB7 YRCELCNKAFVTPSVLRSHKKTHTGEKEKICPYCGQKFASSGTLRVHIRSHTGERPYQCP
:.:. :.::: . :.: .:: ::: :: : : . : .:: : :.::. :.:
CCDS42 YKCKECGKAFSNSSTLANHKITHTEEKPYKCKECDKAFKRLSTLTKHKIIHAGEKLYKCE
350 360 370 380 390 400
490 500 510 520 530 540
pF1KB7 YCEKGFSKNDGLKMHIRTHTREKPYKCSECSKAFSQKRGLDEHKRTHTGEKPFQCDVCDL
: :.:.....: .: :: :::::: ::.:::. . .: .::: :: ::::.: :
CCDS42 ECGKAFNRSSNLTIHKFIHTGEKPYKCEECGKAFNWSSSLTKHKRFHTREKPFKCKECGK
410 420 430 440 450 460
550 560 570 580 590
pF1KB7 AFSLKKMLIRHKMTHNPNRPLAECQFCHKKFTRNDYLKVHMDNIHGVADS
CCDS42 AFIWSSTLTRHKRIHTGEKPYKCEECGKAFRQSSTLTKHKIIHTGEKPYKFEECGKAFRQ
470 480 490 500 510 520
>>CCDS32973.1 ZNF93 gene_id:81931|Hs108|chr19 (620 aa)
initn: 4218 init1: 537 opt: 1117 Z-score: 769.3 bits: 152.4 E(32554): 1.6e-36
Smith-Waterman score: 1120; 36.5% identity (63.9% similar) in 477 aa overlap (122-594:129-587)
100 110 120 130 140 150
pF1KB7 EQKNLAAIQEGENIFYLAVEDIETDTELLIGYLDSDMEAEEEEQQIMTVIKEGEVENSRR
:: .. . ..... : :.: . .
CCDS32 ILRRYEKRGHGNLQLIKRCESVDECKVHTGGYNGLNQCSTTTQSKVFQCDKYGKVFH--K
100 110 120 130 140 150
160 170 180 190 200 210
pF1KB7 QSTAGRKD-RLGCKEDYACPQCESSFTSEDILAEHLQTLHQKPTEEKEFKCKNCGKKFPV
:...:.. : :. . : .: ..:.. . : : . .: : :: . :..::: :
CCDS32 FSNSNRHNIRHTEKKPFKCIECGKAFNQFSTLITH-KKIH---TGEKPYICEECGKAFKY
160 170 180 190 200 210
220 230 240 250 260 270
pF1KB7 KQALQRHFEQHQETCRGDARFVCKADSCGKRLKSKDALKRHQENVHTGDPKKKLICSVCN
..::. : . : :. . : :.: : . ....:..: : .::: :: : :.
CCDS32 SSALNTHKRIHT----GEKPYKC--DKCDKAFIASSTLSKH-EIIHTG--KKPYKCEECG
220 230 240 250 260
280 290 300 310 320
pF1KB7 KKCSSASSLQEHRKIH---EIFDCQECMKKFISANQLKRHMITHSEKRPYNCEICNKSFK
: ...:.: .:.::: . . :.:: : : ... : .: :. ..:: :: :.:.::
CCDS32 KAFNQSSTLTKHKKIHTGEKPYKCEECGKAFNQSSTLTKHKKIHTGEKPYVCEECGKAFK
270 280 290 300 310 320
330 340 350 360 370 380
pF1KB7 RLDQVGAHKVIHSEDKPYKCKLCGKGFAHRNVYKNHKKTHSEERPFQCEECKALFRTPFS
. .:: ::. .:::::. :::.: .. . :. : .. ..:::: :
CCDS32 YSRILTTHKRIHTGEKPYKCNKCGKAFIASSTLSRHEFIHMGKKHYKCEECGKAFIWSSV
330 340 350 360 370 380
390 400 410 420 430 440
pF1KB7 LQRHLLIHNSERTFKCHHCDATFKRKDTLNVHVQVVHERHKKYRCELCNKAFVTPSVLRS
: :: .:..:. .::..: .:: ..::. : . : .: :.:: :.::::. :.: .
CCDS32 LTRHKRVHTGEKPYKCEECGKAFKYSSTLSSH-KRSHTGEKPYKCEECGKAFVASSTLSK
390 400 410 420 430 440
450 460 470 480 490 500
pF1KB7 HKKTHTGEKEKICPYCGQKFASSGTLRVHIRSHTGERPYQCPYCEKGFSKNDGLKMHIRT
:. :::.: : ::. : .:..: : . ::::.::.: : :.:.....: : .
CCDS32 HEIIHTGKKPYKCEECGKAFNQSSSLTKHKKIHTGEKPYKCEECGKAFNQSSSLTKHKKI
450 460 470 480 490 500
510 520 530 540 550 560
pF1KB7 HTREKPYKCSECSKAFSQKRGLDEHKRTHTGEKPFQCDVCDLAFSLKKMLIRHKMTHNPN
:: :::::: ::.:::.:. : .::. :: :::..:. : :: :. : ::. :. .
CCDS32 HTGEKPYKCEECGKAFNQSSTLIKHKKIHTREKPYKCEECGKAFHLSTHLTTHKILHTGE
510 520 530 540 550 560
570 580 590
pF1KB7 RPLAECQFCHKKFTRNDYLKVHMDNIHGVADS
.: .:. : : :... :. : .::
CCDS32 KPY-RCRECGKAFNHSATLSSH-KKIHSGEKPYECDKCGKAFISPSSLSRHEIIHTGEKP
570 580 590 600 610 620
>>CCDS54240.1 ZNF208 gene_id:7757|Hs108|chr19 (1280 aa)
initn: 3991 init1: 479 opt: 1111 Z-score: 761.6 bits: 152.1 E(32554): 4.2e-36
Smith-Waterman score: 1158; 39.6% identity (66.2% similar) in 429 aa overlap (164-589:662-1075)
140 150 160 170 180 190
pF1KB7 EQQIMTVIKEGEVENSRRQSTAGRKDRLGCKEDYACPQCESSFTSEDILAEHLQTLHQKP
.. : : .: ..:.. .::..: ...:
CCDS54 AGEKPYKCKECGKTFIKVSTLTTHKAIHAGEKPYKCKECGKAFSKFSILTKH-KVIH---
640 650 660 670 680
200 210 220 230 240 250
pF1KB7 TEEKEFKCKNCGKKFPVKQALQRHFEQHQETCRGDARFVCKADSCGKRLKSKDALKRHQE
: :: .::..::: : .. :..: . : :. . : . ::: ... ..: .:.
CCDS54 TGEKPYKCEECGKAFNWSSNLMEHKRIHT----GEKPYKC--EECGKSFSTFSVLTKHKV
690 700 710 720 730 740
260 270 280 290 300 310
pF1KB7 NVHTGDPKKKLICSVCNKKCSSASSLQEHRKIHEI---FDCQECMKKFISANQLKRHMIT
.:::. : : :.: . .:.:. :.::: . . :.:: : : . : .:
CCDS54 -IHTGEKPYK--CEECGKAYKWSSTLSYHKKIHTVEKPYKCEECGKAFNRSAILIKHKRI
750 760 770 780 790
320 330 340 350 360 370
pF1KB7 HSEKRPYNCEICNKSFKRLDQVGAHKVIHSEDKPYKCKLCGKGFAHRNVYKNHKKTHSEE
:....::.:: :.:.:.... . .::.::. .:::::: :::.:.. .. .:: :. :
CCDS54 HTDEKPYKCEECGKTFSKVSTLTTHKAIHAGEKPYKCKECGKAFSKFSILTKHKVIHTGE
800 810 820 830 840 850
380 390 400 410 420 430
pF1KB7 RPFQCEECKALFRTPFSLQRHLLIHNSERTFKCHHCDATFKRKDTLNVHVQVVHERHKKY
.:..:::: .. : .:. : ::..:. .::..: :. . :. : .:.: .: :
CCDS54 KPYKCEECGKAYKWPSTLSYHKKIHTGEKPYKCEECGKGFSMFSILTKH-EVIHTGEKPY
860 870 880 890 900 910
440 450 460 470 480 490
pF1KB7 RCELCNKAFVTPSVLRSHKKTHTGEKEKICPYCGQKFASSGTLRVHIRSHTGERPYQCPY
.:: :.::: ::. .:::::.::: : ::. . ::.:: : . :: :.::.
CCDS54 KCEECGKAFSWLSVFSKHKKTHAGEKFYKCEACGKAYKSSSTLSYHKKIHTEEKPYKYEE
920 930 940 950 960 970
500 510 520 530 540 550
pF1KB7 CEKGFSKNDGLKMHIRTHTREKPYKCSECSKAFSQKRGLDEHKRTHTGEKPFQCDVCDLA
: :::: . : : :: :::::: ::.:::. . .: :::. :::: :..:. :: :
CCDS54 CGKGFSTFSILTKHKVIHTGEKPYKCEECGKAFNWSSNLMEHKKIHTGETPYKCEECDKA
980 990 1000 1010 1020 1030
560 570 580 590
pF1KB7 FSLKKMLIRHKMTHNPNRPLAECQFCHKKFTRNDYLKVHMDNIHGVADS
:: . : .:: :: ..: .:. : : :. . : :
CCDS54 FSWPSSLTEHKATHAGEKPY-KCEECGKAFSWPSRLTEHKATHAGEEPYKCEECGKAFNW
1040 1050 1060 1070 1080 1090
CCDS54 SSNLMEHKRIHTGEKPYKCEECGKSFSTFSILTKHKVIHTGEKPYKCEECGKAYKWSSTL
1100 1110 1120 1130 1140 1150
>--
initn: 1581 init1: 465 opt: 668 Z-score: 464.7 bits: 97.1 E(32554): 1.5e-19
Smith-Waterman score: 668; 40.9% identity (62.4% similar) in 242 aa overlap (324-564:432-659)
300 310 320 330 340 350
pF1KB7 CMKKFISANQLKRHMITHSEKRPYNCEICNKSFKRLDQVGAHKVIHSEDKPYKCKLCGKG
:.:. ... :: ::. . ::::. ::::
CCDS54 CGKGFSMFSILTKHEVIHTGEKPYKCEECGKAFNWSSNLMEHKKIHTGETPYKCEECGKG
410 420 430 440 450 460
360 370 380 390 400 410
pF1KB7 FAHRNVYKNHKKTHSEERPFQCEEC-KALFRTPFSLQRHLLIHNSERTFKCHHCDATFKR
:. .. .:: :. :.:..:::: :: : .:. .::..: .:.
CCDS54 FSMFSILTKHKVIHNGEKPYKCEECDKAT-------------HAGEKPYKCEECGKAFNW
470 480 490 500
420 430 440 450 460 470
pF1KB7 KDTLNVHVQVVHERHKKYRCELCNKAFVTPSVLRSHKKTHTGEKEKICPYCGQKFASSGT
...: : . .: .: :.:: :.:.: : :.: .:: ::::: : ::. . :.:
CCDS54 SSNLMEH-KRIHTGEKPYKCEECGKSFSTFSILTKHKVIHTGEKPYKCEECGKAYKWSST
510 520 530 540 550 560
480 490 500 510 520 530
pF1KB7 LRVHIRSHTGERPYQCPYCEKGFSKNDGLKMHIRTHTREKPYKCSECSKAFSQKRGLDEH
: : . :: :.::.: : :.:... : : : :: :::::: ::.:.::. : :
CCDS54 LSYHKKIHTVEKPYKCEECGKAFNQSAILIKHKRIHTGEKPYKCEECGKTFSKVSTLTTH
570 580 590 600 610 620
540 550 560 570 580 590
pF1KB7 KRTHTGEKPFQCDVCDLAFSLKKMLIRHKMTHNPNRPLAECQFCHKKFTRNDYLKVHMDN
: :.::::..: : .: . : :: :
CCDS54 KAIHAGEKPYKCKECGKTFIKVSTLTTHKAIHAGEKPYKCKECGKAFSKFSILTKHKVIH
630 640 650 660 670 680
pF1KB7 IHGVADS
CCDS54 TGEKPYKCEECGKAFNWSSNLMEHKRIHTGEKPYKCEECGKSFSTFSVLTKHKVIHTGEK
690 700 710 720 730 740
>--
initn: 3422 init1: 467 opt: 599 Z-score: 418.4 bits: 88.6 E(32554): 5.5e-17
Smith-Waterman score: 761; 37.1% identity (67.7% similar) in 291 aa overlap (287-576:143-430)
260 270 280 290 300 310
pF1KB7 TGDPKKKLICSVCNKKCSSASSLQEHRKIHEIFDCQECMKKFISANQLKRHMITHSEKRP
..:. . . : . .. .:: : :. :.
CCDS54 LKIGYTNVDECKVHKEGYNKLNQSLTTTQSKVFQRGKYANVFHKCSNSNRHKIRHTGKKH
120 130 140 150 160 170
320 330 340 350 360 370
pF1KB7 YNCEICNKSFKRLDQVGAHKVIHSEDKPYKCKLCGKGFAHRNVYKNHKKTHSEERPFQCE
.:. .:: :.... :: :..... :::. ::.: .. .:..:. :.:..:.
CCDS54 LQCKEYVRSFCMLSHLSQHKRIYTRENSYKCEEGGKAFNWSSTLTYYKSAHTGEKPYRCK
180 190 200 210 220 230
380 390 400 410 420 430
pF1KB7 ECKALFRTPFS-LQRHLLIHNSERTFKCHHCDATFKRKDTLNVHVQVVHERHKKYRCELC
:: : . :: : .: .::..:...::..: .:... :. : ...: .: .:: :
CCDS54 ECGKAF-SKFSILTKHKVIHTGEKSYKCEECGKAFNQSAILTKH-KIIHTGEKPNKCEEC
240 250 260 270 280 290
440 450 460 470 480 490
pF1KB7 NKAFVTPSVLRSHKKTHTGEKEKICPYCGQKFASSGTLRVHIRSHTGERPYQCPYCEKGF
.::: :.: .:: :.::: : ::. :.. .:: .: :.::.::.: : :.:
CCDS54 GKAFSKVSTLTTHKAIHAGEKPYKCKECGKAFSKVSTLITHKAIHAGEKPYKCKECGKAF
300 310 320 330 340 350
500 510 520 530 540 550
pF1KB7 SKNDGLKMHIRTHTREKPYKCSECSKAFSQKRGLDEHKRTHTGEKPFQCDVCDLAFSLKK
:: . : : :: :::::: ::.::.. :. ::. ::::::..:. : .::. .
CCDS54 SKFSILTKHKVIHTGEKPYKCEECGKAYKWPSTLSYHKKIHTGEKPYKCEECGKGFSMFS
360 370 380 390 400 410
560 570 580 590
pF1KB7 MLIRHKMTHNPNRPLAECQFCHKKFTRNDYLKVHMDNIHGVADS
.: .:.. :. ..: .:. :
CCDS54 ILTKHEVIHTGEKPY-KCEECGKAFNWSSNLMEHKKIHTGETPYKCEECGKGFSMFSILT
420 430 440 450 460
>--
initn: 1256 init1: 448 opt: 552 Z-score: 386.9 bits: 82.7 E(32554): 3.1e-15
Smith-Waterman score: 657; 44.9% identity (67.8% similar) in 205 aa overlap (336-540:1076-1279)
310 320 330 340 350 360
pF1KB7 RHMITHSEKRPYNCEICNKSFKRLDQVGAHKVIHSEDKPYKCKLCGKGFAHRNVYKNHKK
:. :. ..::::. :::.: . .::.
CCDS54 EHKATHAGEKPYKCEECGKAFSWPSRLTEHKATHAGEEPYKCEECGKAFNWSSNLMEHKR
1050 1060 1070 1080 1090 1100
370 380 390 400 410 420
pF1KB7 THSEERPFQCEECKALFRTPFSLQRHLLIHNSERTFKCHHCDATFKRKDTLNVHVQVVHE
:. :.:..:::: : : : .: .::..:. .::..: ..: ..::. : . .:
CCDS54 IHTGEKPYKCEECGKSFSTFSILTKHKVIHTGEKPYKCEECGKAYKWSSTLSYH-KKIHT
1110 1120 1130 1140 1150 1160
430 440 450 460 470 480
pF1KB7 RHKKYRCELCNKAFVTPSVLRSHKKTHTGEKEKICPYCGQKFASSGTLRVHIRSHTGERP
.: :.:: :.:.:: :.: .:: ::::: : ::. . .::: : . ::::.:
CCDS54 VEKPYKCEECGKGFVMFSILAKHKVIHTGEKLYKCEECGKAYKWPSTLRYHKKIHTGEKP
1170 1180 1190 1200 1210 1220
490 500 510 520 530 540
pF1KB7 YQCPYCEKGFSKNDGLKMHIRTHTREKPYKCSECSKAFSQKRGLDEHKRTHTGEKPFQCD
:.: : :.:: . : : :: :::::: ::.:::: ...::. :::::
CCDS54 YKCEECGKAFSTFSILTKHKVIHTGEKPYKCEECGKAFSWLSVFSKHKKIHTGEKL
1230 1240 1250 1260 1270 1280
550 560 570 580 590
pF1KB7 VCDLAFSLKKMLIRHKMTHNPNRPLAECQFCHKKFTRNDYLKVHMDNIHGVADS
>>CCDS42537.1 ZNF429 gene_id:353088|Hs108|chr19 (674 aa)
initn: 3564 init1: 511 opt: 1094 Z-score: 753.5 bits: 149.6 E(32554): 1.2e-35
Smith-Waterman score: 1132; 37.0% identity (65.0% similar) in 454 aa overlap (144-594:207-643)
120 130 140 150 160 170
pF1KB7 ETDTELLIGYLDSDMEAEEEEQQIMTVIKEGEVENSRRQSTAGRKDRLGCKEDYACPQCE
:.. :. : .. .: :. : : .:
CCDS42 KCGKSFCMLSQLTQHKKIHIRENTYRCKEFGNAFNQSSALTNHKRIYVGEKH-YRCEECG
180 190 200 210 220 230
180 190 200 210 220 230
pF1KB7 SSFTSEDILAEHLQTLHQKPTEEKEFKCKNCGKKFPVKQALQRHFEQHQETCRGDARFVC
..:. . :..: . .: : :: .:::.::: : ..: : . :. :. . :
CCDS42 KAFNHYSTLTNH-KRIH---TGEKPYKCKECGKAFSRYSTLTTHKRIHS----GEKPYKC
240 250 260 270 280
240 250 260 270 280 290
pF1KB7 KADSCGKRLKSKDALKRHQENVHTGDPKKKLICSVCNKKCSSASSLQEHRKIH---EIFD
: ::: .. .... .:. .:: .: :. :.: . .:.: :..:: . .
CCDS42 --DECGKTFSISSTFTKHK-IIHT--EEKPYKCKECGKAFNRSSTLTSHKRIHTGEKPYK
290 300 310 320 330 340
300 310 320 330 340 350
pF1KB7 CQECMKKFISANQLKRHMITHSEKRPYNCEICNKSFKRLDQVGAHKVIHSEDKPYKCKLC
:.:: : : .. : .: . :. ..::.:: :.:.:.. ... :: ::. ..::: . :
CCDS42 CEECGKAFNWSSTLTKHKVIHTGEKPYKCEECGKAFNQSSRLTRHKKIHTGEEPYKFEKC
350 360 370 380 390 400
360 370 380 390 400 410
pF1KB7 GKGFAHRNVYKNHKKTHSEERPFQCEECKALFRTPFSLQRHLLIHNSERTFKCHHCDATF
:. :. .. . :: :. :.:..:::: .: .: :: ::. :. .::..: .:
CCDS42 GRVFTCSSTLTQDKKIHTGEKPYNCEECGKVFTYSSTLTRHKRIHTEEKPYKCNECGKAF
410 420 430 440 450 460
420 430 440 450 460 470
pF1KB7 KRKDTLNVHVQVVHERHKKYRCELCNKAFVTPSVLRSHKKTHTGEKEKICPYCGQKFASS
.:.. :. : . .: .: :.:: :.::: : : :::: :.::: : ::. : :
CCDS42 NRSSHLTSH-RRIHTGEKPYKCEECGKAFKQSSNLNSHKKIHSGEKPYKCEECGKAFILS
470 480 490 500 510 520
480 490 500 510 520 530
pF1KB7 GTLRVHIRSHTGERPYQCPYCEKGFSKNDGLKMHIRTHTREKPYKCSECSKAFSQKRGLD
. : : . ::::.::.: : :.:.... : .: . :: ::::::..:.:::... .:.
CCDS42 SRLTQHKKIHTGEKPYKCEECGKAFNRSSRLTQHKKIHTGEKPYKCKQCDKAFTHSSNLS
530 540 550 560 570 580
540 550 560 570 580 590
pF1KB7 EHKRTHTGEKPFQCDVCDLAFSLKKMLIRHKMTHNPNRPLAECQFCHKKFTRNDYLKVHM
::. :.::::..:. : ::. .. : .:: :. ..: .:. : : :::.. : :
CCDS42 SHKKIHSGEKPYKCEECGKAFNRSSRLTQHKKIHTREKPY-KCEECAKAFTRSSRLTQH-
590 600 610 620 630
pF1KB7 DNIHGVADS
.::
CCDS42 KKIHRMGVVAHACNPSTLGGRGGRITRSGDRDRPG
640 650 660 670
>>CCDS74388.1 ZNF227 gene_id:7770|Hs108|chr19 (748 aa)
initn: 2425 init1: 525 opt: 1084 Z-score: 746.3 bits: 148.4 E(32554): 3e-35
Smith-Waterman score: 1089; 36.8% identity (66.0% similar) in 435 aa overlap (163-594:248-659)
140 150 160 170 180 190
pF1KB7 EEQQIMTVIKEGEVENSRRQSTAGRKDRLGCKEDYACPQCESSFTSEDILAEHLQTLHQK
:.:. : . .::: : :. :
CCDS74 PNVHTGEKCFSQSSHLRTHQRIHPGEKLNRCHESGDCFN-KSSFHS-------YQSNH--
220 230 240 250 260
200 210 220 230 240 250
pF1KB7 PTEEKEFKCKNCGKKFPVKQALQRHFEQHQETCRGDARFVCKADSCGKRLKSKDALKRHQ
: :: ..: .::: : . .: :.. : :. . : . ::: ..... .. ::
CCDS74 -TGEKSYRCDSCGKGFSSSTGLIIHYRTHT----GEKPYKC--EECGKCFSQSSNFQCHQ
270 280 290 300 310 320
260 270 280 290 300
pF1KB7 ENVHTGDPKKKLICSVCNKKCSSASSLQEHRKIH---EIFDCQECMKKFISANQLKRHMI
. ::: . : : :.: . . .:. :...: . . :.:: : : .: ... :.
CCDS74 R-VHTEEKPYK--CEECGKGFGWSVNLRVHQRVHRGEKPYKCEECGKGFTQAAHFHIHQR
330 340 350 360 370
310 320 330 340 350 360
pF1KB7 THSEKRPYNCEICNKSFKRLDQVGAHKVIHSEDKPYKCKLCGKGFAHRNVYKNHKKTHSE
.:. ..::.:..:.:.:.. . . :. .:. .:::::. :::::.. . . : ..:.
CCDS74 VHTGEKPYKCDVCGKGFSHNSPLICHRRVHTGEKPYKCEACGKGFTRNTDLHIHFRVHTG
380 390 400 410 420 430
370 380 390 400 410 420
pF1KB7 ERPFQCEECKALFRTPFSLQRHLLIHNSERTFKCHHCDATFKRKDTLNVHVQVVHERHKK
:.:..:.:: : .:: : .:..:. :::. : :.... :..: : :: .:
CCDS74 EKPYKCKECGKGFSQASNLQVHQNVHTGEKRFKCETCGKGFSQSSKLQTH-QRVHTGEKP
440 450 460 470 480 490
430 440 450 460 470 480
pF1KB7 YRCELCNKAFVTPSVLRSHKKTHTGEKEKICPYCGQKFASSGTLRVHIRSHTGERPYQCP
:::..:.: : : :. :. ::::: : ::. :. ..:..: : :.::.::.:
CCDS74 YRCDVCGKDFSYSSNLKLHQVIHTGEKPYKCEECGKGFSWRSNLHAHQRVHSGEKPYKCE
500 510 520 530 540 550
490 500 510 520 530 540
pF1KB7 YCEKGFSKNDGLKMHIRTHTREKPYKCSECSKAFSQKRGLDEHKRTHTGEKPFQCDVCDL
:.:.::. ...: :.:: ::::::. :.:.:::. ::. :.:.::::::..::::
CCDS74 QCDKSFSQAIDFRVHQRVHTGEKPYKCGVCGKGFSQSSGLQSHQRVHTGEKPYKCDVCGK
560 570 580 590 600 610
550 560 570 580 590
pF1KB7 AFSLKKMLIRHKMTHNPNRPLAECQFCHKKFTRNDYLKVHMDNIHGVADS
.: ....: :. :. ..: .:. : : : :. :. : . .:
CCDS74 GFRYSSQFIYHQRGHTGEKPY-KCEECGKGFGRSLNLR-HHQRVHTGEKPHICEECGKAF
620 630 640 650 660 670
CCDS74 SLPSNLRVHLGVHTREKLFKCEECGKGFSQSARLEAHQRVHTGEKPYKCDICDKDFRHRS
680 690 700 710 720 730
599 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 21:11:06 2016 done: Fri Nov 4 21:11:07 2016
Total Scan time: 3.310 Total Display time: 0.170
Function used was FASTA [36.3.4 Apr, 2011]