FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE1164, 593 aa
1>>>pF1KE1164 593 - 593 aa - 593 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.7948+/-0.000979; mu= 12.7163+/- 0.059
mean_var=127.3367+/-25.545, 0's: 0 Z-trim(109.5): 55 B-trim: 80 in 1/49
Lambda= 0.113657
statistics sampled from 10910 (10954) to 10910 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.699), E-opt: 0.2 (0.336), width: 16
Scan time: 3.610
The best scores are: opt bits E(32554)
CCDS742.1 MTF2 gene_id:22823|Hs108|chr1 ( 593) 4077 680.1 2.1e-195
CCDS53341.1 MTF2 gene_id:22823|Hs108|chr1 ( 491) 3392 567.8 1.2e-161
CCDS53340.1 MTF2 gene_id:22823|Hs108|chr1 ( 536) 2379 401.7 1.2e-111
CCDS35116.1 PHF19 gene_id:26147|Hs108|chr9 ( 580) 1673 285.9 9.3e-77
CCDS75889.1 PHF19 gene_id:26147|Hs108|chr9 ( 599) 1673 286.0 9.6e-77
CCDS4777.1 PHF1 gene_id:5252|Hs108|chr6 ( 567) 1355 233.8 4.6e-61
CCDS4778.1 PHF1 gene_id:5252|Hs108|chr6 ( 457) 1336 230.6 3.3e-60
CCDS69648.1 PHF19 gene_id:26147|Hs108|chr9 ( 371) 964 169.5 6.6e-42
CCDS35117.1 PHF19 gene_id:26147|Hs108|chr9 ( 207) 436 82.8 4.8e-16
>>CCDS742.1 MTF2 gene_id:22823|Hs108|chr1 (593 aa)
initn: 4077 init1: 4077 opt: 4077 Z-score: 3621.7 bits: 680.1 E(32554): 2.1e-195
Smith-Waterman score: 4077; 100.0% identity (100.0% similar) in 593 aa overlap (1-593:1-593)
10 20 30 40 50 60
pF1KE1 MRDSTGAGNSLVHKRSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 MRDSTGAGNSLVHKRSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 FYLGTIKKINILKQSCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 FYLGTIKKINILKQSCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 ICDKCGQGYHQLCHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 ICDKCGQGYHQLCHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 TLPYSVADLEWDAGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 TLPYSVADLEWDAGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLF
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE1 GDRFYTFICSVCSSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 GDRFYTFICSVCSSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENW
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE1 DRLHPGELADTPKSERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPVPPNVAFK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 DRLHPGELADTPKSERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPVPPNVAFK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE1 AEKEPEGTSHEFKIKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 AEKEPEGTSHEFKIKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE1 LLDKESISENPTLDLPCSIGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGLSDSR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 LLDKESISENPTLDLPCSIGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGLSDSR
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE1 KRTRTGRSWPAAIPHLRRRRGRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 KRTRTGRSWPAAIPHLRRRRGRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLAD
490 500 510 520 530 540
550 560 570 580 590
pF1KE1 QELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS
:::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 QELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS
550 560 570 580 590
>>CCDS53341.1 MTF2 gene_id:22823|Hs108|chr1 (491 aa)
initn: 3392 init1: 3392 opt: 3392 Z-score: 3015.8 bits: 567.8 E(32554): 1.2e-161
Smith-Waterman score: 3392; 100.0% identity (100.0% similar) in 491 aa overlap (103-593:1-491)
80 90 100 110 120 130
pF1KE1 KQSCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMVICDKCGQGYHQL
::::::::::::::::::::::::::::::
CCDS53 MVCTICQEEYSEAPNEMVICDKCGQGYHQL
10 20 30
140 150 160 170 180 190
pF1KE1 CHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEWD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 CHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEWD
40 50 60 70 80 90
200 210 220 230 240 250
pF1KE1 AGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFYTFICSVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 AGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFYTFICSVC
100 110 120 130 140 150
260 270 280 290 300 310
pF1KE1 SSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHPGELADTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHPGELADTP
160 170 180 190 200 210
320 330 340 350 360 370
pF1KE1 KSERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPVPPNVAFKAEKEPEGTSHEF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KSERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPVPPNVAFKAEKEPEGTSHEF
220 230 240 250 260 270
380 390 400 410 420 430
pF1KE1 KIKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEPLLDKESISENPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KIKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEPLLDKESISENPT
280 290 300 310 320 330
440 450 460 470 480 490
pF1KE1 LDLPCSIGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGLSDSRKRTRTGRSWPAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 LDLPCSIGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGLSDSRKRTRTGRSWPAA
340 350 360 370 380 390
500 510 520 530 540 550
pF1KE1 IPHLRRRRGRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLADQELQLNHLKNSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 IPHLRRRRGRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLADQELQLNHLKNSI
400 410 420 430 440 450
560 570 580 590
pF1KE1 TSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS
:::::::::::::::::::::::::::::::::::::::::
CCDS53 TSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS
460 470 480 490
>>CCDS53340.1 MTF2 gene_id:22823|Hs108|chr1 (536 aa)
initn: 2364 init1: 2364 opt: 2379 Z-score: 2117.6 bits: 401.7 E(32554): 1.2e-111
Smith-Waterman score: 3573; 90.4% identity (90.4% similar) in 593 aa overlap (1-593:1-536)
10 20 30 40 50 60
pF1KE1 MRDSTGAGNSLVHKRSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MRDSTGAGNSLVHKRSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 FYLGTIKKINILKQSCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 FYLGTIKKINILKQSCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 ICDKCGQGYHQLCHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ICDKCGQGYHQLCHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 TLPYSVADLEWDAGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 TLPYSVADLEWDAGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLF
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE1 GDRFYTFICSVCSSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GDRFYTFICSVCSSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENW
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE1 DRLHPGELADTPKSERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPVPPNVAFK
::::::::::::::::::::::::::::::
CCDS53 DRLHPGELADTPKSERYEHVLEALNDYKTM------------------------------
310 320 330
370 380 390 400 410 420
pF1KE1 AEKEPEGTSHEFKIKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEP
:::::::::::::::::::::::::::::::::
CCDS53 ---------------------------EVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEP
340 350 360
430 440 450 460 470 480
pF1KE1 LLDKESISENPTLDLPCSIGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGLSDSR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 LLDKESISENPTLDLPCSIGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGLSDSR
370 380 390 400 410 420
490 500 510 520 530 540
pF1KE1 KRTRTGRSWPAAIPHLRRRRGRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KRTRTGRSWPAAIPHLRRRRGRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLAD
430 440 450 460 470 480
550 560 570 580 590
pF1KE1 QELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS
:::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS
490 500 510 520 530
>>CCDS35116.1 PHF19 gene_id:26147|Hs108|chr9 (580 aa)
initn: 1651 init1: 1138 opt: 1673 Z-score: 1491.5 bits: 285.9 E(32554): 9.3e-77
Smith-Waterman score: 1686; 47.7% identity (70.8% similar) in 562 aa overlap (45-591:39-578)
20 30 40 50 60 70
pF1KE1 RSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGLFYLGTIKKINILKQ
:. ::: :: ::.:::.::: ::... ::
CCDS35 GTRDSYGATSHLPNKGALAKVKNNFKDLMSKLTEGQYVLCRWTDGLYYLGKIKRVSSSKQ
10 20 30 40 50 60
80 90 100 110 120 130
pF1KE1 SCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMVICDKCGQGYHQLCH
::.. :::.:: :::::::: ... . : :.:: . : ::..:: ::: :::: ::
CCDS35 SCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNICLGKTSGPLNEILICGKCGLGYHQQCH
70 80 90 100 110 120
140 150 160 170 180 190
pF1KE1 TPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEWDAG
: :. :.::.:.:: ....::::::: :..::..:..: :. .::::.
CCDS35 IPIAGSADQPLLTPWFCRRCIFALAVRKGGALKKGAIARTLQAVKMVLSYQPEELEWDSP
130 140 150 160 170 180
200 210 220 230 240 250
pF1KE1 HKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFYTFICSVCSS
:.:: :::::::::::.:::.:::: .:.:::::::.:::..::.:::::: :.::::..
CCDS35 HRTNQQQCYCYCGGPGEWYLRMLQCYRCRQWFHEACTQCLNEPMMFGDRFYLFFCSVCNQ
190 200 210 220 230 240
260 270 280 290 300 310
pF1KE1 GPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHPGELADTPKS
::::..::::.:::..:: ::::.: :::::: : :.....:..:. :. :.:..:: .
CCDS35 GPEYIERLPLRWVDVVHLALYNLGVQSKKKYFDFE-EILAFVNHHWELLQLGKLTSTPVT
250 260 270 280 290 300
320 330 340 350 360 370
pF1KE1 ERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPVPPNVAFKAEKE-PEGTSHEFK
.: :.:.:::.::. :. :::::::: .: ::::::: ::. . . :. .: .
CCDS35 DRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRIRVPPNPPGKLLPDKGLLPNENSASSE
310 320 330 340 350 360
380 390 400 410 420 430
pF1KE1 IKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEPLLDKESI-SENPT
.. : ::: .: .. .:. : : :.. . : : : : : :
CCDS35 LRKRGKSKPGLLPHEFQQ------QKRRVYRRK---RSKFLLEDAIPSSDFTSAWSTNHH
370 380 390 400 410
440 450 460 470 480
pF1KE1 L----DLPCSIGRTEGTAHSSNT--SDVDFTGASSAKETTSSSISRHYGLS-DSRKRTRT
: :. . .. .: :..: :::: : :.:.. ..:.:.: . :::: .
CCDS35 LASIFDFTLDEIQSLKSASSGQTFFSDVDSTDAASTSGSASTSLSYDSRWTVGSRKRKLA
420 430 440 450 460 470
490 500 510 520 530
pF1KE1 GRSWPAAIPHLRRRR------GRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLA
.... .: :: .: :: : . : . ::: ... :. ...
CCDS35 AKAY---MP-LRAKRWAAELDGRCPSDSSAEGASVPERPDEGIDSHTFE--------SIS
480 490 500 510 520
540 550 560 570 580 590
pF1KE1 DQELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS
... .:.:::.:::.:::::::.::::::.::::::: .:::::::::::.:
CCDS35 EDDSSLSHLKSSITNYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGTTPY
530 540 550 560 570 580
>>CCDS75889.1 PHF19 gene_id:26147|Hs108|chr9 (599 aa)
initn: 1651 init1: 1138 opt: 1673 Z-score: 1491.3 bits: 286.0 E(32554): 9.6e-77
Smith-Waterman score: 1686; 47.7% identity (70.8% similar) in 562 aa overlap (45-591:58-597)
20 30 40 50 60 70
pF1KE1 RSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGLFYLGTIKKINILKQ
:. ::: :: ::.:::.::: ::... ::
CCDS75 GTRDSYGATSHLPNKGALAKVKNNFKDLMSKLTEGQYVLCRWTDGLYYLGKIKRVSSSKQ
30 40 50 60 70 80
80 90 100 110 120 130
pF1KE1 SCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMVICDKCGQGYHQLCH
::.. :::.:: :::::::: ... . : :.:: . : ::..:: ::: :::: ::
CCDS75 SCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNICLGKTSGPLNEILICGKCGLGYHQQCH
90 100 110 120 130 140
140 150 160 170 180 190
pF1KE1 TPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEWDAG
: :. :.::.:.:: ....::::::: :..::..:..: :. .::::.
CCDS75 IPIAGSADQPLLTPWFCRRCIFALAVRKGGALKKGAIARTLQAVKMVLSYQPEELEWDSP
150 160 170 180 190 200
200 210 220 230 240 250
pF1KE1 HKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFYTFICSVCSS
:.:: :::::::::::.:::.:::: .:.:::::::.:::..::.:::::: :.::::..
CCDS75 HRTNQQQCYCYCGGPGEWYLRMLQCYRCRQWFHEACTQCLNEPMMFGDRFYLFFCSVCNQ
210 220 230 240 250 260
260 270 280 290 300 310
pF1KE1 GPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHPGELADTPKS
::::..::::.:::..:: ::::.: :::::: : :.....:..:. :. :.:..:: .
CCDS75 GPEYIERLPLRWVDVVHLALYNLGVQSKKKYFDFE-EILAFVNHHWELLQLGKLTSTPVT
270 280 290 300 310 320
320 330 340 350 360 370
pF1KE1 ERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPVPPNVAFKAEKE-PEGTSHEFK
.: :.:.:::.::. :. :::::::: .: ::::::: ::. . . :. .: .
CCDS75 DRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRIRVPPNPPGKLLPDKGLLPNENSASSE
330 340 350 360 370 380
380 390 400 410 420 430
pF1KE1 IKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEPLLDKESI-SENPT
.. : ::: .: .. .:. : : :.. . : : : : : :
CCDS75 LRKRGKSKPGLLPHEFQQ------QKRRVYRRK---RSKFLLEDAIPSSDFTSAWSTNHH
390 400 410 420 430
440 450 460 470 480
pF1KE1 L----DLPCSIGRTEGTAHSSNT--SDVDFTGASSAKETTSSSISRHYGLS-DSRKRTRT
: :. . .. .: :..: :::: : :.:.. ..:.:.: . :::: .
CCDS75 LASIFDFTLDEIQSLKSASSGQTFFSDVDSTDAASTSGSASTSLSYDSRWTVGSRKRKLA
440 450 460 470 480 490
490 500 510 520 530
pF1KE1 GRSWPAAIPHLRRRR------GRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLA
.... .: :: .: :: : . : . ::: ... :. ...
CCDS75 AKAY---MP-LRAKRWAAELDGRCPSDSSAEGASVPERPDEGIDSHTFE--------SIS
500 510 520 530 540
540 550 560 570 580 590
pF1KE1 DQELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS
... .:.:::.:::.:::::::.::::::.::::::: .:::::::::::.:
CCDS75 EDDSSLSHLKSSITNYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGTTPY
550 560 570 580 590
>>CCDS4777.1 PHF1 gene_id:5252|Hs108|chr6 (567 aa)
initn: 1416 init1: 1322 opt: 1355 Z-score: 1209.8 bits: 233.8 E(32554): 4.6e-61
Smith-Waterman score: 1426; 41.5% identity (64.9% similar) in 559 aa overlap (42-589:27-563)
20 30 40 50 60 70
pF1KE1 VHKRSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGLFYLGTIKKINI
: .. :::::::::.:::.:::::::..
CCDS47 MAQPPRLSRSGASSLWDPASPAPTSGPRPRLWEGQDVLARWTDGLLYLGTIKKVDS
10 20 30 40 50
80 90 100 110 120 130
pF1KE1 LKQSCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMVICDKCGQGYHQ
.. :.. :::.:. ::::::. .: . :..: .:. : :..: :.:: ..:::
CCDS47 AREVCLVQFEDDSQFLVLWKDISPAALPGEELLCCVCRSETVVPGNRLVSCEKCRHAYHQ
60 70 80 90 100 110
140 150 160 170 180 190
pF1KE1 LCHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEW
::.:. . .:.::::::: .::::::::::: :.:. :: .:::.. :.:
CCDS47 DCHVPRAPAPGEGEGTSWVCRQCVFAIATKRGGALKKGPYARAMLGMKLSLPYGLKGLDW
120 130 140 150 160 170
200 210 220 230 240 250
pF1KE1 DAGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFYTFICSV
:::: .: :: ::::::::.: :::::: .: :::::::.:::.::.:.::::: : : :
CCDS47 DAGHLSNRQQSYCYCGGPGEWNLKMLQCRSCLQWFHEACTQCLSKPLLYGDRFYEFECCV
180 190 200 210 220 230
260 270 280 290 300 310
pF1KE1 CSSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHPGELADT
: .::: ..:: :.:::.::: ::.::: :::::: . :.. . .:::: : :::.::
CCDS47 CRGGPEKVRRLQLRWVDVAHLVLYHLSVCCKKKYFDFDREILPFTSENWDSLLLGELSDT
240 250 260 270 280 290
320 330 340 350 360
pF1KE1 PKSERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPV--PPN-----VAFKAEKE
::.:: ..: :::..: :.::.::::.: ::::. :.:: ::. ..: . .
CCDS47 PKGERSSRLLSALNSHKDRFISGREIKKRKCLFGLHARMPPPVEPPTGDGALTSFPSGQG
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE1 PEG-TSHEFKIKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYT---RKMIQKTAEP
: : .:. . . : .:. :. .. .:. : ..: : : : .:.. .
CCDS47 PGGGVSRPLGKRRRPEPEPL--RRRQKGKVEELGPPSAVRNQPEPQEQRERAHLQRALQA
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE1 LLDKESISENPTLDLPCSIGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGLSDSR
.. : : : . . . . :. .: . . :: ..... : : : :
CCDS47 SVSPPSPSPNQSYQGSSGYNFRPTDARCLPSSPIRMF-ASFHPSASTAGTSGDSGPPD-R
420 430 440 450 460 470
490 500 510 520 530 540
pF1KE1 KRTRTGRSWPAAIPHLRRRRGRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLAD
. . ..:. ::. :. .. ...: . . . : . . . .:.
CCDS47 SPLELHIGFPTDIPK------SAPH-SMTASSSSVSSPSPGLPRRSAPP--SPLCRSLSP
480 490 500 510 520
550 560 570 580 590
pF1KE1 QELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS
.. . :..: .. :. ::::::: ::.::::::: :
CCDS47 ---------GTGGGVRGGVGYLSRGDPVRVLARRVRPDGSVQYLVEWGGGGIF
530 540 550 560
>>CCDS4778.1 PHF1 gene_id:5252|Hs108|chr6 (457 aa)
initn: 1322 init1: 1322 opt: 1336 Z-score: 1194.3 bits: 230.6 E(32554): 3.3e-60
Smith-Waterman score: 1336; 47.4% identity (68.2% similar) in 424 aa overlap (42-460:27-446)
20 30 40 50 60 70
pF1KE1 VHKRSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGLFYLGTIKKINI
: .. :::::::::.:::.:::::::..
CCDS47 MAQPPRLSRSGASSLWDPASPAPTSGPRPRLWEGQDVLARWTDGLLYLGTIKKVDS
10 20 30 40 50
80 90 100 110 120 130
pF1KE1 LKQSCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMVICDKCGQGYHQ
.. :.. :::.:. ::::::. .: . :..: .:. : :..: :.:: ..:::
CCDS47 AREVCLVQFEDDSQFLVLWKDISPAALPGEELLCCVCRSETVVPGNRLVSCEKCRHAYHQ
60 70 80 90 100 110
140 150 160 170 180 190
pF1KE1 LCHTPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEW
::.:. . .:.::::::: .::::::::::: :.:. :: .:::.. :.:
CCDS47 DCHVPRAPAPGEGEGTSWVCRQCVFAIATKRGGALKKGPYARAMLGMKLSLPYGLKGLDW
120 130 140 150 160 170
200 210 220 230 240 250
pF1KE1 DAGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFYTFICSV
:::: .: :: ::::::::.: :::::: .: :::::::.:::.::.:.::::: : : :
CCDS47 DAGHLSNRQQSYCYCGGPGEWNLKMLQCRSCLQWFHEACTQCLSKPLLYGDRFYEFECCV
180 190 200 210 220 230
260 270 280 290 300 310
pF1KE1 CSSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHPGELADT
: .::: ..:: :.:::.::: ::.::: :::::: . :.. . .:::: : :::.::
CCDS47 CRGGPEKVRRLQLRWVDVAHLVLYHLSVCCKKKYFDFDREILPFTSENWDSLLLGELSDT
240 250 260 270 280 290
320 330 340 350 360
pF1KE1 PKSERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPV--PPN---VAFKAEKEPE
::.:: ..: :::..: :.::.::::.: ::::. :.:: ::. . .: .
CCDS47 PKGERSSRLLSALNSHKDRFISGREIKKRKCLFGLHARMPPPVEPPTGDGALTRAGPWGR
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE1 GTSHEFKIKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEPLLDKES
: . . : : ... :.: .. . .: :: . ..:: :
CCDS47 GLTSPGEAPEAGARAPEEEAEGESGGAGATLSSAQSARAPGA---EGAGSSAEGTAAAPS
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE1 ISENPTLDLPCSIGRTEGTAHSSNTSDVDFTGASSAKETTSSSISRHYGLSDSRKRTRTG
:. :: : ::. .. .:: .:
CCDS47 GCLLPSTLLPAPQGPL-GTVDPQTGHPWNFTLVSPQTSLKVPPTR
420 430 440 450
490 500 510 520 530 540
pF1KE1 RSWPAAIPHLRRRRGRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLADQELQLN
>>CCDS69648.1 PHF19 gene_id:26147|Hs108|chr9 (371 aa)
initn: 942 init1: 429 opt: 964 Z-score: 865.9 bits: 169.5 E(32554): 6.6e-42
Smith-Waterman score: 977; 45.0% identity (68.3% similar) in 391 aa overlap (216-591:1-369)
190 200 210 220 230 240
pF1KE1 VADLEWDAGHKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFY
:::: .:.:::::::.:::..::.::::::
CCDS69 MLQCYRCRQWFHEACTQCLNEPMMFGDRFY
10 20 30
250 260 270 280 290 300
pF1KE1 TFICSVCSSGPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHP
:.::::..::::..::::.:::..:: ::::.: :::::: : :.....:..:. :.
CCDS69 LFFCSVCNQGPEYIERLPLRWVDVVHLALYNLGVQSKKKYFDFE-EILAFVNHHWELLQL
40 50 60 70 80
310 320 330 340 350 360
pF1KE1 GELADTPKSERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPVPPNVAFKAEKE-
:.:..:: ..: :.:.:::.::. :. :::::::: .: ::::::: ::. . .
CCDS69 GKLTSTPVTDRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRIRVPPNPPGKLLPDKGLL
90 100 110 120 130 140
370 380 390 400 410 420
pF1KE1 PEGTSHEFKIKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEPLLDK
:. .: ... : ::: .: .. .:. : : :.. . : : :
CCDS69 PNENSASSELRKRGKSKPGLLPHEFQQ------QKRRVYRRK---RSKFLLEDAIPSSDF
150 160 170 180 190 200
430 440 450 460 470
pF1KE1 ESI-SENPTL----DLPCSIGRTEGTAHSSNT--SDVDFTGASSAKETTSSSISRHYGLS
: : : : :. . .. .: :..: :::: : :.:.. ..:.:.: .
CCDS69 TSAWSTNHHLASIFDFTLDEIQSLKSASSGQTFFSDVDSTDAASTSGSASTSLSYDSRWT
210 220 230 240 250 260
480 490 500 510 520 530
pF1KE1 -DSRKRTRTGRSWPAAIPHLRRRR------GRLPRRALQTQNSEIVKDDEGKEDYQFDEL
:::: ... : .: :: .: :: : . : . ::: ... :.
CCDS69 VGSRKRKLAAK---AYMP-LRAKRWAAELDGRCPSDSSAEGASVPERPDEGIDSHTFE--
270 280 290 300 310
540 550 560 570 580 590
pF1KE1 NTEILNNLADQELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGA
...... .:.:::.:::.:::::::.::::::.::::::: .:::::::::::.
CCDS69 ------SISEDDSSLSHLKSSITNYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGT
320 330 340 350 360
pF1KE1 TAS
:
CCDS69 TPY
370
>>CCDS35117.1 PHF19 gene_id:26147|Hs108|chr9 (207 aa)
initn: 436 init1: 436 opt: 436 Z-score: 401.5 bits: 82.8 E(32554): 4.8e-16
Smith-Waterman score: 436; 50.4% identity (70.9% similar) in 117 aa overlap (45-161:39-155)
20 30 40 50 60 70
pF1KE1 RSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGLFYLGTIKKINILKQ
:. ::: :: ::.:::.::: ::... ::
CCDS35 GTRDSYGATSHLPNKGALAKVKNNFKDLMSKLTEGQYVLCRWTDGLYYLGKIKRVSSSKQ
10 20 30 40 50 60
80 90 100 110 120 130
pF1KE1 SCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMVICDKCGQGYHQLCH
::.. :::.:: :::::::: ... . : :.:: . : ::..:: ::: :::: ::
CCDS35 SCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNICLGKTSGPLNEILICGKCGLGYHQQCH
70 80 90 100 110 120
140 150 160 170 180 190
pF1KE1 TPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEWDAG
: :. :.::.:.:: ...
CCDS35 IPIAGSADQPLLTPWFCRRCIFALAVRVSLPSSPVPASPASSSGADQRLPSQSLSSKQKG
130 140 150 160 170 180
593 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 19:12:56 2016 done: Sun Nov 6 19:12:57 2016
Total Scan time: 3.610 Total Display time: 0.100
Function used was FASTA [36.3.4 Apr, 2011]