FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA0662, 1101 aa
1>>>pF1KSDA0662 1101 - 1101 aa - 1101 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 11.2131+/-0.00102; mu= -3.5001+/- 0.062
mean_var=310.6988+/-61.870, 0's: 0 Z-trim(114.0): 15 B-trim: 0 in 0/52
Lambda= 0.072762
statistics sampled from 14607 (14618) to 14607 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.742), E-opt: 0.2 (0.449), width: 16
Scan time: 4.640
The best scores are: opt bits E(32554)
CCDS35069.1 PHF2 gene_id:5253|Hs108|chr9 (1096) 7056 755.0 2.1e-217
CCDS55418.1 PHF8 gene_id:23133|Hs108|chrX ( 948) 1866 210.2 1.8e-53
CCDS55419.1 PHF8 gene_id:23133|Hs108|chrX ( 878) 1855 209.0 3.9e-53
CCDS14355.1 PHF8 gene_id:23133|Hs108|chrX (1024) 1855 209.0 4.4e-53
CCDS55420.1 PHF8 gene_id:23133|Hs108|chrX (1060) 1855 209.0 4.5e-53
CCDS43658.1 KDM7A gene_id:80853|Hs108|chr7 ( 941) 1723 195.1 6.1e-49
CCDS41849.1 KDM2B gene_id:84678|Hs108|chr12 (1265) 572 74.4 1.8e-12
CCDS41850.1 KDM2B gene_id:84678|Hs108|chr12 (1336) 572 74.4 1.9e-12
CCDS44657.1 KDM2A gene_id:22992|Hs108|chr11 (1162) 522 69.1 6.4e-11
>>CCDS35069.1 PHF2 gene_id:5253|Hs108|chr9 (1096 aa)
initn: 6696 init1: 6456 opt: 7056 Z-score: 4016.7 bits: 755.0 E(32554): 2.1e-217
Smith-Waterman score: 7056; 97.4% identity (97.6% similar) in 1101 aa overlap (1-1101:1-1096)
10 20 30 40 50 60
pF1KSD MATVPVYCVCRLPYDVTRPRAARPPARPGPTRAAQRRGRATAPDIDIYHCPNCEKTHGKS
:::::::::::::::::: . . . :::::::::::::::::::
CCDS35 MATVPVYCVCRLPYDVTRFMIECDACKDWFHGSCVGVEEEEAPDIDIYHCPNCEKTHGKS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD TLKKKRTWHKHGPGQAPDVKPVQNGSQLFIKELRSRTFPRAEDVVARVPGSQLTLGYMEE
::::::::::::::::::::::::::::::::::::::: ::::::::::::::::::::
CCDS35 TLKKKRTWHKHGPGQAPDVKPVQNGSQLFIKELRSRTFPSAEDVVARVPGSQLTLGYMEE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD HGFTEPILVPKKDGLGLAVPAPTFYVSDVENYVGPERSVDVTDVTKQKDCKMKLKEFVDY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 HGFTEPILVPKKDGLGLAVPAPTFYVSDVENYVGPERSVDVTDVTKQKDCKMKLKEFVDY
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD YYSTNRKRVLNVTNLEFSDTRMSSFVEPPDIVKKLSWVENYWPDDALLAKPKVTKYCLIC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 YYSTNRKRVLNVTNLEFSDTRMSSFVEPPDIVKKLSWVENYWPDDALLAKPKVTKYCLIC
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD VKDSYTDFHIDSGGASAWYHVLKGEKTFYLIRPASANISLYERWRSASNHSEMFFADQVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 VKDSYTDFHIDSGGASAWYHVLKGEKTFYLIRPASANISLYERWRSASNHSEMFFADQVD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD KCYKCIVKQGQTLFIPSGWIYATLTPVDCLAFAGHFLHSLSVEMQMRAYEVERRLKLGSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 KCYKCIVKQGQTLFIPSGWIYATLTPVDCLAFAGHFLHSLSVEMQMRAYEVERRLKLGSL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD TQFPNFETACWYMGKHLLEAFKGSHKSGKQLPPHLVQGAKILNGAFRSWTKKQALAEHED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 TQFPNFETACWYMGKHLLEAFKGSHKSGKQLPPHLVQGAKILNGAFRSWTKKQALAEHED
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD ELPEHFKPSQLIKDLAKEIRLSENASKAVRPEVNTVASSDEVCDGDREKEEPPSPIEATP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 ELPEHFKPSQLIKDLAKEIRLSENASKAVRPEVNTVASSDEVCDGDREKEEPPSPIEATP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD PQSLLEKVSKKKTPKTVKMPKPSKIPKPPKPPKPPRPPKTLKLKDGGKKKGKKSRESASP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 PQSLLEKVSKKKTPKTVKMPKPSKIPKPPKPPKPPRPPKTLKLKDGGKKKGKKSRESASP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD TIPNLDLLEAHTKEALTKMEPPKKGKATKSVLSVPNKDVVHMQNDVERLEIREQTKSKSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 TIPNLDLLEAHTKEALTKMEPPKKGKATKSVLSVPNKDVVHMQNDVERLEIREQTKSKSE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD AKWKYKNSKPDSLLKMEEEQKLEKSPLAGNKDNKFSFSFSNKKLLGSKALRPPTSPGVFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 AKWKYKNSKPDSLLKMEEEQKLEKSPLAGNKDNKFSFSFSNKKLLGSKALRPPTSPGVFG
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD ALQNFKEDKPKPVRDEYEYVSDDGELKIDEFPIRRKKNAPKRDLSFLLDKKAVLPTPVTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 ALQNFKEDKPKPVRDEYEYVSDDGELKIDEFPIRRKKNAPKRDLSFLLDKKAVLPTPVTK
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD PKLDSAAYKSDDSSDEGSLHIDTDTKPGRNARVKKESGSSAAGILDLLQASEEVGALEYN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 PKLDSAAYKSDDSSDEGSLHIDTDTKPGRNARVKKESGSSAAGILDLLQASEEVGALEYN
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD PSSQPPASPSTQEAIQGMLSMANLQASDSCLQTTWGAGQAKGSSLAAHGARKNGGGSGKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 PSSQPPASPSTQEAIQGMLSMANLQASDSCLQTTWGAGQAKGSSLAAHGARKNGGGSGKS
790 800 810 820 830 840
850 860 870 880 890 900
pF1KSD AGKRLLKRAAKNSVDLDDYEEEQDHLDACFKDSDYVYPSLESDEDNPIFKSRSKKRKGSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 AGKRLLKRAAKNSVDLDDYEEEQDHLDACFKDSDYVYPSLESDEDNPIFKSRSKKRKGSD
850 860 870 880 890 900
910 920 930 940 950 960
pF1KSD DAPYSPTARVGPSVPRQDRPVREGTRVASIETGLAAAAAKLSQQEEQKSKKKKSAKRKLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 DAPYSPTARVGPSVPRQDRPVREGTRVASIETGLAAAAAKLSQQEEQKSKKKKSAKRKLT
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KSD PNTTSPSTSTSISAGTTSTSTTPASTTPASTTPASTTPASTSTASSQASQEGSSPEPPPE
:::::::::::::::::::::::::::::::: :::::::::::::::::::::::
CCDS35 PNTTSPSTSTSISAGTTSTSTTPASTTPASTT-----PASTSTASSQASQEGSSPEPPPE
970 980 990 1000 1010
1030 1040 1050 1060 1070 1080
pF1KSD SHSSSLADHEYTAAGTFTGAQAGRTSQPMAPGVFLTQRRPSASSPNNNTAAKGKRTKKGM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 SHSSSLADHEYTAAGTFTGAQAGRTSQPMAPGVFLTQRRPSASSPNNNTAAKGKRTKKGM
1020 1030 1040 1050 1060 1070
1090 1100
pF1KSD ATAKQRLGKILKIHRNGKLLL
:::::::::::::::::::::
CCDS35 ATAKQRLGKILKIHRNGKLLL
1080 1090
>>CCDS55418.1 PHF8 gene_id:23133|Hs108|chrX (948 aa)
initn: 2802 init1: 1657 opt: 1866 Z-score: 1073.2 bits: 210.2 E(32554): 1.8e-53
Smith-Waterman score: 2749; 45.2% identity (64.5% similar) in 1121 aa overlap (1-1101:1-923)
10 20 30 40 50 60
pF1KSD MATVPVYCVCRLPYDVTRPRAARPPARPGPTRAAQRRGRATAPDIDIYHCPNCEKTHGKS
::.:::::.::::::::: . . . : :::.::::::: :: :
CCDS55 MASVPVYCLCRLPYDVTRFMIECDMCQDWFHGSCVGVEEEKAADIDLYHCPNCEVLHGPS
10 20 30 40 50 60
70 80 90 100 110
pF1KSD TLKKKRTWHK-HGPGQAPDVKPVQNGSQLFIKELRSRTFPRAEDVVARVPGSQLTLGYME
.::.: : : .. :::..:: :..::::::: ...:. . :.:::. ..:
CCDS55 IMKKRRGSSKGHDTHKG---KPVKTGSPTFVRELRSRTFDSSDEVILKPTGNQLTVEFLE
70 80 90 100 110
120 130 140 150 160 170
pF1KSD EHGFTEPILVPKKDGLGLAVPAPTFYVSDVENYVGPERSVDVTDVTKQKDCKMKLKEFVD
:..:. :::: ::::::...:.:.: : :::.::: .. .:: :::.: :::::: .::
CCDS55 ENSFSVPILVLKKDGLGMTLPSPSFTVRDVEHYVGSDKEIDVIDVTRQADCKMKLGDFVK
120 130 140 150 160 170
180 190 200 210 220 230
pF1KSD YYYSTNRKRVLNVTNLEFSDTRMSSFVEPPDIVKKLSWVENYWPDDALLAKPKVTKYCLI
:::: .:..:::: .:::::::.:..:: : ::.::::::: ::.. .. .:.: ::::.
CCDS55 YYYSGKREKVLNVISLEFSDTRLSNLVETPKIVRKLSWVENLWPEECVFERPNVQKYCLM
180 190 200 210 220 230
240 250 260 270 280 290
pF1KSD CVKDSYTDFHIDSGGASAWYHVLKGEKTFYLIRPASANISLYERWRSASNHSEMFFADQV
:.::::::::: ::.:.::::::::: ::::::..::..:.: : :.::..::::.:::
CCDS55 SVRDSYTDFHIDFGGTSVWYHVLKGEKIFYLIRPTNANLTLFECWSSSSNQNEMFFGDQV
240 250 260 270 280 290
300 310 320 330 340 350
pF1KSD DKCYKCIVKQGQTLFIPSGWIYATLTPVDCLAFAGHFLHSLSVEMQMRAYEVERRLKLGS
:::::: ::::::::::.:::.:.:::::::::.:.:::::..:::..:::.:.::. ..
CCDS55 DKCYKCSVKQGQTLFIPTGWIHAVLTPVDCLAFGGNFLHSLNIEMQLKAYEIEKRLSTAD
300 310 320 330 340 350
360 370 380 390 400 410
pF1KSD LTQFPNFETACWYMGKHLLEAFKGSHKSGKQLPPHLVQGAKILNGAFRSWTKKQALAEHE
: .:::::: :::.:::.:. :.: ... .. .::.:.: :: :::.::.:.:: .::
CCDS55 LFRFPNFETICWYVGKHILDIFRGLRENRRHPASYLVHGGKALNLAFRAWTRKEALPDHE
360 370 380 390 400 410
420 430 440 450 460 470
pF1KSD DELPEHFKPSQLIKDLAKEIRLSE-NASKAVRPEVNTVASSDEVCDGDREKEEPPSPIEA
::.:: . :::::::.:::: : : . : : .: . . : ...
CCDS55 DEIPETVRTVQLIKDLAREIRLVEFNITGA--------------CLNDSDDDSPDLDLDG
420 430 440 450 460
480 490 500 510 520 530
pF1KSD TPPQSLLEKVSKKKTPKTVKMPKPSKIPKPPKPPKPPRPPKTLKLKDGGKKKGKKSRESA
. . : .: ...:. :. :
CCDS55 N------------------------------------ESPLALLMSNGSTKRVK------
470 480
540 550 560 570 580 590
pF1KSD SPTIPNLDLLEAHTKEALTKMEPPKKGKATKSVLSVPNKDVVHMQNDVERLEIREQTKSK
.:.: .. : .:.: : :: . ::.
CCDS55 ----------------SLSK---SRRTKIAKKV-------------DKARL-MAEQV---
490 500
600 610 620 630 640 650
pF1KSD SEAKWKYKNSKPDSLLKMEEEQKLEKSPLAGNKDNKFSFSFSNKKLLGSKALRPPTSPGV
::.: :.. :...... : .. .:: :
CCDS55 -----------------MEDEFDLDS-------DDELQIDERLGKEKATLIIRPKF-PR-
510 520 530
660 670 680 690 700 710
pF1KSD FGALQNFKEDKPKPVRDEYEYVSDDGELKIDEFPIRRKKNAPKRDLSFLLDKKAVLPTPV
: . :: : . : . ::. :: :..
CCDS55 -------KLPRAKPCSDP-NRVREPGEV---EFDIEED----------------------
540 550 560
720 730 740 750 760 770
pF1KSD TKPKLDSAAYKSDDSSDEGSLHIDTDTKPGRNARVKKESGSSAAGILDLLQASEEVGALE
: .:.. :: .. : : .::.:.::::::.::..::. .
CCDS55 ---------YTTDEDMVEG-----VEGKLG--------NGSGAGGILDLLKASRQVGGPD
570 580 590 600
780 790 800 810 820 830
pF1KSD YNPSSQPPASPSTQEAIQGMLSMANLQASDSC-----LQTTWGAGQAK--GSSLAAHGAR
: .. :::::::::::::: :::::.:.: ::. : .:: . ::: .. :.
CCDS55 YAALTEAPASPSTQEAIQGMLCMANLQSSSSSPATSSLQAWWTGGQDRSSGSSSSGLGTV
610 620 630 640 650 660
840 850 860 870 880
pF1KSD KNGGGSGKSAGKRLLKRAAKNSVDLDDYEE-----EQDHLDACFKDSDYVYPSLESDEDN
.:. .: .. ::: .:: : .. .. :: ::: : :::::..:.:::::::.:.
CCDS55 SNSPASQRTPGKRPIKRPAYWRTESEEEEENASLDEQDSLGACFKDAEYIYPSLESDDDD
670 680 690 700 710 720
890 900 910 920 930 940
pF1KSD PIFKSRSKKRKGSDDAPYSPTARVGPSVPRQDRPVREGTRVASIETGLAAAAAKLSQQEE
: .::: ::.:.:::::.:: ::: :..:.:::::::::::::::::::::::::.:::
CCDS55 PALKSRPKKKKNSDDAPWSPKARVTPTLPKQDRPVREGTRVASIETGLAAAAAKLAQQEL
730 740 750 760 770 780
950 960 970 980 990 1000
pF1KSD QKSKKKKSAKRK-LTPNTTSPSTSTSISAGTTSTSTTPASTTPASTTPASTTPASTSTAS
::..::: :.: : .. .: : ... . :.:: :. :. . ..
CCDS55 QKAQKKKYIKKKPLLKEVEQPR---------------PQDSNLSLTVPAPTVAATPQLVT
790 800 810 820
1010 1020 1030 1040 1050 1060
pF1KSD SQASQEGSSPEPPPESH----SSSLADHEYTA-AGTFTGAQAGRTSQPMAPGVFLTQRRP
: ::: :::: . :.::::::::: ..: :::.:.. :::::::::::::
CCDS55 S------SSPLPPPEPKQEALSGSLADHEYTARPNAFGMAQANRSTTPMAPGVFLTQRRP
830 840 850 860 870 880
1070 1080 1090 1100
pF1KSD SASSPNNNTAAKGKRTKKGMATAKQRLGKILKIHRNGKLLL
:..: ..: :..::: :::.::::::::.::::::::::::
CCDS55 SVGS-QSNQAGQGKRPKKGLATAKQRLGRILKIHRNGKLLLRQVIVQAECRQAIHEPKLK
890 900 910 920 930 940
CCDS55 RRDAHP
>>CCDS55419.1 PHF8 gene_id:23133|Hs108|chrX (878 aa)
initn: 2411 init1: 1659 opt: 1855 Z-score: 1067.5 bits: 209.0 E(32554): 3.9e-53
Smith-Waterman score: 2467; 44.4% identity (67.9% similar) in 959 aa overlap (1-944:1-866)
10 20 30 40 50 60
pF1KSD MATVPVYCVCRLPYDVTRPRAARPPARPGPTRAAQRRGRATAPDIDIYHCPNCEKTHGKS
::.:::::.::::::::: . . . : :::.::::::: :: :
CCDS55 MASVPVYCLCRLPYDVTRFMIECDMCQDWFHGSCVGVEEEKAADIDLYHCPNCEVLHGPS
10 20 30 40 50 60
70 80 90 100 110
pF1KSD TLKKKRTWHKHGPGQAPDV---KPVQNGSQLFIKELRSRTFPRAEDVVARVPGSQLTLGY
.::.: : ... :. :::..:: :..::::::: ...:. . :.:::. .
CCDS55 IMKKRR-----GSSKGHDTHKGKPVKTGSPTFVRELRSRTFDSSDEVILKPTGNQLTVEF
70 80 90 100 110
120 130 140 150 160 170
pF1KSD MEEHGFTEPILVPKKDGLGLAVPAPTFYVSDVENYVGPERSVDVTDVTKQKDCKMKLKEF
.::..:. :::: ::::::...:.:.: : :::.::: .. .:: :::.: :::::: .:
CCDS55 LEENSFSVPILVLKKDGLGMTLPSPSFTVRDVEHYVGSDKEIDVIDVTRQADCKMKLGDF
120 130 140 150 160 170
180 190 200 210 220 230
pF1KSD VDYYYSTNRKRVLNVTNLEFSDTRMSSFVEPPDIVKKLSWVENYWPDDALLAKPKVTKYC
: :::: .:..:::: .:::::::.:..:: : ::.::::::: ::.. .. .:.: :::
CCDS55 VKYYYSGKREKVLNVISLEFSDTRLSNLVETPKIVRKLSWVENLWPEECVFERPNVQKYC
180 190 200 210 220 230
240 250 260 270 280 290
pF1KSD LICVKDSYTDFHIDSGGASAWYHVLKGEKTFYLIRPASANISLYERWRSASNHSEMFFAD
:. :.::::::::: ::.:.::::::::: ::::::..::..:.: : :.::..::::.:
CCDS55 LMSVRDSYTDFHIDFGGTSVWYHVLKGEKIFYLIRPTNANLTLFECWSSSSNQNEMFFGD
240 250 260 270 280 290
300 310 320 330 340 350
pF1KSD QVDKCYKCIVKQGQTLFIPSGWIYATLTPVDCLAFAGHFLHSLSVEMQMRAYEVERRLKL
:::::::: ::::::::::.:::.:.:::::::::.:.:::::..:::..:::.:.::.
CCDS55 QVDKCYKCSVKQGQTLFIPTGWIHAVLTPVDCLAFGGNFLHSLNIEMQLKAYEIEKRLST
300 310 320 330 340 350
360 370 380 390 400 410
pF1KSD GSLTQFPNFETACWYMGKHLLEAFKGSHKSGKQLPPHLVQGAKILNGAFRSWTKKQALAE
..: .:::::: :::.:::.:. :.: ... .. .::.:.: :: :::.::.:.:: .
CCDS55 ADLFRFPNFETICWYVGKHILDIFRGLRENRRHPASYLVHGGKALNLAFRAWTRKEALPD
360 370 380 390 400 410
420 430 440 450 460 470
pF1KSD HEDELPEHFKPSQLIKDLAKEIRLSENASKAVRPEVNTVASSDEVCDGDREKEEPPSPIE
::::.:: . :::::::.:::: :. . ..:...... .: : . :
CCDS55 HEDEIPETVRTVQLIKDLAREIRLVEDIFQ------QNVGKTSNIFGLQRI--FPAGSIP
420 430 440 450 460
480 490 500 510 520 530
pF1KSD ATPPQSLLEKVSKKKTPKTVKMPKPSKIPKPPKPPKPPRPPKTLKLKDGGKKKGKKSRES
: : ... . . .. ::: . : :: : : : ...:::.:
CCDS55 LTRP-------AHSTSVSMSRLSLPSKNGSKKKGLKP----KELFKK--AERKGKESSAL
470 480 490 500 510
540 550 560 570 580 590
pF1KSD ASPTIPNLDLLEAHTKEALTKMEPPKKGKATKSVLSVPNKDVVHMQNDVERLEIREQTKS
. . .:.......:: : :. :. ... . . ..: :..
CCDS55 GPAGQLSYNLMDTYSHQAL------KTGSFQKAKFNITGACLNDSDDDSPDLDLD-----
520 530 540 550 560
600 610 620 630 640 650
pF1KSD KSEAKWKYKNSKPDSLLKMEEEQKLEKSPLAGNKDNKFSFSFSNKKLLGSKALRPPTSPG
: .: .:: . : :: :. .. .:.. . .. .:.. ....
CCDS55 --------GNESPLALLMSNGSTKRVKS-LSKSRRTKIAKKVDKARLMAEQVME------
570 580 590 600
660 670 680 690 700 710
pF1KSD VFGALQNFKEDKPKPVRDEYEYVSDDGELKIDEFPIRRKKNAPKRDLSFLLDKKAVLPTP
::.. ::: ::.::: : : .::.:
CCDS55 -----------------DEFDLDSDD-ELQIDE---RLGK------------EKATL---
610 620 630
720 730 740 750 760 770
pF1KSD VTKPKLDSAAYKSDDSSDEGSLHIDTDTKPGRNARVKKESGSSAAGILDLLQASEEVGAL
. .::. .. :: . .. .::. .:. .. ... ... . .
CCDS55 IIRPKFPRKLPRAKPCSDPNRVR-----EPGEVEFDIEEDYTTDEDMVEGVEGYQTATPA
640 650 660 670 680
780 790 800 810 820 830
pF1KSD EYNPSSQPPASPSTQEAIQGMLSMANLQASDSC-----LQTTWGAGQAK--GSSLAAHGA
. .:. :::::::::::::: :::::.:.: ::. : .:: . ::: .. :.
CCDS55 PAQGASEAPASPSTQEAIQGMLCMANLQSSSSSPATSSLQAWWTGGQDRSSGSSSSGLGT
690 700 710 720 730 740
840 850 860 870 880
pF1KSD RKNGGGSGKSAGKRLLKRAAKNSVDLDDYEE-----EQDHLDACFKDSDYVYPSLESDED
.:. .: .. ::: .:: : .. .. :: ::: : :::::..:.:::::::.:
CCDS55 VSNSPASQRTPGKRPIKRPAYWRTESEEEEENASLDEQDSLGACFKDAEYIYPSLESDDD
750 760 770 780 790 800
890 900 910 920 930 940
pF1KSD NPIFKSRSKKRKGSDDAPYSPTARVGPSVPRQDRPVREGTRVASIETGLAAAAAKLSQQE
.: .::: ::.:.:::::.:: ::: :..:.:::::::::::::::::::::::::.::
CCDS55 DPALKSRPKKKKNSDDAPWSPKARVTPTLPKQDRPVREGTRVASIETGLAAAAAKLAQQV
810 820 830 840 850 860
950 960 970 980 990 1000
pF1KSD EQKSKKKKSAKRKLTPNTTSPSTSTSISAGTTSTSTTPASTTPASTTPASTTPASTSTAS
CCDS55 KKMKLSLTDSG
870
>>CCDS14355.1 PHF8 gene_id:23133|Hs108|chrX (1024 aa)
initn: 2804 init1: 1659 opt: 1855 Z-score: 1066.5 bits: 209.0 E(32554): 4.4e-53
Smith-Waterman score: 2969; 46.4% identity (68.7% similar) in 1123 aa overlap (1-1101:1-1024)
10 20 30 40 50 60
pF1KSD MATVPVYCVCRLPYDVTRPRAARPPARPGPTRAAQRRGRATAPDIDIYHCPNCEKTHGKS
::.:::::.::::::::: . . . : :::.::::::: :: :
CCDS14 MASVPVYCLCRLPYDVTRFMIECDMCQDWFHGSCVGVEEEKAADIDLYHCPNCEVLHGPS
10 20 30 40 50 60
70 80 90 100 110
pF1KSD TLKKKRTWHK-HGPGQAPDVKPVQNGSQLFIKELRSRTFPRAEDVVARVPGSQLTLGYME
.::.: : : .. :::..:: :..::::::: ...:. . :.:::. ..:
CCDS14 IMKKRRGSSKGHDTHKG---KPVKTGSPTFVRELRSRTFDSSDEVILKPTGNQLTVEFLE
70 80 90 100 110
120 130 140 150 160 170
pF1KSD EHGFTEPILVPKKDGLGLAVPAPTFYVSDVENYVGPERSVDVTDVTKQKDCKMKLKEFVD
:..:. :::: ::::::...:.:.: : :::.::: .. .:: :::.: :::::: .::
CCDS14 ENSFSVPILVLKKDGLGMTLPSPSFTVRDVEHYVGSDKEIDVIDVTRQADCKMKLGDFVK
120 130 140 150 160 170
180 190 200 210 220 230
pF1KSD YYYSTNRKRVLNVTNLEFSDTRMSSFVEPPDIVKKLSWVENYWPDDALLAKPKVTKYCLI
:::: .:..:::: .:::::::.:..:: : ::.::::::: ::.. .. .:.: ::::.
CCDS14 YYYSGKREKVLNVISLEFSDTRLSNLVETPKIVRKLSWVENLWPEECVFERPNVQKYCLM
180 190 200 210 220 230
240 250 260 270 280 290
pF1KSD CVKDSYTDFHIDSGGASAWYHVLKGEKTFYLIRPASANISLYERWRSASNHSEMFFADQV
:.::::::::: ::.:.::::::::: ::::::..::..:.: : :.::..::::.:::
CCDS14 SVRDSYTDFHIDFGGTSVWYHVLKGEKIFYLIRPTNANLTLFECWSSSSNQNEMFFGDQV
240 250 260 270 280 290
300 310 320 330 340 350
pF1KSD DKCYKCIVKQGQTLFIPSGWIYATLTPVDCLAFAGHFLHSLSVEMQMRAYEVERRLKLGS
:::::: ::::::::::.:::.:.:::::::::.:.:::::..:::..:::.:.::. ..
CCDS14 DKCYKCSVKQGQTLFIPTGWIHAVLTPVDCLAFGGNFLHSLNIEMQLKAYEIEKRLSTAD
300 310 320 330 340 350
360 370 380 390 400 410
pF1KSD LTQFPNFETACWYMGKHLLEAFKGSHKSGKQLPPHLVQGAKILNGAFRSWTKKQALAEHE
: .:::::: :::.:::.:. :.: ... .. .::.:.: :: :::.::.:.:: .::
CCDS14 LFRFPNFETICWYVGKHILDIFRGLRENRRHPASYLVHGGKALNLAFRAWTRKEALPDHE
360 370 380 390 400 410
420 430 440 450 460 470
pF1KSD DELPEHFKPSQLIKDLAKEIRLSENASKAVRPEVNTVASSDEVCDGDREKEEPPSPIEAT
::.:: . :::::::.:::: :. . ..:...... .: : . : :
CCDS14 DEIPETVRTVQLIKDLAREIRLVEDIFQ------QNVGKTSNIFGLQR--IFPAGSIPLT
420 430 440 450 460
480 490 500 510 520 530
pF1KSD PPQSLLEKVSKKKTPKTVKMPKPSKIPKPPKPPKPPRPPKTLKLKDGGKKKGKKSRESAS
: ... . . .. ::: . : :: : : : ...:::.: .
CCDS14 RP-------AHSTSVSMSRLSLPSKNGSKKKGLKP----KELFKK--AERKGKESSALGP
470 480 490 500 510
540 550 560 570 580 590
pF1KSD PTIPNLDLLEAHTKEALTKMEPPKKGKATKSVLSVPNKDVVHMQNDVERLEIREQTKSKS
. .:.......:: : :. :. ... . . ..: :..
CCDS14 AGQLSYNLMDTYSHQAL------KTGSFQKAKFNITGACLNDSDDDSPDLDLD-------
520 530 540 550 560
600 610 620 630 640 650
pF1KSD EAKWKYKNSKPDSLLKMEEEQKLEKSPLAGNKDNKFSFSFSNKKLLGSKALRPPTSPGVF
: .: .:: . : :: :. .. .:.. . .. .:.. ....
CCDS14 ------GNESPLALLMSNGSTKRVKS-LSKSRRTKIAKKVDKARLMAEQVME--------
570 580 590 600
660 670 680 690 700 710
pF1KSD GALQNFKEDKPKPVRDEYEYVSDDGELKIDEFPIRRKKNA---PKRDLSFLLDKKAVLPT
::.. ::: ::.::: ..: . :: .. : :.
CCDS14 ---------------DEFDLDSDD-ELQIDERLGKEKATLIIRPKFPRKLPRAKPCSDPN
610 620 630 640 650
720 730 740 750 760 770
pF1KSD PVTKPKLDSAAYKSDDSSDEGSLHIDTDTKPGRNARVKKESGSSAAGILDLLQASEEVGA
: .: . : ..:: : : .... .::.:.::::::.::..::.
CCDS14 RVREPGEVEFDIEEDYTTDE-------DMVEGVEGKLG--NGSGAGGILDLLKASRQVGG
660 670 680 690 700
780 790 800 810 820
pF1KSD LEYNPSSQPPASPSTQEAIQGMLSMANLQASDSC-----LQTTWGAGQAK--GSSLAAHG
.: .. :::::::::::::: :::::.:.: ::. : .:: . ::: .. :
CCDS14 PDYAALTEAPASPSTQEAIQGMLCMANLQSSSSSPATSSLQAWWTGGQDRSSGSSSSGLG
710 720 730 740 750 760
830 840 850 860 870 880
pF1KSD ARKNGGGSGKSAGKRLLKRAAKNSVDLDDYEE-----EQDHLDACFKDSDYVYPSLESDE
. .:. .: .. ::: .:: : .. .. :: ::: : :::::..:.:::::::.
CCDS14 TVSNSPASQRTPGKRPIKRPAYWRTESEEEEENASLDEQDSLGACFKDAEYIYPSLESDD
770 780 790 800 810 820
890 900 910 920 930 940
pF1KSD DNPIFKSRSKKRKGSDDAPYSPTARVGPSVPRQDRPVREGTRVASIETGLAAAAAKLSQQ
:.: .::: ::.:.:::::.:: ::: :..:.:::::::::::::::::::::::::.::
CCDS14 DDPALKSRPKKKKNSDDAPWSPKARVTPTLPKQDRPVREGTRVASIETGLAAAAAKLAQQ
830 840 850 860 870 880
950 960 970 980 990 1000
pF1KSD EEQKSKKKKSAKRK-LTPNTTSPSTSTSISAGTTSTSTTPASTTPASTTPASTTPASTST
: ::..::: :.: : .. .: : ... . :.:: :. :. .
CCDS14 ELQKAQKKKYIKKKPLLKEVEQPR---------------PQDSNLSLTVPAPTVAATPQL
890 900 910 920
1010 1020 1030 1040 1050
pF1KSD ASSQASQEGSSPEPPPESH----SSSLADHEYTA-AGTFTGAQAGRTSQPMAPGVFLTQR
..: ::: :::: . :.::::::::: ..: :::.:.. :::::::::::
CCDS14 VTS------SSPLPPPEPKQEALSGSLADHEYTARPNAFGMAQANRSTTPMAPGVFLTQR
930 940 950 960 970 980
1060 1070 1080 1090 1100
pF1KSD RPSASSPNNNTAAKGKRTKKGMATAKQRLGKILKIHRNGKLLL
:::..: ..: :..::: :::.::::::::.::::::::::::
CCDS14 RPSVGS-QSNQAGQGKRPKKGLATAKQRLGRILKIHRNGKLLL
990 1000 1010 1020
>>CCDS55420.1 PHF8 gene_id:23133|Hs108|chrX (1060 aa)
initn: 2804 init1: 1659 opt: 1855 Z-score: 1066.3 bits: 209.0 E(32554): 4.5e-53
Smith-Waterman score: 2969; 46.4% identity (68.7% similar) in 1123 aa overlap (1-1101:37-1060)
10 20 30
pF1KSD MATVPVYCVCRLPYDVTRPRAARPPARPGP
::.:::::.::::::::: .
CCDS55 IVQRGRVLPPPAPLDTTNLAGRRTLQGRAKMASVPVYCLCRLPYDVTRFMIECDMCQDWF
10 20 30 40 50 60
40 50 60 70 80
pF1KSD TRAAQRRGRATAPDIDIYHCPNCEKTHGKSTLKKKRTWHK-HGPGQAPDVKPVQNGSQLF
. . : :::.::::::: :: : .::.: : : .. :::..:: :
CCDS55 HGSCVGVEEEKAADIDLYHCPNCEVLHGPSIMKKRRGSSKGHDTHKG---KPVKTGSPTF
70 80 90 100 110 120
90 100 110 120 130 140
pF1KSD IKELRSRTFPRAEDVVARVPGSQLTLGYMEEHGFTEPILVPKKDGLGLAVPAPTFYVSDV
..::::::: ...:. . :.:::. ..::..:. :::: ::::::...:.:.: : ::
CCDS55 VRELRSRTFDSSDEVILKPTGNQLTVEFLEENSFSVPILVLKKDGLGMTLPSPSFTVRDV
130 140 150 160 170 180
150 160 170 180 190 200
pF1KSD ENYVGPERSVDVTDVTKQKDCKMKLKEFVDYYYSTNRKRVLNVTNLEFSDTRMSSFVEPP
:.::: .. .:: :::.: :::::: .:: :::: .:..:::: .:::::::.:..:: :
CCDS55 EHYVGSDKEIDVIDVTRQADCKMKLGDFVKYYYSGKREKVLNVISLEFSDTRLSNLVETP
190 200 210 220 230 240
210 220 230 240 250 260
pF1KSD DIVKKLSWVENYWPDDALLAKPKVTKYCLICVKDSYTDFHIDSGGASAWYHVLKGEKTFY
::.::::::: ::.. .. .:.: ::::. :.::::::::: ::.:.::::::::: ::
CCDS55 KIVRKLSWVENLWPEECVFERPNVQKYCLMSVRDSYTDFHIDFGGTSVWYHVLKGEKIFY
250 260 270 280 290 300
270 280 290 300 310 320
pF1KSD LIRPASANISLYERWRSASNHSEMFFADQVDKCYKCIVKQGQTLFIPSGWIYATLTPVDC
::::..::..:.: : :.::..::::.::::::::: ::::::::::.:::.:.::::::
CCDS55 LIRPTNANLTLFECWSSSSNQNEMFFGDQVDKCYKCSVKQGQTLFIPTGWIHAVLTPVDC
310 320 330 340 350 360
330 340 350 360 370 380
pF1KSD LAFAGHFLHSLSVEMQMRAYEVERRLKLGSLTQFPNFETACWYMGKHLLEAFKGSHKSGK
:::.:.:::::..:::..:::.:.::. ..: .:::::: :::.:::.:. :.: ... .
CCDS55 LAFGGNFLHSLNIEMQLKAYEIEKRLSTADLFRFPNFETICWYVGKHILDIFRGLRENRR
370 380 390 400 410 420
390 400 410 420 430 440
pF1KSD QLPPHLVQGAKILNGAFRSWTKKQALAEHEDELPEHFKPSQLIKDLAKEIRLSENASKAV
. .::.:.: :: :::.::.:.:: .::::.:: . :::::::.:::: :. .
CCDS55 HPASYLVHGGKALNLAFRAWTRKEALPDHEDEIPETVRTVQLIKDLAREIRLVEDIFQ--
430 440 450 460 470 480
450 460 470 480 490 500
pF1KSD RPEVNTVASSDEVCDGDREKEEPPSPIEATPPQSLLEKVSKKKTPKTVKMPKPSKIPKPP
..:...... .: : . : : : ... . . .. ::: .
CCDS55 ----QNVGKTSNIFGLQR--IFPAGSIPLTRP-------AHSTSVSMSRLSLPSKNGSKK
490 500 510 520
510 520 530 540 550 560
pF1KSD KPPKPPRPPKTLKLKDGGKKKGKKSRESASPTIPNLDLLEAHTKEALTKMEPPKKGKATK
: :: : : : ...:::.: . . .:.......:: : :. :
CCDS55 KGLKP----KELFKK--AERKGKESSALGPAGQLSYNLMDTYSHQAL------KTGSFQK
530 540 550 560 570
570 580 590 600 610 620
pF1KSD SVLSVPNKDVVHMQNDVERLEIREQTKSKSEAKWKYKNSKPDSLLKMEEEQKLEKSPLAG
. ... . . ..: :.. : .: .:: . : :: :.
CCDS55 AKFNITGACLNDSDDDSPDLDLD-------------GNESPLALLMSNGSTKRVKS-LSK
580 590 600 610 620
630 640 650 660 670 680
pF1KSD NKDNKFSFSFSNKKLLGSKALRPPTSPGVFGALQNFKEDKPKPVRDEYEYVSDDGELKID
.. .:.. . .. .:.. .... ::.. ::: ::.::
CCDS55 SRRTKIAKKVDKARLMAEQVME-----------------------DEFDLDSDD-ELQID
630 640 650
690 700 710 720 730 740
pF1KSD EFPIRRKKNA---PKRDLSFLLDKKAVLPTPVTKPKLDSAAYKSDDSSDEGSLHIDTDTK
: ..: . :: .. : :. : .: . : ..:: :
CCDS55 ERLGKEKATLIIRPKFPRKLPRAKPCSDPNRVREPGEVEFDIEEDYTTDE-------DMV
660 670 680 690 700 710
750 760 770 780 790 800
pF1KSD PGRNARVKKESGSSAAGILDLLQASEEVGALEYNPSSQPPASPSTQEAIQGMLSMANLQA
: .... .::.:.::::::.::..::. .: .. :::::::::::::: :::::.
CCDS55 EGVEGKLG--NGSGAGGILDLLKASRQVGGPDYAALTEAPASPSTQEAIQGMLCMANLQS
720 730 740 750 760
810 820 830 840 850
pF1KSD SDSC-----LQTTWGAGQAK--GSSLAAHGARKNGGGSGKSAGKRLLKRAAKNSVDLDDY
:.: ::. : .:: . ::: .. :. .:. .: .. ::: .:: : .. ..
CCDS55 SSSSPATSSLQAWWTGGQDRSSGSSSSGLGTVSNSPASQRTPGKRPIKRPAYWRTESEEE
770 780 790 800 810 820
860 870 880 890 900 910
pF1KSD EE-----EQDHLDACFKDSDYVYPSLESDEDNPIFKSRSKKRKGSDDAPYSPTARVGPSV
:: ::: : :::::..:.:::::::.:.: .::: ::.:.:::::.:: ::: :..
CCDS55 EENASLDEQDSLGACFKDAEYIYPSLESDDDDPALKSRPKKKKNSDDAPWSPKARVTPTL
830 840 850 860 870 880
920 930 940 950 960 970
pF1KSD PRQDRPVREGTRVASIETGLAAAAAKLSQQEEQKSKKKKSAKRK-LTPNTTSPSTSTSIS
:.:::::::::::::::::::::::::.::: ::..::: :.: : .. .:
CCDS55 PKQDRPVREGTRVASIETGLAAAAAKLAQQELQKAQKKKYIKKKPLLKEVEQPR------
890 900 910 920 930 940
980 990 1000 1010 1020
pF1KSD AGTTSTSTTPASTTPASTTPASTTPASTSTASSQASQEGSSPEPPPESH----SSSLADH
: ... . :.:: :. :. . ..: ::: :::: . :.:::::
CCDS55 ---------PQDSNLSLTVPAPTVAATPQLVTS------SSPLPPPEPKQEALSGSLADH
950 960 970 980
1030 1040 1050 1060 1070 1080
pF1KSD EYTA-AGTFTGAQAGRTSQPMAPGVFLTQRRPSASSPNNNTAAKGKRTKKGMATAKQRLG
:::: ..: :::.:.. ::::::::::::::..: ..: :..::: :::.::::::::
CCDS55 EYTARPNAFGMAQANRSTTPMAPGVFLTQRRPSVGS-QSNQAGQGKRPKKGLATAKQRLG
990 1000 1010 1020 1030 1040
1090 1100
pF1KSD KILKIHRNGKLLL
.::::::::::::
CCDS55 RILKIHRNGKLLL
1050 1060
>>CCDS43658.1 KDM7A gene_id:80853|Hs108|chr7 (941 aa)
initn: 1995 init1: 1494 opt: 1723 Z-score: 992.2 bits: 195.1 E(32554): 6.1e-49
Smith-Waterman score: 1849; 35.4% identity (57.4% similar) in 1099 aa overlap (5-1097:37-935)
10 20 30
pF1KSD MATVPVYCVCRLPYDVTRPRAARPPARPGPTRAA
::::::: ::::.: . .
CCDS43 AVAAGAAAGAAAAAVSVAAPGRASAPPPPPPVYCVCRQPYDVNRFMIECDICKDWFHGSC
10 20 30 40 50 60
40 50 60 70 80 90
pF1KSD QRRGRATAPDIDIYHCPNCEKTHGKSTLKKKRTWHKHGPGQAPD-VKPVQNGSQLFIKEL
. : :::.:::::: ::.: .::.:.::.: . : :::: :.. :::::
CCDS43 VGVEEHHAVDIDLYHCPNCAVLHGSSLMKKRRNWHRHDYTEIDDGSKPVQAGTRTFIKEL
70 80 90 100 110 120
100 110 120 130 140 150
pF1KSD RSRTFPRAEDVVARVPGSQLTLGYMEEHGFTEPILVPKKDGLGLAVPAPTFYVSDVENYV
:::.:: :.... .. ::::: :.:.::: ::.::: : ::: .:.::: : ::: ::
CCDS43 RSRVFPSADEIIIKMHGSQLTQRYLEKHGFDVPIMVPKLDDLGLRLPSPTFSVMDVERYV
130 140 150 160 170 180
160 170 180 190 200 210
pF1KSD GPERSVDVTDVTKQKDCKMKLKEFVDYYYSTNRKRVLNVTNLEFSDTRMSSFVEPPDIVK
: .. .:: ::..: : :: :...: :... :: .:::: .::::::.:: .:: :::.:
CCDS43 GGDKVIDVIDVARQADSKMTLHNYVKYFMNPNRPKVLNVISLEFSDTKMSELVEVPDIAK
190 200 210 220 230 240
220 230 240 250 260 270
pF1KSD KLSWVENYWPDDALLAKPKVTKYCLICVKDSYTDFHIDSGGASAWYHVLKGEKTFYLIRP
::::::::::::... :: : ::::. :.::::::::: ::.:.::::: ::: ::::.:
CCDS43 KLSWVENYWPDDSVFPKPFVQKYCLMGVQDSYTDFHIDFGGTSVWYHVLWGEKIFYLIKP
250 260 270 280 290 300
280 290 300 310 320 330
pF1KSD ASANISLYERWRSASNHSEMFFADQVDKCYKCIVKQGQTLFIPSGWIYATLTPVDCLAFA
.. :.. :: : :. ..::.::.:.:::::::.::::.:::.:.:::.:.:: ::.::.
CCDS43 TDENLARYESWSSSVTQSEVFFGDKVDKCYKCVVKQGHTLFVPTGWIHAVLTSQDCMAFG
310 320 330 340 350 360
340 350 360 370 380 390
pF1KSD GHFLHSLSVEMQMRAYEVERRLKLGSLTQFPNFETACWYMGKHLLEAFKGSHKSGKQLPP
:.:::.:.. ::.: ::.:.::: .: .:: ::. ::...:.:::..: ...: :
CCDS43 GNFLHNLNIGMQLRCYEMEKRLKTPDLFKFPFFEAICWFVAKNLLETLKELREDGFQPQT
370 380 390 400 410 420
400 410 420 430 440 450
pF1KSD HLVQGAKILNGAFRSWTKKQALAEHEDELPEHFKPSQLIKDLAKEIR-LSENASKAVRPE
.::::.: :. :.. : ::. ..:: :.:.. .:..:::.:.: :: . :. .: :. .
CCDS43 YLVQGVKALHTALKLWMKKELVSEHAFEIPDNVRPGHLIKELSKVIRAIEEENGKPVKSQ
430 440 450 460 470 480
460 470 480 490 500 510
pF1KSD VNTVASSDEVCDGDREKEEPPSPIEATPPQSLLEKVSKKKTPKTVKMPKPSKIPKPPKPP
. :: .: ..: :: ..
CCDS43 GIPI-----VCPVSRSSNEATSPYHS----------------------------------
490 500
520 530 540 550 560 570
pF1KSD KPPRPPKTLKLKDGGKKKGKKSRESASPTIPNLDLLEAHTKEALTKME--PPKKGKATKS
..: .: :. : :::.:: ::.:.: ..: : .. ...
CCDS43 ---------------RRKMRKLRDHNVRTPSNLDILELHTREVLKRLEMCPWEEDILSSK
510 520 530 540 550
580 590 600 610 620 630
pF1KSD VLSVPNKDVVHMQNDVERLEIREQTKSKSEAKWKYKNSKPDSLLKMEEEQKLEKSPLAGN
. . :: :.: :.. .:. :.. :: . : :..:.: .
CCDS43 LNGKFNK---HLQ------------PSSTVPEWRAKDNDLRLLLTNGRIIKDERQPFADQ
560 570 580 590
640 650 660 670 680
pF1KSD K-DNKFSFSFSNKKLLGSKALRPPTSPGVFGALQNFKEDKPKPVRDEYEYVSDDGELKID
. . : . .:. . .. : :: :. . :.. ::. . :. .::
CCDS43 SLYTADSENEEDKRRTKKAKMKIEESSGVEGVEH---EESQKPLNGFFTRVK--SEL---
600 610 620 630 640
690 700 710 720 730 740
pF1KSD EFPIRRKKNAPKRDLSFLLDKKAVLPTPVTKPKLDSAAYKSDDSSDEGSLHIDTDTKPGR
:.... :.: :. : : : .. .:..:.:: . .: .. :
CCDS43 -----RSRSSGYSDISESEDSG---PE-CTALKSIFTTEESESSGDEKKQEITSNFKEES
650 660 670 680 690 700
750 760 770 780 790 800
pF1KSD NARVKKESGSSAAGILDLLQASEEVGALEYNPSSQPPASPSTQE-AIQGMLSMANLQASD
:. . ..:: :.. . : . . :.: ::.: :::::::::.:. :
CCDS43 NV------------MRNFLQKSQKPSRSEIPIKRECPTSTSTEEEAIQGMLSMAGLHYS-
710 720 730 740
810 820 830 840 850 860
pF1KSD SCLQTTWGAGQAKGSSLAAHGARKNGGGSGKSAGKRLLKRAAKNSVDLDDYEEEQDHLDA
.::: : .... .:.: ::. :: ..
CCDS43 TCLQR-----QIQSTD---------------CSGER-------NSL--------QDP-SS
750 760 770
870 880 890 900 910 920
pF1KSD CFKDSDYVYPSLESDEDNPIFKSRSKKRKGSDDAPYSPTARVGPSVPRQDRPVREGTRVA
: .. : :. : :. .. : : .: .: .. .
CCDS43 CHGSNHEV---------------RQLYR-------YDKPVECGYHVKTEDPDLRTSSWIK
780 790 800
930 940 950 960 970 980
pF1KSD SIETGLAAAAAKLSQQEEQKSKKKKSAKRKLTPNTTSPSTSTSISAGTTSTSTTPASTTP
...: ... :. ..:.: :: . : ... . ....: ..
CCDS43 QFDT------SRFHPQDLSRSQK---CIRKEGSSEISQRVQSRNYVDSSGSSLQNGKYMQ
810 820 830 840 850 860
990 1000 1010 1020 1030 1040
pF1KSD ASTTPASTTPASTSTASSQASQEGSSPEPPPESHSSSLADHEYTAAGTFTGAQAGRTSQP
: . .... : :. . ::: : : :. :
CCDS43 NS---------NLTSGACQISNGSLSPERPVGETSFSV---------------------P
870 880 890
1050 1060 1070 1080 1090 1100
pF1KSD MAPGVFLTQRRPSASSPNNNTAAKGKRTKKGMATAKQRLGKILKIHRNGKLLL
. : :.: : : .: :.:::: ::::::::::::::::..:::
CCDS43 LHP----TKRPASNPPPISNQATKGKRPKKGMATAKQRLGKILKLNRNGHARFFV
900 910 920 930 940
>>CCDS41849.1 KDM2B gene_id:84678|Hs108|chr12 (1265 aa)
initn: 926 init1: 549 opt: 572 Z-score: 337.3 bits: 74.4 E(32554): 1.8e-12
Smith-Waterman score: 856; 34.4% identity (63.0% similar) in 454 aa overlap (78-506:27-467)
50 60 70 80 90 100
pF1KSD YHCPNCEKTHGKSTLKKKRTWHKHGPGQAPDVKPVQNGSQLFIKE-LRSRTFPRAEDVVA
::. . . . ..: :::. . : :
CCDS41 MEAEKDSGRRLRPIDRQRYDENEDLSDVEEIVSVRGFSLEEKLRSQLYQ--GDFVH
10 20 30 40 50
110 120 130 140 150 160
pF1KSD RVPGSQLTLGYMEEHGFTEPILVPKKDGLGLAVPAPTFYVSDVENYVGPERSVDVTDVTK
. :.... :...... :.. .:::::. .: : : : ::. :: .: ::: ::.
CCDS41 AMEGKDFNYEYVQREALRVPLIFREKDGLGIKMPDPDFTVRDVKLLVGSRRLVDVMDVNT
60 70 80 90 100 110
170 180 190 200 210 220
pF1KSD QKDCKMKLKEFVDYYYS--TNRKRVLNVTNLEFSDTRMSSFVEPPDIVKKLSWVENYWPD
:: .:....:: :: . ..: .. :: .:::: :.. .:. : .: ..::.:.::.
CCDS41 QKGTEMSMSQFVRYYETPEAQRDKLYNVISLEFSHTKLEHLVKRPTVVDLVDWVDNMWPQ
120 130 140 150 160 170
230 240 250 260 270
pF1KSD D------------ALLAKPKVTKYCLICVKDSYTDFHIDSGGASAWYHVLKGEKTFYLIR
: . ::: ::::. :: .:::::: ::.:.::::..: : :.::
CCDS41 HLKEKQTEATNAIAEMKYPKVKKYCLMSVKGCFTDFHIDFGGTSVWYHVFRGGKIFWLIP
180 190 200 210 220 230
280 290 300 310 320 330
pF1KSD PASANISLYERWRSASNHSEMFFADQVDKCYKCIVKQGQTLFIPSGWIYATLTPVDCLAF
:. :..:::.: ....:..:..:.:..: . .::: :.:::::::.:. :::: :.:
CCDS41 PTLHNLALYEEWVLSGKQSDIFLGDRVERCQRIELKQGYTFFIPSGWIHAVYTPVDSLVF
240 250 260 270 280 290
340 350 360 370 380 390
pF1KSD AGHFLHSLSVEMQMRAYEVERRLKLGSLTQFPNFETACWY-MGKHLLEAFKGSHKSGK-Q
.:..:::..: ::.: ::.: : .. ..: . ::: . ... . . :: . . :
CCDS41 GGNILHSFNVPMQLRIYEIEDRTRVQPKFRYPFYYEMCWYVLERYVYCVTQRSHLTQEYQ
300 310 320 330 340 350
400 410 420 430 440
pF1KSD LPPHLVQGAKI--LNG-AFRSWTKKQALAEHEDELPEHFKPSQLIKDLAKEIRLSENASK
:... . ..: . :: . . : :. :.. . :: : : ..
CCDS41 RESMLIDAPRKPSIDGFSSDSWLEMEE--EACDQQPQEEEE----KDEEGEGR-----DR
360 370 380 390 400
450 460 470 480 490 500
pF1KSD AVRPEVNTVASSDEVCDGDREK--EEPPSPIEATPPQSLLEKV--SKKKTPKTVKMPK-P
: .: .. .: . . :.: ..: .: ..: .. : :.: .: .:: :
CCDS41 APKPPTDGSTSPTSTPSEDQEALGKKPKAPALRFLKRTLSNESEESVKSTTLAVDYPKTP
410 420 430 440 450 460
510 520 530 540 550 560
pF1KSD SKIPKPPKPPKPPRPPKTLKLKDGGKKKGKKSRESASPTIPNLDLLEAHTKEALTKMEPP
. :
CCDS41 TGSPATEVSAKWTHLTEFELKGLKALVEKLESLPENKKCVPEGIEDPQALLEGVKNVLKE
470 480 490 500 510 520
>>CCDS41850.1 KDM2B gene_id:84678|Hs108|chr12 (1336 aa)
initn: 814 init1: 549 opt: 572 Z-score: 337.0 bits: 74.4 E(32554): 1.9e-12
Smith-Waterman score: 856; 34.4% identity (63.0% similar) in 454 aa overlap (78-506:58-498)
50 60 70 80 90 100
pF1KSD YHCPNCEKTHGKSTLKKKRTWHKHGPGQAPDVKPVQNGSQLFIKE-LRSRTFPRAEDVVA
::. . . . ..: :::. . : :
CCDS41 TVIYTKCFEFESATQRPIDRQRYDENEDLSDVEEIVSVRGFSLEEKLRSQLYQ--GDFVH
30 40 50 60 70 80
110 120 130 140 150 160
pF1KSD RVPGSQLTLGYMEEHGFTEPILVPKKDGLGLAVPAPTFYVSDVENYVGPERSVDVTDVTK
. :.... :...... :.. .:::::. .: : : : ::. :: .: ::: ::.
CCDS41 AMEGKDFNYEYVQREALRVPLIFREKDGLGIKMPDPDFTVRDVKLLVGSRRLVDVMDVNT
90 100 110 120 130 140
170 180 190 200 210 220
pF1KSD QKDCKMKLKEFVDYYYS--TNRKRVLNVTNLEFSDTRMSSFVEPPDIVKKLSWVENYWPD
:: .:....:: :: . ..: .. :: .:::: :.. .:. : .: ..::.:.::.
CCDS41 QKGTEMSMSQFVRYYETPEAQRDKLYNVISLEFSHTKLEHLVKRPTVVDLVDWVDNMWPQ
150 160 170 180 190 200
230 240 250 260 270
pF1KSD D------------ALLAKPKVTKYCLICVKDSYTDFHIDSGGASAWYHVLKGEKTFYLIR
: . ::: ::::. :: .:::::: ::.:.::::..: : :.::
CCDS41 HLKEKQTEATNAIAEMKYPKVKKYCLMSVKGCFTDFHIDFGGTSVWYHVFRGGKIFWLIP
210 220 230 240 250 260
280 290 300 310 320 330
pF1KSD PASANISLYERWRSASNHSEMFFADQVDKCYKCIVKQGQTLFIPSGWIYATLTPVDCLAF
:. :..:::.: ....:..:..:.:..: . .::: :.:::::::.:. :::: :.:
CCDS41 PTLHNLALYEEWVLSGKQSDIFLGDRVERCQRIELKQGYTFFIPSGWIHAVYTPVDSLVF
270 280 290 300 310 320
340 350 360 370 380 390
pF1KSD AGHFLHSLSVEMQMRAYEVERRLKLGSLTQFPNFETACWY-MGKHLLEAFKGSHKSGK-Q
.:..:::..: ::.: ::.: : .. ..: . ::: . ... . . :: . . :
CCDS41 GGNILHSFNVPMQLRIYEIEDRTRVQPKFRYPFYYEMCWYVLERYVYCVTQRSHLTQEYQ
330 340 350 360 370 380
400 410 420 430 440
pF1KSD LPPHLVQGAKI--LNG-AFRSWTKKQALAEHEDELPEHFKPSQLIKDLAKEIRLSENASK
:... . ..: . :: . . : :. :.. . :: : : ..
CCDS41 RESMLIDAPRKPSIDGFSSDSWLEMEE--EACDQQPQEEEE----KDEEGEGR-----DR
390 400 410 420 430
450 460 470 480 490 500
pF1KSD AVRPEVNTVASSDEVCDGDREK--EEPPSPIEATPPQSLLEKV--SKKKTPKTVKMPK-P
: .: .. .: . . :.: ..: .: ..: .. : :.: .: .:: :
CCDS41 APKPPTDGSTSPTSTPSEDQEALGKKPKAPALRFLKRTLSNESEESVKSTTLAVDYPKTP
440 450 460 470 480 490
510 520 530 540 550 560
pF1KSD SKIPKPPKPPKPPRPPKTLKLKDGGKKKGKKSRESASPTIPNLDLLEAHTKEALTKMEPP
. :
CCDS41 TGSPATEVSAKWTHLTEFELKGLKALVEKLESLPENKKCVPEGIEDPQALLEGVKNVLKE
500 510 520 530 540 550
>>CCDS44657.1 KDM2A gene_id:22992|Hs108|chr11 (1162 aa)
initn: 692 init1: 517 opt: 522 Z-score: 309.5 bits: 69.1 E(32554): 6.4e-11
Smith-Waterman score: 805; 33.1% identity (65.4% similar) in 402 aa overlap (85-467:34-431)
60 70 80 90 100 110
pF1KSD KTHGKSTLKKKRTWHKHGPGQAPDVKPVQNGSQLFIKELRSRTFPRAEDVVARVPGSQLT
:.. : : . .: . :. . :....
CCDS44 EEERIRYSQRLRGTMRRRYEDDGISDDEIEGKRTFDLEEKLHTNKYNANFVTFMEGKDFN
10 20 30 40 50 60
120 130 140 150 160 170
pF1KSD LGYMEEHGFTEPILVPKKDGLGLAVPAPTFYVSDVENYVGPERSVDVTDVTKQKDCKMKL
. :... :. .:.. ..::::. .: : : :.::. :: .: ::: ::. :: .: .
CCDS44 VEYIQRGGLRDPLIFKNSDGLGIKMPDPDFTVNDVKMCVGSRRMVDVMDVNTQKGIEMTM
70 80 90 100 110 120
180 190 200 210 220
pF1KSD KEFVDYYYSTN--RKRVLNVTNLEFSDTRMSSFVEPPDIVKKLSWVENYWP---------
... :: . . :... :: .:::: ::. ..:. :. : ..::.:.::
CCDS44 AQWTRYYETPEEEREKLYNVISLEFSHTRLENMVQRPSTVDFIDWVDNMWPRHLKESQTE
130 140 150 160 170 180
230 240 250 260 270 280
pF1KSD -DDALLAK--PKVTKYCLICVKDSYTDFHIDSGGASAWYHVLKGEKTFYLIRPASANISL
.:.: ::: ::::. :. :::::.: ::.:.:::. .: :.:.:: :.. :. :
CCDS44 STNAILEMQYPKVQKYCLMSVRGCYTDFHVDFGGTSVWYHIHQGGKVFWLIPPTAHNLEL
190 200 210 220 230 240
290 300 310 320 330 340
pF1KSD YERWRSASNHSEMFFADQVDKCYKCIVKQGQTLFIPSGWIYATLTPVDCLAFAGHFLHSL
:: : .......:..:.:. : . .::: :. ::::::.:. ::.: :.:.:.::::.
CCDS44 YENWLLSGKQGDIFLGDRVSDCQRIELKQGYTFVIPSGWIHAVYTPTDTLVFGGNFLHSF
250 260 270 280 290 300
350 360 370 380 390 400
pF1KSD SVEMQMRAYEVERRLKLGSLTQFPNFETACWYMGKHLLEAFKGSHKSGKQLPPHLVQGAK
.. ::.. :..: : .. . ..: . :::. .. . . . . :.. . ..
CCDS44 NIPMQLKIYNIEDRTRVPNKFRYPFYYEMCWYVLERYVYCITNRSHLTKEFQKESLSMDL
310 320 330 340 350 360
410 420 430 440 450
pF1KSD ILNGAFRSWTKKQALAEHEDELPEHF--KPSQLIKDLAKEIRLSENA-SKAVR--PEVNT
::: . ..:. :. :... . : : . .:. . :. .. .:. : : ..
CCDS44 ELNGLESGNGDEEAV----DREPRRLSSRRSVLTSPVANGVNLDYDGLGKTCRSLPSLKK
370 380 390 400 410
460 470 480 490 500 510
pF1KSD VASSDEVCDGDREKEEPPSPIEATPPQSLLEKVSKKKTPKTVKMPKPSKIPKPPKPPKPP
. ..: : .:
CCDS44 TLAGDSSSDCSRGSHNGQVWDPQCAPRKDRQVHLTHFELEGLRCLVDKLESLPLHKKCVP
420 430 440 450 460 470
1101 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 02:35:04 2016 done: Thu Nov 3 02:35:05 2016
Total Scan time: 4.640 Total Display time: 0.340
Function used was FASTA [36.3.4 Apr, 2011]