FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9898, 2002 aa
1>>>pF1KB9898 2002 - 2002 aa - 2002 aa
Library: /omim/omim.rfq.tfa
61265892 residues in 86068 sequences
Statistics: Expectation_n fit: rho(ln(x))= 12.4615+/-0.000498; mu= -9.7689+/- 0.031
mean_var=332.6949+/-70.513, 0's: 0 Z-trim(119.1): 100 B-trim: 413 in 2/52
Lambda= 0.070316
statistics sampled from 32707 (32812) to 32707 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.688), E-opt: 0.2 (0.381), width: 16
Scan time: 20.080
The best scores are: opt bits E(86068)
NP_001120680 (OMIM: 612839,614286) methylcytosine (2002) 13593 1394.5 0
XP_005263139 (OMIM: 612839,614286) PREDICTED: meth (2002) 13593 1394.5 0
NP_060098 (OMIM: 612839,614286) methylcytosine dio (1165) 7703 796.9 0
XP_016863808 (OMIM: 612839,614286) PREDICTED: meth (1192) 7697 796.3 0
XP_006714305 (OMIM: 612839,614286) PREDICTED: meth (1902) 7697 796.3 0
XP_016859056 (OMIM: 613555) PREDICTED: methylcytos (1702) 2045 223.0 2.2e-56
XP_011530988 (OMIM: 613555) PREDICTED: methylcytos (1776) 2045 223.0 2.3e-56
NP_001274420 (OMIM: 613555) methylcytosine dioxyge (1795) 2045 223.0 2.3e-56
XP_005264244 (OMIM: 613555) PREDICTED: methylcytos (1795) 2045 223.0 2.3e-56
NP_085128 (OMIM: 607790) methylcytosine dioxygenas (2136) 1812 199.4 3.6e-49
XP_011530989 (OMIM: 613555) PREDICTED: methylcytos (1718) 1418 159.4 3.2e-37
XP_011530987 (OMIM: 613555) PREDICTED: methylcytos (1792) 1418 159.4 3.3e-37
XP_011530986 (OMIM: 613555) PREDICTED: methylcytos (1811) 1418 159.4 3.3e-37
XP_016859055 (OMIM: 613555) PREDICTED: methylcytos (1811) 1418 159.4 3.3e-37
XP_011530985 (OMIM: 613555) PREDICTED: methylcytos (1811) 1418 159.4 3.3e-37
XP_011530984 (OMIM: 613555) PREDICTED: methylcytos (1811) 1418 159.4 3.3e-37
XP_011530990 (OMIM: 613555) PREDICTED: methylcytos (1050) 1364 153.8 9.1e-36
XP_016872178 (OMIM: 607790) PREDICTED: methylcytos (1494) 1136 130.7 1.1e-28
XP_011538509 (OMIM: 607790) PREDICTED: methylcytos (1494) 1136 130.7 1.1e-28
XP_016872176 (OMIM: 607790) PREDICTED: methylcytos (1512) 1136 130.7 1.2e-28
XP_016872177 (OMIM: 607790) PREDICTED: methylcytos (1512) 1136 130.7 1.2e-28
XP_016872175 (OMIM: 607790) PREDICTED: methylcytos (1516) 1136 130.7 1.2e-28
XP_011538507 (OMIM: 607790) PREDICTED: methylcytos (1528) 1136 130.7 1.2e-28
XP_011538506 (OMIM: 607790) PREDICTED: methylcytos (2165) 1136 130.8 1.6e-28
XP_011530991 (OMIM: 613555) PREDICTED: methylcytos ( 953) 1051 122.0 3e-26
XP_011530992 (OMIM: 613555) PREDICTED: methylcytos ( 953) 1051 122.0 3e-26
XP_011538508 (OMIM: 607790) PREDICTED: methylcytos (1501) 468 63.0 2.9e-08
>>NP_001120680 (OMIM: 612839,614286) methylcytosine diox (2002 aa)
initn: 13593 init1: 13593 opt: 13593 Z-score: 7463.3 bits: 1394.5 E(86068): 0
Smith-Waterman score: 13593; 100.0% identity (100.0% similar) in 2002 aa overlap (1-2002:1-2002)
10 20 30 40 50 60
pF1KB9 MEQDRTNHVEGNRLSPFLIPSPPICQTEPLATKLQNGSPLPERAHPEVNGDTKWHSFKSY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 MEQDRTNHVEGNRLSPFLIPSPPICQTEPLATKLQNGSPLPERAHPEVNGDTKWHSFKSY
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 YGIPCMKGSQNSRVSPDFTQESRGYSKCLQNGGIKRTVSEPSLSGLLQIKKLKQDQKANG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 YGIPCMKGSQNSRVSPDFTQESRGYSKCLQNGGIKRTVSEPSLSGLLQIKKLKQDQKANG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 ERRNFGVSQERNPGESSQPNVSDLSDKKESVSSVAQENAVKDFTSFSTHNCSGPENPELQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 ERRNFGVSQERNPGESSQPNVSDLSDKKESVSSVAQENAVKDFTSFSTHNCSGPENPELQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 ILNEQEGKSANYHDKNIVLLKNKAVLMPNGATVSASSVEHTHGELLEKTLSQYYPDCVSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 ILNEQEGKSANYHDKNIVLLKNKAVLMPNGATVSASSVEHTHGELLEKTLSQYYPDCVSI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 AVQKTTSHINAINSQATNELSCEITHPSHTSGQINSAQTSNSELPPKPAAVVSEACDADD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 AVQKTTSHINAINSQATNELSCEITHPSHTSGQINSAQTSNSELPPKPAAVVSEACDADD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 ADNASKLAAMLNTCSFQKPEQLQQQKSVFEICPSPAENNIQGTTKLASGEEFCSGSSSNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 ADNASKLAAMLNTCSFQKPEQLQQQKSVFEICPSPAENNIQGTTKLASGEEFCSGSSSNL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 QAPGGSSERYLKQNEMNGAYFKQSSVFTKDSFSATTTPPPPSQLLLSPPPPLPQVPQLPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 QAPGGSSERYLKQNEMNGAYFKQSSVFTKDSFSATTTPPPPSQLLLSPPPPLPQVPQLPS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB9 EGKSTLNGGVLEEHHHYPNQSNTTLLREVKIEGKPEAPPSQSPNPSTHVCSPSPMLSERP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 EGKSTLNGGVLEEHHHYPNQSNTTLLREVKIEGKPEAPPSQSPNPSTHVCSPSPMLSERP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB9 QNNCVNRNDIQTAGTMTVPLCSEKTRPMSEHLKHNPPIFGSSGELQDNCQQLMRNKEQEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 QNNCVNRNDIQTAGTMTVPLCSEKTRPMSEHLKHNPPIFGSSGELQDNCQQLMRNKEQEI
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB9 LKGRDKEQTRDLVPPTQHYLKPGWIELKAPRFHQAESHLKRNEASLPSILQYQPNLSNQM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LKGRDKEQTRDLVPPTQHYLKPGWIELKAPRFHQAESHLKRNEASLPSILQYQPNLSNQM
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB9 TSKQYTGNSNMPGGLPRQAYTQKTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 TSKQYTGNSNMPGGLPRQAYTQKTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQV
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB9 HFSKTDHLPKAHVQSLCGTRFHFQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 HFSKTDHLPKAHVQSLCGTRFHFQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQ
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB9 HKPHKQAAQTQPSQSSHLPQNQQQQQKLQIKNKEEILQTFPHPQSNNDQQREGSFFGQTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 HKPHKQAAQTQPSQSSHLPQNQQQQQKLQIKNKEEILQTFPHPQSNNDQQREGSFFGQTK
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB9 VEECFHGENQYSKSSEFETHNVQMGLEEVQNINRRNSPYSQTMKSSACKIQVSCSNNTHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 VEECFHGENQYSKSSEFETHNVQMGLEEVQNINRRNSPYSQTMKSSACKIQVSCSNNTHL
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB9 VSENKEQTTHPELFAGNKTQNLHHMQYFPNNVIPKQDLLHRCFQEQEQKSQQASVLQGYK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 VSENKEQTTHPELFAGNKTQNLHHMQYFPNNVIPKQDLLHRCFQEQEQKSQQASVLQGYK
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB9 NRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQKDTQKHAALRWHLLQKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 NRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQKDTQKHAALRWHLLQKQ
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB9 EQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWKKVTKQENPPASCDNVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 EQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWKKVTKQENPPASCDNVQ
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB9 QKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTVLTRQTTAAELDSHTPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 QKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTVLTRQTTAAELDSHTPA
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB9 LEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVKTQYDFPSCRCVEQII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVKTQYDFPSCRCVEQII
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KB9 EKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVIYTGKEGKSSQGCPIAKWVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 EKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVIYTGKEGKSSQGCPIAKWVV
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KB9 RRSSSEEKLLCLVRERAGHTCEAAVIVILILVWEGIPLSLADKLYSELTETLRKYGTLTN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 RRSSSEEKLLCLVRERAGHTCEAAVIVILILVWEGIPLSLADKLYSELTETLRKYGTLTN
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KB9 RRCALNEERTCACQGLDPETCGASFSFGCSWSMYYNGCKFARSKIPRKFKLLGDDPKEEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 RRCALNEERTCACQGLDPETCGASFSFGCSWSMYYNGCKFARSKIPRKFKLLGDDPKEEE
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KB9 KLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLGLKEGRPFSGVTACLDFCAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 KLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLGLKEGRPFSGVTACLDFCAH
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KB9 AHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLYKVSDVDEFGSVEAQEEKKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 AHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLYKVSDVDEFGSVEAQEEKKR
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KB9 SGAIQVLSSFRRKVRMLAEPVKTCRQRKLEAKKAAAEKLSSLENSSNKNEKEKSAPSRTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 SGAIQVLSSFRRKVRMLAEPVKTCRQRKLEAKKAAAEKLSSLENSSNKNEKEKSAPSRTK
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KB9 QTENASQAKQLAELLRLSGPVMQQSQQPQPLQKQPPQPQQQQRPQQQQPHHPQTESVNSY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 QTENASQAKQLAELLRLSGPVMQQSQQPQPLQKQPPQPQQQQRPQQQQPHHPQTESVNSY
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KB9 SASGSTNPYMRRPNPVSPYPNSSHTSDIYGSTSPMNFYSTSSQAAGSYLNSSNPMNPYPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 SASGSTNPYMRRPNPVSPYPNSSHTSDIYGSTSPMNFYSTSSQAAGSYLNSSNPMNPYPG
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KB9 LLNQNTQYPSYQCNGNLSVDNCSPYLGSYSPQSQPMDLYRYPSQDPLSKLSLPPIHTLYQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LLNQNTQYPSYQCNGNLSVDNCSPYLGSYSPQSQPMDLYRYPSQDPLSKLSLPPIHTLYQ
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KB9 PRFGNSQSFTSKYLGYGNQNMQGDGFSSCTIRPNVHHVGKLPPYPTHEMDGHFMGATSRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 PRFGNSQSFTSKYLGYGNQNMQGDGFSSCTIRPNVHHVGKLPPYPTHEMDGHFMGATSRL
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KB9 PPNLSNPNMDYKNGEHHSPSHIIHNYSAAPGMFNSSLHALHLQNKENDMLSHTANGLSKM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 PPNLSNPNMDYKNGEHHSPSHIIHNYSAAPGMFNSSLHALHLQNKENDMLSHTANGLSKM
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KB9 LPALNHDRTACVQGGLHKLSDANGQEKQPLALVQGVASGAEDNDEVWSDSEQSFLDPDIG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LPALNHDRTACVQGGLHKLSDANGQEKQPLALVQGVASGAEDNDEVWSDSEQSFLDPDIG
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KB9 GVAVAPTHGSILIECAKRELHATTPLKNPNRNHPTRISLVFYQHKSMNEPKHGLALWEAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 GVAVAPTHGSILIECAKRELHATTPLKNPNRNHPTRISLVFYQHKSMNEPKHGLALWEAK
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KB9 MAEKAREKEEECEKYGPDYVPQKSHGKKVKREPAEPHETSEPTYLRFIKSLAERTMSVTT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 MAEKAREKEEECEKYGPDYVPQKSHGKKVKREPAEPHETSEPTYLRFIKSLAERTMSVTT
1930 1940 1950 1960 1970 1980
1990 2000
pF1KB9 DSTVTTSPYAFTRVTGPYNRYI
::::::::::::::::::::::
NP_001 DSTVTTSPYAFTRVTGPYNRYI
1990 2000
>>XP_005263139 (OMIM: 612839,614286) PREDICTED: methylcy (2002 aa)
initn: 13593 init1: 13593 opt: 13593 Z-score: 7463.3 bits: 1394.5 E(86068): 0
Smith-Waterman score: 13593; 100.0% identity (100.0% similar) in 2002 aa overlap (1-2002:1-2002)
10 20 30 40 50 60
pF1KB9 MEQDRTNHVEGNRLSPFLIPSPPICQTEPLATKLQNGSPLPERAHPEVNGDTKWHSFKSY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 MEQDRTNHVEGNRLSPFLIPSPPICQTEPLATKLQNGSPLPERAHPEVNGDTKWHSFKSY
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 YGIPCMKGSQNSRVSPDFTQESRGYSKCLQNGGIKRTVSEPSLSGLLQIKKLKQDQKANG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 YGIPCMKGSQNSRVSPDFTQESRGYSKCLQNGGIKRTVSEPSLSGLLQIKKLKQDQKANG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 ERRNFGVSQERNPGESSQPNVSDLSDKKESVSSVAQENAVKDFTSFSTHNCSGPENPELQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 ERRNFGVSQERNPGESSQPNVSDLSDKKESVSSVAQENAVKDFTSFSTHNCSGPENPELQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 ILNEQEGKSANYHDKNIVLLKNKAVLMPNGATVSASSVEHTHGELLEKTLSQYYPDCVSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 ILNEQEGKSANYHDKNIVLLKNKAVLMPNGATVSASSVEHTHGELLEKTLSQYYPDCVSI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 AVQKTTSHINAINSQATNELSCEITHPSHTSGQINSAQTSNSELPPKPAAVVSEACDADD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 AVQKTTSHINAINSQATNELSCEITHPSHTSGQINSAQTSNSELPPKPAAVVSEACDADD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 ADNASKLAAMLNTCSFQKPEQLQQQKSVFEICPSPAENNIQGTTKLASGEEFCSGSSSNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 ADNASKLAAMLNTCSFQKPEQLQQQKSVFEICPSPAENNIQGTTKLASGEEFCSGSSSNL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 QAPGGSSERYLKQNEMNGAYFKQSSVFTKDSFSATTTPPPPSQLLLSPPPPLPQVPQLPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 QAPGGSSERYLKQNEMNGAYFKQSSVFTKDSFSATTTPPPPSQLLLSPPPPLPQVPQLPS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB9 EGKSTLNGGVLEEHHHYPNQSNTTLLREVKIEGKPEAPPSQSPNPSTHVCSPSPMLSERP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 EGKSTLNGGVLEEHHHYPNQSNTTLLREVKIEGKPEAPPSQSPNPSTHVCSPSPMLSERP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB9 QNNCVNRNDIQTAGTMTVPLCSEKTRPMSEHLKHNPPIFGSSGELQDNCQQLMRNKEQEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 QNNCVNRNDIQTAGTMTVPLCSEKTRPMSEHLKHNPPIFGSSGELQDNCQQLMRNKEQEI
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB9 LKGRDKEQTRDLVPPTQHYLKPGWIELKAPRFHQAESHLKRNEASLPSILQYQPNLSNQM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 LKGRDKEQTRDLVPPTQHYLKPGWIELKAPRFHQAESHLKRNEASLPSILQYQPNLSNQM
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB9 TSKQYTGNSNMPGGLPRQAYTQKTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 TSKQYTGNSNMPGGLPRQAYTQKTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQV
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB9 HFSKTDHLPKAHVQSLCGTRFHFQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 HFSKTDHLPKAHVQSLCGTRFHFQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQ
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB9 HKPHKQAAQTQPSQSSHLPQNQQQQQKLQIKNKEEILQTFPHPQSNNDQQREGSFFGQTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 HKPHKQAAQTQPSQSSHLPQNQQQQQKLQIKNKEEILQTFPHPQSNNDQQREGSFFGQTK
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB9 VEECFHGENQYSKSSEFETHNVQMGLEEVQNINRRNSPYSQTMKSSACKIQVSCSNNTHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 VEECFHGENQYSKSSEFETHNVQMGLEEVQNINRRNSPYSQTMKSSACKIQVSCSNNTHL
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB9 VSENKEQTTHPELFAGNKTQNLHHMQYFPNNVIPKQDLLHRCFQEQEQKSQQASVLQGYK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 VSENKEQTTHPELFAGNKTQNLHHMQYFPNNVIPKQDLLHRCFQEQEQKSQQASVLQGYK
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB9 NRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQKDTQKHAALRWHLLQKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 NRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQKDTQKHAALRWHLLQKQ
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB9 EQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWKKVTKQENPPASCDNVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 EQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWKKVTKQENPPASCDNVQ
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB9 QKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTVLTRQTTAAELDSHTPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 QKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTVLTRQTTAAELDSHTPA
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB9 LEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVKTQYDFPSCRCVEQII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 LEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVKTQYDFPSCRCVEQII
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KB9 EKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVIYTGKEGKSSQGCPIAKWVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 EKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVIYTGKEGKSSQGCPIAKWVV
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KB9 RRSSSEEKLLCLVRERAGHTCEAAVIVILILVWEGIPLSLADKLYSELTETLRKYGTLTN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 RRSSSEEKLLCLVRERAGHTCEAAVIVILILVWEGIPLSLADKLYSELTETLRKYGTLTN
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KB9 RRCALNEERTCACQGLDPETCGASFSFGCSWSMYYNGCKFARSKIPRKFKLLGDDPKEEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 RRCALNEERTCACQGLDPETCGASFSFGCSWSMYYNGCKFARSKIPRKFKLLGDDPKEEE
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KB9 KLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLGLKEGRPFSGVTACLDFCAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 KLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLGLKEGRPFSGVTACLDFCAH
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KB9 AHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLYKVSDVDEFGSVEAQEEKKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 AHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLYKVSDVDEFGSVEAQEEKKR
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KB9 SGAIQVLSSFRRKVRMLAEPVKTCRQRKLEAKKAAAEKLSSLENSSNKNEKEKSAPSRTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 SGAIQVLSSFRRKVRMLAEPVKTCRQRKLEAKKAAAEKLSSLENSSNKNEKEKSAPSRTK
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KB9 QTENASQAKQLAELLRLSGPVMQQSQQPQPLQKQPPQPQQQQRPQQQQPHHPQTESVNSY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 QTENASQAKQLAELLRLSGPVMQQSQQPQPLQKQPPQPQQQQRPQQQQPHHPQTESVNSY
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KB9 SASGSTNPYMRRPNPVSPYPNSSHTSDIYGSTSPMNFYSTSSQAAGSYLNSSNPMNPYPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 SASGSTNPYMRRPNPVSPYPNSSHTSDIYGSTSPMNFYSTSSQAAGSYLNSSNPMNPYPG
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KB9 LLNQNTQYPSYQCNGNLSVDNCSPYLGSYSPQSQPMDLYRYPSQDPLSKLSLPPIHTLYQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 LLNQNTQYPSYQCNGNLSVDNCSPYLGSYSPQSQPMDLYRYPSQDPLSKLSLPPIHTLYQ
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KB9 PRFGNSQSFTSKYLGYGNQNMQGDGFSSCTIRPNVHHVGKLPPYPTHEMDGHFMGATSRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 PRFGNSQSFTSKYLGYGNQNMQGDGFSSCTIRPNVHHVGKLPPYPTHEMDGHFMGATSRL
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KB9 PPNLSNPNMDYKNGEHHSPSHIIHNYSAAPGMFNSSLHALHLQNKENDMLSHTANGLSKM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 PPNLSNPNMDYKNGEHHSPSHIIHNYSAAPGMFNSSLHALHLQNKENDMLSHTANGLSKM
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KB9 LPALNHDRTACVQGGLHKLSDANGQEKQPLALVQGVASGAEDNDEVWSDSEQSFLDPDIG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 LPALNHDRTACVQGGLHKLSDANGQEKQPLALVQGVASGAEDNDEVWSDSEQSFLDPDIG
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KB9 GVAVAPTHGSILIECAKRELHATTPLKNPNRNHPTRISLVFYQHKSMNEPKHGLALWEAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 GVAVAPTHGSILIECAKRELHATTPLKNPNRNHPTRISLVFYQHKSMNEPKHGLALWEAK
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KB9 MAEKAREKEEECEKYGPDYVPQKSHGKKVKREPAEPHETSEPTYLRFIKSLAERTMSVTT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 MAEKAREKEEECEKYGPDYVPQKSHGKKVKREPAEPHETSEPTYLRFIKSLAERTMSVTT
1930 1940 1950 1960 1970 1980
1990 2000
pF1KB9 DSTVTTSPYAFTRVTGPYNRYI
::::::::::::::::::::::
XP_005 DSTVTTSPYAFTRVTGPYNRYI
1990 2000
>>NP_060098 (OMIM: 612839,614286) methylcytosine dioxyge (1165 aa)
initn: 7697 init1: 7697 opt: 7703 Z-score: 4237.8 bits: 796.9 E(86068): 0
Smith-Waterman score: 7703; 97.9% identity (98.5% similar) in 1168 aa overlap (1-1168:1-1163)
10 20 30 40 50 60
pF1KB9 MEQDRTNHVEGNRLSPFLIPSPPICQTEPLATKLQNGSPLPERAHPEVNGDTKWHSFKSY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_060 MEQDRTNHVEGNRLSPFLIPSPPICQTEPLATKLQNGSPLPERAHPEVNGDTKWHSFKSY
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 YGIPCMKGSQNSRVSPDFTQESRGYSKCLQNGGIKRTVSEPSLSGLLQIKKLKQDQKANG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_060 YGIPCMKGSQNSRVSPDFTQESRGYSKCLQNGGIKRTVSEPSLSGLLQIKKLKQDQKANG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 ERRNFGVSQERNPGESSQPNVSDLSDKKESVSSVAQENAVKDFTSFSTHNCSGPENPELQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_060 ERRNFGVSQERNPGESSQPNVSDLSDKKESVSSVAQENAVKDFTSFSTHNCSGPENPELQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 ILNEQEGKSANYHDKNIVLLKNKAVLMPNGATVSASSVEHTHGELLEKTLSQYYPDCVSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_060 ILNEQEGKSANYHDKNIVLLKNKAVLMPNGATVSASSVEHTHGELLEKTLSQYYPDCVSI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 AVQKTTSHINAINSQATNELSCEITHPSHTSGQINSAQTSNSELPPKPAAVVSEACDADD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_060 AVQKTTSHINAINSQATNELSCEITHPSHTSGQINSAQTSNSELPPKPAAVVSEACDADD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 ADNASKLAAMLNTCSFQKPEQLQQQKSVFEICPSPAENNIQGTTKLASGEEFCSGSSSNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_060 ADNASKLAAMLNTCSFQKPEQLQQQKSVFEICPSPAENNIQGTTKLASGEEFCSGSSSNL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 QAPGGSSERYLKQNEMNGAYFKQSSVFTKDSFSATTTPPPPSQLLLSPPPPLPQVPQLPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_060 QAPGGSSERYLKQNEMNGAYFKQSSVFTKDSFSATTTPPPPSQLLLSPPPPLPQVPQLPS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB9 EGKSTLNGGVLEEHHHYPNQSNTTLLREVKIEGKPEAPPSQSPNPSTHVCSPSPMLSERP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_060 EGKSTLNGGVLEEHHHYPNQSNTTLLREVKIEGKPEAPPSQSPNPSTHVCSPSPMLSERP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB9 QNNCVNRNDIQTAGTMTVPLCSEKTRPMSEHLKHNPPIFGSSGELQDNCQQLMRNKEQEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_060 QNNCVNRNDIQTAGTMTVPLCSEKTRPMSEHLKHNPPIFGSSGELQDNCQQLMRNKEQEI
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB9 LKGRDKEQTRDLVPPTQHYLKPGWIELKAPRFHQAESHLKRNEASLPSILQYQPNLSNQM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_060 LKGRDKEQTRDLVPPTQHYLKPGWIELKAPRFHQAESHLKRNEASLPSILQYQPNLSNQM
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB9 TSKQYTGNSNMPGGLPRQAYTQKTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_060 TSKQYTGNSNMPGGLPRQAYTQKTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQV
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB9 HFSKTDHLPKAHVQSLCGTRFHFQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_060 HFSKTDHLPKAHVQSLCGTRFHFQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQ
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB9 HKPHKQAAQTQPSQSSHLPQNQQQQQKLQIKNKEEILQTFPHPQSNNDQQREGSFFGQTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_060 HKPHKQAAQTQPSQSSHLPQNQQQQQKLQIKNKEEILQTFPHPQSNNDQQREGSFFGQTK
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB9 VEECFHGENQYSKSSEFETHNVQMGLEEVQNINRRNSPYSQTMKSSACKIQVSCSNNTHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_060 VEECFHGENQYSKSSEFETHNVQMGLEEVQNINRRNSPYSQTMKSSACKIQVSCSNNTHL
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB9 VSENKEQTTHPELFAGNKTQNLHHMQYFPNNVIPKQDLLHRCFQEQEQKSQQASVLQGYK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_060 VSENKEQTTHPELFAGNKTQNLHHMQYFPNNVIPKQDLLHRCFQEQEQKSQQASVLQGYK
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB9 NRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQKDTQKHAALRWHLLQKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_060 NRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQKDTQKHAALRWHLLQKQ
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB9 EQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWKKVTKQENPPASCDNVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_060 EQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWKKVTKQENPPASCDNVQ
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB9 QKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTVLTRQTTAAELDSHTPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_060 QKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTVLTRQTTAAELDSHTPA
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB9 LEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVKTQYDFPSCRCVEQII
:::::::::::::::::::::::::::::::::::::::::::::::::::::::: .
NP_060 LEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVKTQYDFPSCRCVGKCQ
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KB9 EKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVIYTGKEGKSSQGCPIAKWVV
. : :: :. :..: . : :
NP_060 KCTE----TH-GVYPELANLSSDMGFSFFF
1150 1160
>>XP_016863808 (OMIM: 612839,614286) PREDICTED: methylcy (1192 aa)
initn: 7697 init1: 7697 opt: 7697 Z-score: 4234.3 bits: 796.3 E(86068): 0
Smith-Waterman score: 7697; 100.0% identity (100.0% similar) in 1136 aa overlap (1-1136:1-1136)
10 20 30 40 50 60
pF1KB9 MEQDRTNHVEGNRLSPFLIPSPPICQTEPLATKLQNGSPLPERAHPEVNGDTKWHSFKSY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 MEQDRTNHVEGNRLSPFLIPSPPICQTEPLATKLQNGSPLPERAHPEVNGDTKWHSFKSY
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 YGIPCMKGSQNSRVSPDFTQESRGYSKCLQNGGIKRTVSEPSLSGLLQIKKLKQDQKANG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 YGIPCMKGSQNSRVSPDFTQESRGYSKCLQNGGIKRTVSEPSLSGLLQIKKLKQDQKANG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 ERRNFGVSQERNPGESSQPNVSDLSDKKESVSSVAQENAVKDFTSFSTHNCSGPENPELQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 ERRNFGVSQERNPGESSQPNVSDLSDKKESVSSVAQENAVKDFTSFSTHNCSGPENPELQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 ILNEQEGKSANYHDKNIVLLKNKAVLMPNGATVSASSVEHTHGELLEKTLSQYYPDCVSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 ILNEQEGKSANYHDKNIVLLKNKAVLMPNGATVSASSVEHTHGELLEKTLSQYYPDCVSI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 AVQKTTSHINAINSQATNELSCEITHPSHTSGQINSAQTSNSELPPKPAAVVSEACDADD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 AVQKTTSHINAINSQATNELSCEITHPSHTSGQINSAQTSNSELPPKPAAVVSEACDADD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 ADNASKLAAMLNTCSFQKPEQLQQQKSVFEICPSPAENNIQGTTKLASGEEFCSGSSSNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 ADNASKLAAMLNTCSFQKPEQLQQQKSVFEICPSPAENNIQGTTKLASGEEFCSGSSSNL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 QAPGGSSERYLKQNEMNGAYFKQSSVFTKDSFSATTTPPPPSQLLLSPPPPLPQVPQLPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 QAPGGSSERYLKQNEMNGAYFKQSSVFTKDSFSATTTPPPPSQLLLSPPPPLPQVPQLPS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB9 EGKSTLNGGVLEEHHHYPNQSNTTLLREVKIEGKPEAPPSQSPNPSTHVCSPSPMLSERP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 EGKSTLNGGVLEEHHHYPNQSNTTLLREVKIEGKPEAPPSQSPNPSTHVCSPSPMLSERP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB9 QNNCVNRNDIQTAGTMTVPLCSEKTRPMSEHLKHNPPIFGSSGELQDNCQQLMRNKEQEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 QNNCVNRNDIQTAGTMTVPLCSEKTRPMSEHLKHNPPIFGSSGELQDNCQQLMRNKEQEI
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB9 LKGRDKEQTRDLVPPTQHYLKPGWIELKAPRFHQAESHLKRNEASLPSILQYQPNLSNQM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 LKGRDKEQTRDLVPPTQHYLKPGWIELKAPRFHQAESHLKRNEASLPSILQYQPNLSNQM
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB9 TSKQYTGNSNMPGGLPRQAYTQKTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 TSKQYTGNSNMPGGLPRQAYTQKTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQV
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB9 HFSKTDHLPKAHVQSLCGTRFHFQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 HFSKTDHLPKAHVQSLCGTRFHFQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQ
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB9 HKPHKQAAQTQPSQSSHLPQNQQQQQKLQIKNKEEILQTFPHPQSNNDQQREGSFFGQTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 HKPHKQAAQTQPSQSSHLPQNQQQQQKLQIKNKEEILQTFPHPQSNNDQQREGSFFGQTK
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB9 VEECFHGENQYSKSSEFETHNVQMGLEEVQNINRRNSPYSQTMKSSACKIQVSCSNNTHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 VEECFHGENQYSKSSEFETHNVQMGLEEVQNINRRNSPYSQTMKSSACKIQVSCSNNTHL
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB9 VSENKEQTTHPELFAGNKTQNLHHMQYFPNNVIPKQDLLHRCFQEQEQKSQQASVLQGYK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 VSENKEQTTHPELFAGNKTQNLHHMQYFPNNVIPKQDLLHRCFQEQEQKSQQASVLQGYK
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB9 NRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQKDTQKHAALRWHLLQKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 NRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQKDTQKHAALRWHLLQKQ
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB9 EQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWKKVTKQENPPASCDNVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 EQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWKKVTKQENPPASCDNVQ
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB9 QKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTVLTRQTTAAELDSHTPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 QKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTVLTRQTTAAELDSHTPA
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB9 LEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVKTQYDFPSCRCVEQII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 LEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVKTQYDFPSCRCVAVYS
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KB9 EKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVIYTGKEGKSSQGCPIAKWVV
XP_016 IFIGSIFHLKHSLFIHKKQLLIKFFHDIAVTQPHLQALLLILVLLLHLPHLQ
1150 1160 1170 1180 1190
>>XP_006714305 (OMIM: 612839,614286) PREDICTED: methylcy (1902 aa)
initn: 12718 init1: 7697 opt: 7697 Z-score: 4231.2 bits: 796.3 E(86068): 0
Smith-Waterman score: 12537; 94.0% identity (94.6% similar) in 2002 aa overlap (1-2002:1-1902)
10 20 30 40 50 60
pF1KB9 MEQDRTNHVEGNRLSPFLIPSPPICQTEPLATKLQNGSPLPERAHPEVNGDTKWHSFKSY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 MEQDRTNHVEGNRLSPFLIPSPPICQTEPLATKLQNGSPLPERAHPEVNGDTKWHSFKSY
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 YGIPCMKGSQNSRVSPDFTQESRGYSKCLQNGGIKRTVSEPSLSGLLQIKKLKQDQKANG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 YGIPCMKGSQNSRVSPDFTQESRGYSKCLQNGGIKRTVSEPSLSGLLQIKKLKQDQKANG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 ERRNFGVSQERNPGESSQPNVSDLSDKKESVSSVAQENAVKDFTSFSTHNCSGPENPELQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 ERRNFGVSQERNPGESSQPNVSDLSDKKESVSSVAQENAVKDFTSFSTHNCSGPENPELQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 ILNEQEGKSANYHDKNIVLLKNKAVLMPNGATVSASSVEHTHGELLEKTLSQYYPDCVSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 ILNEQEGKSANYHDKNIVLLKNKAVLMPNGATVSASSVEHTHGELLEKTLSQYYPDCVSI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 AVQKTTSHINAINSQATNELSCEITHPSHTSGQINSAQTSNSELPPKPAAVVSEACDADD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 AVQKTTSHINAINSQATNELSCEITHPSHTSGQINSAQTSNSELPPKPAAVVSEACDADD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 ADNASKLAAMLNTCSFQKPEQLQQQKSVFEICPSPAENNIQGTTKLASGEEFCSGSSSNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 ADNASKLAAMLNTCSFQKPEQLQQQKSVFEICPSPAENNIQGTTKLASGEEFCSGSSSNL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 QAPGGSSERYLKQNEMNGAYFKQSSVFTKDSFSATTTPPPPSQLLLSPPPPLPQVPQLPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 QAPGGSSERYLKQNEMNGAYFKQSSVFTKDSFSATTTPPPPSQLLLSPPPPLPQVPQLPS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB9 EGKSTLNGGVLEEHHHYPNQSNTTLLREVKIEGKPEAPPSQSPNPSTHVCSPSPMLSERP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 EGKSTLNGGVLEEHHHYPNQSNTTLLREVKIEGKPEAPPSQSPNPSTHVCSPSPMLSERP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB9 QNNCVNRNDIQTAGTMTVPLCSEKTRPMSEHLKHNPPIFGSSGELQDNCQQLMRNKEQEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 QNNCVNRNDIQTAGTMTVPLCSEKTRPMSEHLKHNPPIFGSSGELQDNCQQLMRNKEQEI
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB9 LKGRDKEQTRDLVPPTQHYLKPGWIELKAPRFHQAESHLKRNEASLPSILQYQPNLSNQM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 LKGRDKEQTRDLVPPTQHYLKPGWIELKAPRFHQAESHLKRNEASLPSILQYQPNLSNQM
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB9 TSKQYTGNSNMPGGLPRQAYTQKTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 TSKQYTGNSNMPGGLPRQAYTQKTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQV
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB9 HFSKTDHLPKAHVQSLCGTRFHFQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 HFSKTDHLPKAHVQSLCGTRFHFQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQ
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB9 HKPHKQAAQTQPSQSSHLPQNQQQQQKLQIKNKEEILQTFPHPQSNNDQQREGSFFGQTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 HKPHKQAAQTQPSQSSHLPQNQQQQQKLQIKNKEEILQTFPHPQSNNDQQREGSFFGQTK
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB9 VEECFHGENQYSKSSEFETHNVQMGLEEVQNINRRNSPYSQTMKSSACKIQVSCSNNTHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 VEECFHGENQYSKSSEFETHNVQMGLEEVQNINRRNSPYSQTMKSSACKIQVSCSNNTHL
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB9 VSENKEQTTHPELFAGNKTQNLHHMQYFPNNVIPKQDLLHRCFQEQEQKSQQASVLQGYK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 VSENKEQTTHPELFAGNKTQNLHHMQYFPNNVIPKQDLLHRCFQEQEQKSQQASVLQGYK
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB9 NRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQKDTQKHAALRWHLLQKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 NRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQKDTQKHAALRWHLLQKQ
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB9 EQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWKKVTKQENPPASCDNVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 EQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWKKVTKQENPPASCDNVQ
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB9 QKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTVLTRQTTAAELDSHTPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 QKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTVLTRQTTAAELDSHTPA
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB9 LEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVKTQYDFPSCRCVEQII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 LEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVKTQYDFPSCRCV----
1090 1100 1110 1120 1130
1150 1160 1170 1180 1190 1200
pF1KB9 EKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVIYTGKEGKSSQGCPIAKWVV
: ..: .
XP_006 ----G-------------------------------LDRRV-------------------
1140
1210 1220 1230 1240 1250 1260
pF1KB9 RRSSSEEKLLCLVRERAGHTCEAAVIVILILVWEGIPLSLADKLYSELTETLRKYGTLTN
::: : :....: . ...:: :..
XP_006 -------KLLGL--------KESSILV-------------------KKAKVLRDVLLLSG
1150 1160
1270 1280 1290 1300 1310 1320
pF1KB9 RRCALNEERTCACQGLDPETCGASFSFGCSWSMYYNGCKFARSKIPRKFKLLGDDPKEEE
: :::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 R--------TCACQGLDPETCGASFSFGCSWSMYYNGCKFARSKIPRKFKLLGDDPKEEE
1170 1180 1190 1200 1210 1220
1330 1340 1350 1360 1370 1380
pF1KB9 KLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLGLKEGRPFSGVTACLDFCAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 KLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLGLKEGRPFSGVTACLDFCAH
1230 1240 1250 1260 1270 1280
1390 1400 1410 1420 1430 1440
pF1KB9 AHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLYKVSDVDEFGSVEAQEEKKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 AHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLYKVSDVDEFGSVEAQEEKKR
1290 1300 1310 1320 1330 1340
1450 1460 1470 1480 1490 1500
pF1KB9 SGAIQVLSSFRRKVRMLAEPVKTCRQRKLEAKKAAAEKLSSLENSSNKNEKEKSAPSRTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 SGAIQVLSSFRRKVRMLAEPVKTCRQRKLEAKKAAAEKLSSLENSSNKNEKEKSAPSRTK
1350 1360 1370 1380 1390 1400
1510 1520 1530 1540 1550 1560
pF1KB9 QTENASQAKQLAELLRLSGPVMQQSQQPQPLQKQPPQPQQQQRPQQQQPHHPQTESVNSY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 QTENASQAKQLAELLRLSGPVMQQSQQPQPLQKQPPQPQQQQRPQQQQPHHPQTESVNSY
1410 1420 1430 1440 1450 1460
1570 1580 1590 1600 1610 1620
pF1KB9 SASGSTNPYMRRPNPVSPYPNSSHTSDIYGSTSPMNFYSTSSQAAGSYLNSSNPMNPYPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 SASGSTNPYMRRPNPVSPYPNSSHTSDIYGSTSPMNFYSTSSQAAGSYLNSSNPMNPYPG
1470 1480 1490 1500 1510 1520
1630 1640 1650 1660 1670 1680
pF1KB9 LLNQNTQYPSYQCNGNLSVDNCSPYLGSYSPQSQPMDLYRYPSQDPLSKLSLPPIHTLYQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 LLNQNTQYPSYQCNGNLSVDNCSPYLGSYSPQSQPMDLYRYPSQDPLSKLSLPPIHTLYQ
1530 1540 1550 1560 1570 1580
1690 1700 1710 1720 1730 1740
pF1KB9 PRFGNSQSFTSKYLGYGNQNMQGDGFSSCTIRPNVHHVGKLPPYPTHEMDGHFMGATSRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 PRFGNSQSFTSKYLGYGNQNMQGDGFSSCTIRPNVHHVGKLPPYPTHEMDGHFMGATSRL
1590 1600 1610 1620 1630 1640
1750 1760 1770 1780 1790 1800
pF1KB9 PPNLSNPNMDYKNGEHHSPSHIIHNYSAAPGMFNSSLHALHLQNKENDMLSHTANGLSKM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 PPNLSNPNMDYKNGEHHSPSHIIHNYSAAPGMFNSSLHALHLQNKENDMLSHTANGLSKM
1650 1660 1670 1680 1690 1700
1810 1820 1830 1840 1850 1860
pF1KB9 LPALNHDRTACVQGGLHKLSDANGQEKQPLALVQGVASGAEDNDEVWSDSEQSFLDPDIG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 LPALNHDRTACVQGGLHKLSDANGQEKQPLALVQGVASGAEDNDEVWSDSEQSFLDPDIG
1710 1720 1730 1740 1750 1760
1870 1880 1890 1900 1910 1920
pF1KB9 GVAVAPTHGSILIECAKRELHATTPLKNPNRNHPTRISLVFYQHKSMNEPKHGLALWEAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 GVAVAPTHGSILIECAKRELHATTPLKNPNRNHPTRISLVFYQHKSMNEPKHGLALWEAK
1770 1780 1790 1800 1810 1820
1930 1940 1950 1960 1970 1980
pF1KB9 MAEKAREKEEECEKYGPDYVPQKSHGKKVKREPAEPHETSEPTYLRFIKSLAERTMSVTT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_006 MAEKAREKEEECEKYGPDYVPQKSHGKKVKREPAEPHETSEPTYLRFIKSLAERTMSVTT
1830 1840 1850 1860 1870 1880
1990 2000
pF1KB9 DSTVTTSPYAFTRVTGPYNRYI
::::::::::::::::::::::
XP_006 DSTVTTSPYAFTRVTGPYNRYI
1890 1900
>>XP_016859056 (OMIM: 613555) PREDICTED: methylcytosine (1702 aa)
initn: 2613 init1: 1834 opt: 2045 Z-score: 1133.2 bits: 223.0 E(86068): 2.2e-56
Smith-Waterman score: 2481; 42.5% identity (63.5% similar) in 1133 aa overlap (915-1934:543-1636)
890 900 910 920 930 940
pF1KB9 EQEQKSQQASVLQGYKNRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQK
:.:. : : :.: . :: . ::.
XP_016 PIQIKKSRPREAQPLFPPVRQIVLEGLRSPASQEVQAHPPA---PLPASQGSAVPLPPEP
520 530 540 550 560
950 960 970 980 990 1000
pF1KB9 DTQKHAALRWHLLQKQEQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWK
. :. . .... : :. .:. : . . .: . : ..: .
XP_016 SLA--------LFAPSPSRDSLLPPTQ----EMRSPSPMT-ALQPGSTGPLPPADDKLEE
570 580 590 600 610
1010 1020 1030 1040 1050 1060
pF1KB9 KVTKQENPPASCDNVQQKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTV
. . : .. .. . .. . .: . .. .. .: ::.:.: :: :::
XP_016 LIRQFEAEFGDSFGLPGPPSVPIQDPENQQTCLPA--PESPFATRSPKQIKIESSGAVTV
620 630 640 650 660 670
1070 1080 1090 1100 1110 1120
pF1KB9 LTRQTTAAELDSHTPALEQQTTSSEKTPTKRTA--ASVLNNFIESPSKLLDTPIKNLLDT
:. : .... ..: :::: . .:..:.::: : :::: :.::::
XP_016 LS-----------TTCFHSEEGGQEATPTKAENPLTPTLSGFLESPLKYLDTPTKSLLDT
680 690 700 710 720
1130 1140 1150 1160 1170 1180
pF1KB9 PVK-TQYDFPSCRCVEQIIEKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVI
:.: .: .::.: :::::.::::::.:::::.::.::.:::.::::.:.::::::::.::
XP_016 PAKRAQAEFPTCDCVEQIVEKDEGPYYTHLGSGPTVASIRELMEERYGEKGKAIRIEKVI
730 740 750 760 770 780
1190 1200 1210 1220 1230 1240
pF1KB9 YTGKEGKSSQGCPIAKWVVRRSSSEEKLLCLVRERAGHTCEAAVIVILILVWEGIPLSLA
:::::::::.::::::::.:: . :::::::::.:::: :. ::::::::.::::: ::.
XP_016 YTGKEGKSSRGCPIAKWVIRRHTLEEKLLCLVRHRAGHHCQNAVIVILILAWEGIPRSLG
790 800 810 820 830 840
1250 1260 1270 1280 1290 1300
pF1KB9 DKLYSELTETLRKYGTLTNRRCALNEERTCACQGLDPETCGASFSFGCSWSMYYNGCKFA
: ::.:::.::::::. :.:::.::..::::::: ::.:::::::::::::::.::::.:
XP_016 DTLYQELTDTLRKYGNPTSRRCGLNDDRTCACQGKDPNTCGASFSFGCSWSMYFNGCKYA
850 860 870 880 890 900
1310 1320 1330 1340 1350 1360
pF1KB9 RSKIPRKFKLLGDDPKEEEKLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLG
::: ::::.: ::.::::: :.. .:.:.: .:: ::.:::.::.::. :. : .::::
XP_016 RSKTPRKFRLAGDNPKEEEVLRKSFQDLATEVAPLYKRLAPQAYQNQVTNEEIAIDCRLG
910 920 930 940 950 960
1370 1380 1390 1400 1410 1420
pF1KB9 LKEGRPFSGVTACLDFCAHAHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLY
:::::::.:::::.:::::::.: ::. :: :.:::::.:::: : ::::::::::::
XP_016 LKEGRPFAGVTACMDFCAHAHKDQHNLYNGCTVVCTLTKEDNRCVGKIPEDEQLHVLPLY
970 980 990 1000 1010 1020
1430 1440 1450 1460 1470 1480
pF1KB9 KVSDVDEFGSVEAQEEKKRSGAIQVLSSFRRKVRMLAEPVKTCRQRKLEAKKAAAEKLSS
:....::::: : :. : :::::::..: :.:: : ::.:.::::.:::.::::::
XP_016 KMANTDEFGSEENQNAKVGSGAIQVLTAFPREVRRLPEPAKSCRQRQLEARKAAAEK---
1030 1040 1050 1060 1070 1080
1490 1500 1510 1520 1530
pF1KB9 LENSSNKNEKEK-SAPSRTKQTENASQAKQLAELLRLSGPVMQQSQQP----QPLQK---
.: .::: :.: . :: . : :.: . ::. .: .: ..
XP_016 -----KKIQKEKLSTPEKIKQEALELAGITSDPGLSLKGGLSQQGLKPSLKVEPQNHFSS
1090 1100 1110 1120 1130
1540 1550 1560 1570
pF1KB9 ------------------QPPQPQQQQRPQQQQPHH--PQTESVNSYSASGS--TNPYMR
.: .: ... . . .. :. :::.. .. . . :.
XP_016 FKYSGNAVVESYSVLGNCRPSDPYSMNSVYSYHSYYAQPSLTSVNGFHSKYALPSFSYYG
1140 1150 1160 1170 1180 1190
1580 1590 1600
pF1KB9 RP--NPVSPY----PNS-SHTSD------------IYGSTSPM----NFYSTSSQAAGSY
: ::: : :.. .:... ...: :: .: :::. .
XP_016 FPSSNPVFPSQFLGPGAWGHSGSSGSFEKKPDLHALHNSLSPAYGGAEFAELPSQAVPTD
1200 1210 1220 1230 1240 1250
1610 1620 1630 1640 1650
pF1KB9 LNSSNPMN--P-YPG----------LLNQNTQYPSYQCNGNLSVDNCSPYLGSYSPQSQ-
. .: . : ::: ::.. .. :: ... . : : .: .:
XP_016 AHHPTPHHQQPAYPGPKEYLLPKAPLLHSVSRDPSPFAQSS-NCYNRSIKQEPVDPLTQA
1260 1270 1280 1290 1300 1310
1660 1670 1680 1690 1700
pF1KB9 ---PMDLYRYPSQDPLSKLSLP--PIHTLYQPRFGNSQSFTSKYLGYGNQNMQGDGFSSC
: : .. .. :::..: : : : : :.: :. .. ..: :
XP_016 EPVPRDAGKM-GKTPLSEVSQNGGPSHLWGQYSGGPSMSPKRTNGVGGSWGVFSSGESPA
1320 1330 1340 1350 1360 1370
1710 1720 1730 1740 1750
pF1KB9 TIRPNVHHVGKLPPYPTHEMDGH---FMG----ATSRLPPNL-SNPNMDYKNGEHHS---
. .. : :.: ::. : : :.:. : ..: : :. :
XP_016 IVPDKLSSFGASCLAPSHFTDGQWGLFPGEGQQAASHSGGRLRGKPWSPCKFGNSTSALA
1380 1390 1400 1410 1420 1430
1760 1770 1780 1790 1800
pF1KB9 -PSHIIHNYSAAPGMFNSSLHALH-LQNKE-NDMLSHT----ANGLSKM--------LPA
:: . .. . : :::.:.. .:.: : : .. : : :.. ::
XP_016 GPSLTEKPWALGAGDFNSALKGSPGFQDKLWNPMKGEEGRIPAAGASQLDRAWQSFGLPL
1440 1450 1460 1470 1480 1490
1810 1820 1830 1840 1850
pF1KB9 LNHDRTACVQGGLHKLSDANGQEKQP---------LALVQGVASGAEDNDEVWSDSEQSF
. .. . . .:: : . :. : . .: ... :...:.:::::..:
XP_016 GSSEKLFGALKSEEKLWDPFSLEEGPAEEPPSKGAVKEEKGGGGAEEEEEELWSDSEHNF
1500 1510 1520 1530 1540 1550
1860 1870 1880 1890 1900 1910
pF1KB9 LDPDIGGVAVAPTHGSILIECAKRELHATTPLKNPNRNHPTRISLVFYQHKSMNEPKHGL
:: .::::::::.:::::::::.::::::::::.::: :::::::::::::..:.:.:::
XP_016 LDENIGGVAVAPAHGSILIECARRELHATTPLKKPNRCHPTRISLVFYQHKNLNQPNHGL
1560 1570 1580 1590 1600 1610
1920 1930 1940 1950 1960 1970
pF1KB9 ALWEAKM---AEKAREKEEECEKYGPDYVPQKSHGKKVKREPAEPHETSEPTYLRFIKSL
::::::: ::.:: ..:: .
XP_016 ALWEAKMKQLAERARARQEEAARLGLGQQEAKLYGKKRKWGGTVVAEPQQKEKKGVVPTR
1620 1630 1640 1650 1660 1670
>>XP_011530988 (OMIM: 613555) PREDICTED: methylcytosine (1776 aa)
initn: 2573 init1: 1834 opt: 2045 Z-score: 1132.9 bits: 223.0 E(86068): 2.3e-56
Smith-Waterman score: 2481; 42.5% identity (63.5% similar) in 1133 aa overlap (915-1934:617-1710)
890 900 910 920 930 940
pF1KB9 EQEQKSQQASVLQGYKNRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQK
:.:. : : :.: . :: . ::.
XP_011 PIQIKKSRPREAQPLFPPVRQIVLEGLRSPASQEVQAHPPA---PLPASQGSAVPLPPEP
590 600 610 620 630 640
950 960 970 980 990 1000
pF1KB9 DTQKHAALRWHLLQKQEQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWK
. :. . .... : :. .:. : . . .: . : ..: .
XP_011 SLA--------LFAPSPSRDSLLPPTQ----EMRSPSPMT-ALQPGSTGPLPPADDKLEE
650 660 670 680 690
1010 1020 1030 1040 1050 1060
pF1KB9 KVTKQENPPASCDNVQQKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTV
. . : .. .. . .. . .: . .. .. .: ::.:.: :: :::
XP_011 LIRQFEAEFGDSFGLPGPPSVPIQDPENQQTCLPA--PESPFATRSPKQIKIESSGAVTV
700 710 720 730 740
1070 1080 1090 1100 1110 1120
pF1KB9 LTRQTTAAELDSHTPALEQQTTSSEKTPTKRTA--ASVLNNFIESPSKLLDTPIKNLLDT
:. : .... ..: :::: . .:..:.::: : :::: :.::::
XP_011 LS-----------TTCFHSEEGGQEATPTKAENPLTPTLSGFLESPLKYLDTPTKSLLDT
750 760 770 780 790
1130 1140 1150 1160 1170 1180
pF1KB9 PVK-TQYDFPSCRCVEQIIEKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVI
:.: .: .::.: :::::.::::::.:::::.::.::.:::.::::.:.::::::::.::
XP_011 PAKRAQAEFPTCDCVEQIVEKDEGPYYTHLGSGPTVASIRELMEERYGEKGKAIRIEKVI
800 810 820 830 840 850
1190 1200 1210 1220 1230 1240
pF1KB9 YTGKEGKSSQGCPIAKWVVRRSSSEEKLLCLVRERAGHTCEAAVIVILILVWEGIPLSLA
:::::::::.::::::::.:: . :::::::::.:::: :. ::::::::.::::: ::.
XP_011 YTGKEGKSSRGCPIAKWVIRRHTLEEKLLCLVRHRAGHHCQNAVIVILILAWEGIPRSLG
860 870 880 890 900 910
1250 1260 1270 1280 1290 1300
pF1KB9 DKLYSELTETLRKYGTLTNRRCALNEERTCACQGLDPETCGASFSFGCSWSMYYNGCKFA
: ::.:::.::::::. :.:::.::..::::::: ::.:::::::::::::::.::::.:
XP_011 DTLYQELTDTLRKYGNPTSRRCGLNDDRTCACQGKDPNTCGASFSFGCSWSMYFNGCKYA
920 930 940 950 960 970
1310 1320 1330 1340 1350 1360
pF1KB9 RSKIPRKFKLLGDDPKEEEKLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLG
::: ::::.: ::.::::: :.. .:.:.: .:: ::.:::.::.::. :. : .::::
XP_011 RSKTPRKFRLAGDNPKEEEVLRKSFQDLATEVAPLYKRLAPQAYQNQVTNEEIAIDCRLG
980 990 1000 1010 1020 1030
1370 1380 1390 1400 1410 1420
pF1KB9 LKEGRPFSGVTACLDFCAHAHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLY
:::::::.:::::.:::::::.: ::. :: :.:::::.:::: : ::::::::::::
XP_011 LKEGRPFAGVTACMDFCAHAHKDQHNLYNGCTVVCTLTKEDNRCVGKIPEDEQLHVLPLY
1040 1050 1060 1070 1080 1090
1430 1440 1450 1460 1470 1480
pF1KB9 KVSDVDEFGSVEAQEEKKRSGAIQVLSSFRRKVRMLAEPVKTCRQRKLEAKKAAAEKLSS
:....::::: : :. : :::::::..: :.:: : ::.:.::::.:::.::::::
XP_011 KMANTDEFGSEENQNAKVGSGAIQVLTAFPREVRRLPEPAKSCRQRQLEARKAAAEK---
1100 1110 1120 1130 1140 1150
1490 1500 1510 1520 1530
pF1KB9 LENSSNKNEKEK-SAPSRTKQTENASQAKQLAELLRLSGPVMQQSQQP----QPLQK---
.: .::: :.: . :: . : :.: . ::. .: .: ..
XP_011 -----KKIQKEKLSTPEKIKQEALELAGITSDPGLSLKGGLSQQGLKPSLKVEPQNHFSS
1160 1170 1180 1190 1200
1540 1550 1560 1570
pF1KB9 ------------------QPPQPQQQQRPQQQQPHH--PQTESVNSYSASGS--TNPYMR
.: .: ... . . .. :. :::.. .. . . :.
XP_011 FKYSGNAVVESYSVLGNCRPSDPYSMNSVYSYHSYYAQPSLTSVNGFHSKYALPSFSYYG
1210 1220 1230 1240 1250 1260
1580 1590 1600
pF1KB9 RP--NPVSPY----PNS-SHTSD------------IYGSTSPM----NFYSTSSQAAGSY
: ::: : :.. .:... ...: :: .: :::. .
XP_011 FPSSNPVFPSQFLGPGAWGHSGSSGSFEKKPDLHALHNSLSPAYGGAEFAELPSQAVPTD
1270 1280 1290 1300 1310 1320
1610 1620 1630 1640 1650
pF1KB9 LNSSNPMN--P-YPG----------LLNQNTQYPSYQCNGNLSVDNCSPYLGSYSPQSQ-
. .: . : ::: ::.. .. :: ... . : : .: .:
XP_011 AHHPTPHHQQPAYPGPKEYLLPKAPLLHSVSRDPSPFAQSS-NCYNRSIKQEPVDPLTQA
1330 1340 1350 1360 1370 1380
1660 1670 1680 1690 1700
pF1KB9 ---PMDLYRYPSQDPLSKLSLP--PIHTLYQPRFGNSQSFTSKYLGYGNQNMQGDGFSSC
: : .. .. :::..: : : : : :.: :. .. ..: :
XP_011 EPVPRDAGKM-GKTPLSEVSQNGGPSHLWGQYSGGPSMSPKRTNGVGGSWGVFSSGESPA
1390 1400 1410 1420 1430 1440
1710 1720 1730 1740 1750
pF1KB9 TIRPNVHHVGKLPPYPTHEMDGH---FMG----ATSRLPPNL-SNPNMDYKNGEHHS---
. .. : :.: ::. : : :.:. : ..: : :. :
XP_011 IVPDKLSSFGASCLAPSHFTDGQWGLFPGEGQQAASHSGGRLRGKPWSPCKFGNSTSALA
1450 1460 1470 1480 1490 1500
1760 1770 1780 1790 1800
pF1KB9 -PSHIIHNYSAAPGMFNSSLHALH-LQNKE-NDMLSHT----ANGLSKM--------LPA
:: . .. . : :::.:.. .:.: : : .. : : :.. ::
XP_011 GPSLTEKPWALGAGDFNSALKGSPGFQDKLWNPMKGEEGRIPAAGASQLDRAWQSFGLPL
1510 1520 1530 1540 1550 1560
1810 1820 1830 1840 1850
pF1KB9 LNHDRTACVQGGLHKLSDANGQEKQP---------LALVQGVASGAEDNDEVWSDSEQSF
. .. . . .:: : . :. : . .: ... :...:.:::::..:
XP_011 GSSEKLFGALKSEEKLWDPFSLEEGPAEEPPSKGAVKEEKGGGGAEEEEEELWSDSEHNF
1570 1580 1590 1600 1610 1620
1860 1870 1880 1890 1900 1910
pF1KB9 LDPDIGGVAVAPTHGSILIECAKRELHATTPLKNPNRNHPTRISLVFYQHKSMNEPKHGL
:: .::::::::.:::::::::.::::::::::.::: :::::::::::::..:.:.:::
XP_011 LDENIGGVAVAPAHGSILIECARRELHATTPLKKPNRCHPTRISLVFYQHKNLNQPNHGL
1630 1640 1650 1660 1670 1680
1920 1930 1940 1950 1960 1970
pF1KB9 ALWEAKM---AEKAREKEEECEKYGPDYVPQKSHGKKVKREPAEPHETSEPTYLRFIKSL
::::::: ::.:: ..:: .
XP_011 ALWEAKMKQLAERARARQEEAARLGLGQQEAKLYGKKRKWGGTVVAEPQQKEKKGVVPTR
1690 1700 1710 1720 1730 1740
>>NP_001274420 (OMIM: 613555) methylcytosine dioxygenase (1795 aa)
initn: 2573 init1: 1834 opt: 2045 Z-score: 1132.9 bits: 223.0 E(86068): 2.3e-56
Smith-Waterman score: 2481; 42.5% identity (63.5% similar) in 1133 aa overlap (915-1934:636-1729)
890 900 910 920 930 940
pF1KB9 EQEQKSQQASVLQGYKNRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQK
:.:. : : :.: . :: . ::.
NP_001 PIQIKKSRPREAQPLFPPVRQIVLEGLRSPASQEVQAHPPA---PLPASQGSAVPLPPEP
610 620 630 640 650 660
950 960 970 980 990 1000
pF1KB9 DTQKHAALRWHLLQKQEQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWK
. :. . .... : :. .:. : . . .: . : ..: .
NP_001 SLA--------LFAPSPSRDSLLPPTQ----EMRSPSPMT-ALQPGSTGPLPPADDKLEE
670 680 690 700
1010 1020 1030 1040 1050 1060
pF1KB9 KVTKQENPPASCDNVQQKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTV
. . : .. .. . .. . .: . .. .. .: ::.:.: :: :::
NP_001 LIRQFEAEFGDSFGLPGPPSVPIQDPENQQTCLPA--PESPFATRSPKQIKIESSGAVTV
710 720 730 740 750 760
1070 1080 1090 1100 1110 1120
pF1KB9 LTRQTTAAELDSHTPALEQQTTSSEKTPTKRTA--ASVLNNFIESPSKLLDTPIKNLLDT
:. : .... ..: :::: . .:..:.::: : :::: :.::::
NP_001 LS-----------TTCFHSEEGGQEATPTKAENPLTPTLSGFLESPLKYLDTPTKSLLDT
770 780 790 800 810
1130 1140 1150 1160 1170 1180
pF1KB9 PVK-TQYDFPSCRCVEQIIEKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVI
:.: .: .::.: :::::.::::::.:::::.::.::.:::.::::.:.::::::::.::
NP_001 PAKRAQAEFPTCDCVEQIVEKDEGPYYTHLGSGPTVASIRELMEERYGEKGKAIRIEKVI
820 830 840 850 860 870
1190 1200 1210 1220 1230 1240
pF1KB9 YTGKEGKSSQGCPIAKWVVRRSSSEEKLLCLVRERAGHTCEAAVIVILILVWEGIPLSLA
:::::::::.::::::::.:: . :::::::::.:::: :. ::::::::.::::: ::.
NP_001 YTGKEGKSSRGCPIAKWVIRRHTLEEKLLCLVRHRAGHHCQNAVIVILILAWEGIPRSLG
880 890 900 910 920 930
1250 1260 1270 1280 1290 1300
pF1KB9 DKLYSELTETLRKYGTLTNRRCALNEERTCACQGLDPETCGASFSFGCSWSMYYNGCKFA
: ::.:::.::::::. :.:::.::..::::::: ::.:::::::::::::::.::::.:
NP_001 DTLYQELTDTLRKYGNPTSRRCGLNDDRTCACQGKDPNTCGASFSFGCSWSMYFNGCKYA
940 950 960 970 980 990
1310 1320 1330 1340 1350 1360
pF1KB9 RSKIPRKFKLLGDDPKEEEKLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLG
::: ::::.: ::.::::: :.. .:.:.: .:: ::.:::.::.::. :. : .::::
NP_001 RSKTPRKFRLAGDNPKEEEVLRKSFQDLATEVAPLYKRLAPQAYQNQVTNEEIAIDCRLG
1000 1010 1020 1030 1040 1050
1370 1380 1390 1400 1410 1420
pF1KB9 LKEGRPFSGVTACLDFCAHAHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLY
:::::::.:::::.:::::::.: ::. :: :.:::::.:::: : ::::::::::::
NP_001 LKEGRPFAGVTACMDFCAHAHKDQHNLYNGCTVVCTLTKEDNRCVGKIPEDEQLHVLPLY
1060 1070 1080 1090 1100 1110
1430 1440 1450 1460 1470 1480
pF1KB9 KVSDVDEFGSVEAQEEKKRSGAIQVLSSFRRKVRMLAEPVKTCRQRKLEAKKAAAEKLSS
:....::::: : :. : :::::::..: :.:: : ::.:.::::.:::.::::::
NP_001 KMANTDEFGSEENQNAKVGSGAIQVLTAFPREVRRLPEPAKSCRQRQLEARKAAAEK---
1120 1130 1140 1150 1160 1170
1490 1500 1510 1520 1530
pF1KB9 LENSSNKNEKEK-SAPSRTKQTENASQAKQLAELLRLSGPVMQQSQQP----QPLQK---
.: .::: :.: . :: . : :.: . ::. .: .: ..
NP_001 -----KKIQKEKLSTPEKIKQEALELAGITSDPGLSLKGGLSQQGLKPSLKVEPQNHFSS
1180 1190 1200 1210 1220
1540 1550 1560 1570
pF1KB9 ------------------QPPQPQQQQRPQQQQPHH--PQTESVNSYSASGS--TNPYMR
.: .: ... . . .. :. :::.. .. . . :.
NP_001 FKYSGNAVVESYSVLGNCRPSDPYSMNSVYSYHSYYAQPSLTSVNGFHSKYALPSFSYYG
1230 1240 1250 1260 1270 1280
1580 1590 1600
pF1KB9 RP--NPVSPY----PNS-SHTSD------------IYGSTSPM----NFYSTSSQAAGSY
: ::: : :.. .:... ...: :: .: :::. .
NP_001 FPSSNPVFPSQFLGPGAWGHSGSSGSFEKKPDLHALHNSLSPAYGGAEFAELPSQAVPTD
1290 1300 1310 1320 1330 1340
1610 1620 1630 1640 1650
pF1KB9 LNSSNPMN--P-YPG----------LLNQNTQYPSYQCNGNLSVDNCSPYLGSYSPQSQ-
. .: . : ::: ::.. .. :: ... . : : .: .:
NP_001 AHHPTPHHQQPAYPGPKEYLLPKAPLLHSVSRDPSPFAQSS-NCYNRSIKQEPVDPLTQA
1350 1360 1370 1380 1390 1400
1660 1670 1680 1690 1700
pF1KB9 ---PMDLYRYPSQDPLSKLSLP--PIHTLYQPRFGNSQSFTSKYLGYGNQNMQGDGFSSC
: : .. .. :::..: : : : : :.: :. .. ..: :
NP_001 EPVPRDAGKM-GKTPLSEVSQNGGPSHLWGQYSGGPSMSPKRTNGVGGSWGVFSSGESPA
1410 1420 1430 1440 1450 1460
1710 1720 1730 1740 1750
pF1KB9 TIRPNVHHVGKLPPYPTHEMDGH---FMG----ATSRLPPNL-SNPNMDYKNGEHHS---
. .. : :.: ::. : : :.:. : ..: : :. :
NP_001 IVPDKLSSFGASCLAPSHFTDGQWGLFPGEGQQAASHSGGRLRGKPWSPCKFGNSTSALA
1470 1480 1490 1500 1510 1520
1760 1770 1780 1790 1800
pF1KB9 -PSHIIHNYSAAPGMFNSSLHALH-LQNKE-NDMLSHT----ANGLSKM--------LPA
:: . .. . : :::.:.. .:.: : : .. : : :.. ::
NP_001 GPSLTEKPWALGAGDFNSALKGSPGFQDKLWNPMKGEEGRIPAAGASQLDRAWQSFGLPL
1530 1540 1550 1560 1570 1580
1810 1820 1830 1840 1850
pF1KB9 LNHDRTACVQGGLHKLSDANGQEKQP---------LALVQGVASGAEDNDEVWSDSEQSF
. .. . . .:: : . :. : . .: ... :...:.:::::..:
NP_001 GSSEKLFGALKSEEKLWDPFSLEEGPAEEPPSKGAVKEEKGGGGAEEEEEELWSDSEHNF
1590 1600 1610 1620 1630 1640
1860 1870 1880 1890 1900 1910
pF1KB9 LDPDIGGVAVAPTHGSILIECAKRELHATTPLKNPNRNHPTRISLVFYQHKSMNEPKHGL
:: .::::::::.:::::::::.::::::::::.::: :::::::::::::..:.:.:::
NP_001 LDENIGGVAVAPAHGSILIECARRELHATTPLKKPNRCHPTRISLVFYQHKNLNQPNHGL
1650 1660 1670 1680 1690 1700
1920 1930 1940 1950 1960 1970
pF1KB9 ALWEAKM---AEKAREKEEECEKYGPDYVPQKSHGKKVKREPAEPHETSEPTYLRFIKSL
::::::: ::.:: ..:: .
NP_001 ALWEAKMKQLAERARARQEEAARLGLGQQEAKLYGKKRKWGGTVVAEPQQKEKKGVVPTR
1710 1720 1730 1740 1750 1760
>>XP_005264244 (OMIM: 613555) PREDICTED: methylcytosine (1795 aa)
initn: 2573 init1: 1834 opt: 2045 Z-score: 1132.9 bits: 223.0 E(86068): 2.3e-56
Smith-Waterman score: 2481; 42.5% identity (63.5% similar) in 1133 aa overlap (915-1934:636-1729)
890 900 910 920 930 940
pF1KB9 EQEQKSQQASVLQGYKNRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQK
:.:. : : :.: . :: . ::.
XP_005 PIQIKKSRPREAQPLFPPVRQIVLEGLRSPASQEVQAHPPA---PLPASQGSAVPLPPEP
610 620 630 640 650 660
950 960 970 980 990 1000
pF1KB9 DTQKHAALRWHLLQKQEQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWK
. :. . .... : :. .:. : . . .: . : ..: .
XP_005 SLA--------LFAPSPSRDSLLPPTQ----EMRSPSPMT-ALQPGSTGPLPPADDKLEE
670 680 690 700
1010 1020 1030 1040 1050 1060
pF1KB9 KVTKQENPPASCDNVQQKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTV
. . : .. .. . .. . .: . .. .. .: ::.:.: :: :::
XP_005 LIRQFEAEFGDSFGLPGPPSVPIQDPENQQTCLPA--PESPFATRSPKQIKIESSGAVTV
710 720 730 740 750 760
1070 1080 1090 1100 1110 1120
pF1KB9 LTRQTTAAELDSHTPALEQQTTSSEKTPTKRTA--ASVLNNFIESPSKLLDTPIKNLLDT
:. : .... ..: :::: . .:..:.::: : :::: :.::::
XP_005 LS-----------TTCFHSEEGGQEATPTKAENPLTPTLSGFLESPLKYLDTPTKSLLDT
770 780 790 800 810
1130 1140 1150 1160 1170 1180
pF1KB9 PVK-TQYDFPSCRCVEQIIEKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVI
:.: .: .::.: :::::.::::::.:::::.::.::.:::.::::.:.::::::::.::
XP_005 PAKRAQAEFPTCDCVEQIVEKDEGPYYTHLGSGPTVASIRELMEERYGEKGKAIRIEKVI
820 830 840 850 860 870
1190 1200 1210 1220 1230 1240
pF1KB9 YTGKEGKSSQGCPIAKWVVRRSSSEEKLLCLVRERAGHTCEAAVIVILILVWEGIPLSLA
:::::::::.::::::::.:: . :::::::::.:::: :. ::::::::.::::: ::.
XP_005 YTGKEGKSSRGCPIAKWVIRRHTLEEKLLCLVRHRAGHHCQNAVIVILILAWEGIPRSLG
880 890 900 910 920 930
1250 1260 1270 1280 1290 1300
pF1KB9 DKLYSELTETLRKYGTLTNRRCALNEERTCACQGLDPETCGASFSFGCSWSMYYNGCKFA
: ::.:::.::::::. :.:::.::..::::::: ::.:::::::::::::::.::::.:
XP_005 DTLYQELTDTLRKYGNPTSRRCGLNDDRTCACQGKDPNTCGASFSFGCSWSMYFNGCKYA
940 950 960 970 980 990
1310 1320 1330 1340 1350 1360
pF1KB9 RSKIPRKFKLLGDDPKEEEKLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLG
::: ::::.: ::.::::: :.. .:.:.: .:: ::.:::.::.::. :. : .::::
XP_005 RSKTPRKFRLAGDNPKEEEVLRKSFQDLATEVAPLYKRLAPQAYQNQVTNEEIAIDCRLG
1000 1010 1020 1030 1040 1050
1370 1380 1390 1400 1410 1420
pF1KB9 LKEGRPFSGVTACLDFCAHAHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLY
:::::::.:::::.:::::::.: ::. :: :.:::::.:::: : ::::::::::::
XP_005 LKEGRPFAGVTACMDFCAHAHKDQHNLYNGCTVVCTLTKEDNRCVGKIPEDEQLHVLPLY
1060 1070 1080 1090 1100 1110
1430 1440 1450 1460 1470 1480
pF1KB9 KVSDVDEFGSVEAQEEKKRSGAIQVLSSFRRKVRMLAEPVKTCRQRKLEAKKAAAEKLSS
:....::::: : :. : :::::::..: :.:: : ::.:.::::.:::.::::::
XP_005 KMANTDEFGSEENQNAKVGSGAIQVLTAFPREVRRLPEPAKSCRQRQLEARKAAAEK---
1120 1130 1140 1150 1160 1170
1490 1500 1510 1520 1530
pF1KB9 LENSSNKNEKEK-SAPSRTKQTENASQAKQLAELLRLSGPVMQQSQQP----QPLQK---
.: .::: :.: . :: . : :.: . ::. .: .: ..
XP_005 -----KKIQKEKLSTPEKIKQEALELAGITSDPGLSLKGGLSQQGLKPSLKVEPQNHFSS
1180 1190 1200 1210 1220
1540 1550 1560 1570
pF1KB9 ------------------QPPQPQQQQRPQQQQPHH--PQTESVNSYSASGS--TNPYMR
.: .: ... . . .. :. :::.. .. . . :.
XP_005 FKYSGNAVVESYSVLGNCRPSDPYSMNSVYSYHSYYAQPSLTSVNGFHSKYALPSFSYYG
1230 1240 1250 1260 1270 1280
1580 1590 1600
pF1KB9 RP--NPVSPY----PNS-SHTSD------------IYGSTSPM----NFYSTSSQAAGSY
: ::: : :.. .:... ...: :: .: :::. .
XP_005 FPSSNPVFPSQFLGPGAWGHSGSSGSFEKKPDLHALHNSLSPAYGGAEFAELPSQAVPTD
1290 1300 1310 1320 1330 1340
1610 1620 1630 1640 1650
pF1KB9 LNSSNPMN--P-YPG----------LLNQNTQYPSYQCNGNLSVDNCSPYLGSYSPQSQ-
. .: . : ::: ::.. .. :: ... . : : .: .:
XP_005 AHHPTPHHQQPAYPGPKEYLLPKAPLLHSVSRDPSPFAQSS-NCYNRSIKQEPVDPLTQA
1350 1360 1370 1380 1390 1400
1660 1670 1680 1690 1700
pF1KB9 ---PMDLYRYPSQDPLSKLSLP--PIHTLYQPRFGNSQSFTSKYLGYGNQNMQGDGFSSC
: : .. .. :::..: : : : : :.: :. .. ..: :
XP_005 EPVPRDAGKM-GKTPLSEVSQNGGPSHLWGQYSGGPSMSPKRTNGVGGSWGVFSSGESPA
1410 1420 1430 1440 1450 1460
1710 1720 1730 1740 1750
pF1KB9 TIRPNVHHVGKLPPYPTHEMDGH---FMG----ATSRLPPNL-SNPNMDYKNGEHHS---
. .. : :.: ::. : : :.:. : ..: : :. :
XP_005 IVPDKLSSFGASCLAPSHFTDGQWGLFPGEGQQAASHSGGRLRGKPWSPCKFGNSTSALA
1470 1480 1490 1500 1510 1520
1760 1770 1780 1790 1800
pF1KB9 -PSHIIHNYSAAPGMFNSSLHALH-LQNKE-NDMLSHT----ANGLSKM--------LPA
:: . .. . : :::.:.. .:.: : : .. : : :.. ::
XP_005 GPSLTEKPWALGAGDFNSALKGSPGFQDKLWNPMKGEEGRIPAAGASQLDRAWQSFGLPL
1530 1540 1550 1560 1570 1580
1810 1820 1830 1840 1850
pF1KB9 LNHDRTACVQGGLHKLSDANGQEKQP---------LALVQGVASGAEDNDEVWSDSEQSF
. .. . . .:: : . :. : . .: ... :...:.:::::..:
XP_005 GSSEKLFGALKSEEKLWDPFSLEEGPAEEPPSKGAVKEEKGGGGAEEEEEELWSDSEHNF
1590 1600 1610 1620 1630 1640
1860 1870 1880 1890 1900 1910
pF1KB9 LDPDIGGVAVAPTHGSILIECAKRELHATTPLKNPNRNHPTRISLVFYQHKSMNEPKHGL
:: .::::::::.:::::::::.::::::::::.::: :::::::::::::..:.:.:::
XP_005 LDENIGGVAVAPAHGSILIECARRELHATTPLKKPNRCHPTRISLVFYQHKNLNQPNHGL
1650 1660 1670 1680 1690 1700
1920 1930 1940 1950 1960 1970
pF1KB9 ALWEAKM---AEKAREKEEECEKYGPDYVPQKSHGKKVKREPAEPHETSEPTYLRFIKSL
::::::: ::.:: ..:: .
XP_005 ALWEAKMKQLAERARARQEEAARLGLGQQEAKLYGKKRKWGGTVVAEPQQKEKKGVVPTR
1710 1720 1730 1740 1750 1760
>>NP_085128 (OMIM: 607790) methylcytosine dioxygenase TE (2136 aa)
initn: 2130 init1: 999 opt: 1812 Z-score: 1003.9 bits: 199.4 E(86068): 3.6e-49
Smith-Waterman score: 2168; 34.4% identity (59.4% similar) in 1390 aa overlap (653-2002:941-2136)
630 640 650 660 670 680
pF1KB9 KTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQVHFSKTDHLPKAHVQSLCGTRFH
.: :. : . : .: :. . :: :.:
NP_085 SKSEKDEESEQRTASLLNSCKAILYTVRKDLQDPNLQGEPPKLNHCPSLEKQSSCNTVVF
920 930 940 950 960 970
690 700 710 720 730 740
pF1KB9 FQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQHKPHKQAAQTQPSQSSHLPQNQ
..:: : . .:.:. .... ..:: .. .. . :.::.. :.
NP_085 -----NGQTTTLSN----SHINSATNQAS--TKSHEYSKVTNSLSLFIPKSNSSKIDTNK
980 990 1000 1010
750 760 770 780 790 800
pF1KB9 QQQQKL-QIKNKEEILQTFPHPQSNNDQQREGSFFGQTKVEECFHGENQYSKSSEFETHN
. : . . : . :. .: :. ::. . .... ..: . : . ...: ..
NP_085 SIAQGIITLDNCSNDLHQLP-PR-NNEVEYCNQLLDSSKKLDSDDLSCQDATHTQIE-ED
1020 1030 1040 1050 1060 1070
810 820 830 840 850
pF1KB9 VQMGLEEVQNINRRN--SPYSQTMKSS-----ACKIQVSCSNNTHLVSENKEQTTHPEL-
: : .. .: . : .: .. ..:. .:..: . ... .... ...: .
NP_085 VATQLTQLASIIKINYIKPEDKKVESTPTSLVTCNVQQKYNQEKGTIQQKPPSSVHNNHG
1080 1090 1100 1110 1120 1130
860 870 880 890 900 910
pF1KB9 --FAGNKTQNLHHMQYFPNNVIPKQDLLHRCFQEQE-QKSQQASVLQGYKNRNQDMSGQQ
.. .:. . .. . :. :. .::.. :: .. : . : : :
NP_085 SSLTKQKNPTQKKTKSTPSRDRRKKKPTVVSYQENDRQKWEKLSYMYGTICDIWIASKFQ
1140 1150 1160 1170 1180 1190
920 930 940 950 960
pF1KB9 AAQLAQQRYLIHNHANVFPVPDQGG------SHTQTPPQKDTQKHAALRWHLLQKQEQQQ
...: . :. .:: ... ..:.. : : : ::. ..
NP_085 --NFGQ--FCPHDFPTVFGKISSSTKIWKPLAQTRSIMQPKTV-FPPLTQIKLQRYPESA
1200 1210 1220 1230 1240 1250
970 980 990 1000 1010
pF1KB9 TQQPQTESCHSQMHRPIKVEPGCKP------HACMHTAPPENKTWKKVTKQENPPASCDN
.. ..: : .:.: . : .. .. . :. . .:. .:: .: :
NP_085 EEKVKVEPLDSLSLFHLKTESNGKAFTDKAYNSQVQLTVNANQKAHPLTQPSSPPNQCAN
1260 1270 1280 1290 1300 1310
1020 1030 1040 1050 1060
pF1KB9 VQ--------QKSIIET-MEQHLKQF----HAKSLFDHKALTLKSQKQVKVEMSGPVTVL
:. :. . : :.:.: . : : ..::::.. :.: :: .::.
NP_085 VMAGDDQIRFQQVVKEQLMHQRLPTLPGISHETPL-PESALTLRN---VNVVCSGGITVV
1320 1330 1340 1350 1360
1070 1080 1090 1100 1110 1120
pF1KB9 TRQTTAAELDSHTPALEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVK
. .. :. .:: : :. :. .:: . ... .: :::.. .
NP_085 STKSE-----------EEVCSSSFGTSEFSTVDSAQKNFNDYAMNFFTNPTKNLVS--IT
1370 1380 1390 1400 1410
1130 1140 1150 1160 1170 1180
pF1KB9 TQYDFPSCRCVEQIIEKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVIYTGK
. ..:.: :....:.::.::.::::::::.:::.:::::.:.::::.::::: :.::::
NP_085 KDSELPTCSCLDRVIQKDKGPYYTHLGAGPSVAAVREIMENRYGQKGNAIRIEIVVYTGK
1420 1430 1440 1450 1460 1470
1190 1200 1210 1220 1230 1240
pF1KB9 EGKSSQGCPIAKWVVRRSSSEEKLLCLVRERAGHTCEAAVIVILILVWEGIPLSLADKLY
:::::.::::::::.::::.:::.:::::.:.:: : .::.:.::.::.:::: .::.::
NP_085 EGKSSHGCPIAKWVLRRSSDEEKVLCLVRQRTGHHCPTAVMVVLIMVWDGIPLPMADRLY
1480 1490 1500 1510 1520 1530
1250 1260 1270 1280 1290 1300
pF1KB9 SELTETLRKY-GTLTNRRCALNEERTCACQGLDPETCGASFSFGCSWSMYYNGCKFARSK
.::::.:..: : :.:::.:::.:::.:::.::::::::::::::::::.:::::.::
NP_085 TELTENLKSYNGHPTDRRCTLNENRTCTCQGIDPETCGASFSFGCSWSMYFNGCKFGRSP
1540 1550 1560 1570 1580 1590
1310 1320 1330 1340 1350 1360
pF1KB9 IPRKFKLLGDDPKEEEKLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLGLKE
::.:.. ..: .:..::..::.:.: .:: ::. :: ::.::.:::. : ::::: ::
NP_085 SPRRFRIDPSSPLHEKNLEDNLQSLATRLAPIYKQYAPVAYQNQVEYENVARECRLGSKE
1600 1610 1620 1630 1640 1650
1370 1380 1390 1400 1410 1420
pF1KB9 GRPFSGVTACLDFCAHAHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLYKVS
:::::::::::::::: :::.:::.::::.:::::::::: .: :.:::::::::::.:
NP_085 GRPFSGVTACLDFCAHPHRDIHNMNNGSTVVCTLTREDNRSLGVIPQDEQLHVLPLYKLS
1660 1670 1680 1690 1700 1710
1430 1440 1450 1460 1470 1480
pF1KB9 DVDEFGSVEAQEEKKRSGAIQVLSSFRRKVRMLAEPV-KTCRQRKLEAKKAAAEKLSSLE
:.::::: :..: : .::::.::. :.: ...:: .. ..: .. :.:. ..:
NP_085 DTDEFGSKEGMEAKIKSGAIEVLAPRRKKRTCFTQPVPRSGKKRAAMMTEVLAHKIRAVE
1720 1730 1740 1750 1760 1770
1490 1500 1510 1520 1530 1540
pF1KB9 NSSNKNEKEKSAPSRTKQTENASQAKQLAELLRLSGPVMQQSQQPQPLQKQPPQPQQQQR
.. :.:. . : : :. ..: : : .... :: :. .:. .
NP_085 KKPIPRIKRKNNSTTT----NNSKPSSLPTL----G---SNTETVQPEVKSETEPHFILK
1780 1790 1800 1810 1820
1550 1560 1570 1580 1590 1600
pF1KB9 PQQQQPHHPQTESVNSYSASGSTNPYMRRPNPVSPYPNSSHTSDIYGSTSPMNFYSTSSQ
.......:: :. :.::. . : .:..: . . ..
NP_085 ---------SSDNTKTYSLMPSA------PHPVKEASPGFSWSPKTASATPAPLKNDATA
1830 1840 1850 1860
1610 1620 1630 1640 1650 1660
pF1KB9 AAGSYLNSSNPMNPYPGLLNQNTQYPSYQCNGNLSVDNCSPYLGSYSPQSQPMDLYRYPS
. : ::.: .: .: :: : . : :.
NP_085 SCGFSERSSTPHCTMP--------------SGRLSGANAAAADG--------------PG
1870 1880 1890 1900
1670 1680 1690 1700 1710 1720
pF1KB9 QDPLSKLSLPPIHTLYQPRFGNSQSFTSKYLGYGNQNMQGDGFSSCTIRPNVHHVGKLPP
. :.... :. :: : ...: ..
NP_085 ISQLGEVA--PLPTLSAP----------------------------VMEPLINS------
1910 1920
1730 1740 1750 1760 1770 1780
pF1KB9 YPTHEMDGHFMGATSRLPPNLSNPNMDYKNGEHHSPSHIIHNYSAAPGMFNSSLHALHLQ
:. :.: : :. .:: :.:: . ..: . :: :
NP_085 EPS-------TGVTEPLTPH--QPN--------HQPSFL-----TSPQDLASSPMEEDEQ
1930 1940 1950 1960
1790 1800 1810 1820 1830 1840
pF1KB9 NKENDMLSHTANGLSKMLPALNHDRTACVQGGLHKLSDANGQEKQPLALVQGVASGAEDN
..: : : :. : :: : .:: :
NP_085 HSEADEPPSDE-------P-LSDD----------PLSPA--EEKLPHI------------
1970 1980 1990
1850 1860 1870 1880 1890 1900
pF1KB9 DEVWSDSEQSFLDPDIGGVAVAPTHGSILIECAKRELHATTPLKNPNRNHPTRISLVFYQ
:: :::::. ::: .:::::.::.:::.:::::.::::::::...::::::::.::::::
NP_085 DEYWSDSEHIFLDANIGGVAIAPAHGSVLIECARRELHATTPVEHPNRNHPTRLSLVFYQ
2000 2010 2020 2030 2040 2050
1910 1920 1930 1940 1950 1960
pF1KB9 HKSMNEPKHGLALWEAKM-AEKAREKEEECEKYGPDYVPQKSHGKKVKREPAEPHETSEP
::..:.:.::. : . :. :..:..:. .:. .: . :...::
NP_085 HKNLNKPQHGFELNKIKFEAKEAKNKK------------MKASEQKDQAANEGPEQSSEV
2060 2070 2080 2090
1970 1980 1990 2000
pF1KB9 TYLRFIKSLAERTMSVTTDSTVTTSPYAFTRVTGPYNRYI
. : : : ......: :..::.::::.:.:.::::...
NP_085 NELNQIPS--HKALTLTHDNVVTVSPYALTHVAGPYNHWV
2100 2110 2120 2130
2002 residues in 1 query sequences
61265892 residues in 86068 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Feb 10 15:01:56 2017 done: Fri Feb 10 15:01:59 2017
Total Scan time: 20.080 Total Display time: 0.980
Function used was FASTA [36.3.4 Apr, 2011]