FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2295, 2136 aa
1>>>pF1KE2295 2136 - 2136 aa - 2136 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.1548+/-0.00116; mu= 7.2754+/- 0.070
mean_var=179.3537+/-36.285, 0's: 0 Z-trim(108.3): 28 B-trim: 0 in 0/52
Lambda= 0.095768
statistics sampled from 10099 (10114) to 10099 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.646), E-opt: 0.2 (0.311), width: 16
Scan time: 6.540
The best scores are: opt bits E(32554)
CCDS7281.1 TET1 gene_id:80312|Hs108|chr10 (2136) 14256 1983.6 0
CCDS47120.1 TET2 gene_id:54790|Hs108|chr4 (2002) 1809 263.9 5.2e-69
CCDS46339.2 TET3 gene_id:200424|Hs108|chr2 (1795) 1727 252.5 1.2e-65
>>CCDS7281.1 TET1 gene_id:80312|Hs108|chr10 (2136 aa)
initn: 14256 init1: 14256 opt: 14256 Z-score: 10646.2 bits: 1983.6 E(32554): 0
Smith-Waterman score: 14256; 99.9% identity (100.0% similar) in 2136 aa overlap (1-2136:1-2136)
10 20 30 40 50 60
pF1KE2 MSRSRHARPSRLVRKEDVNKKKKNSQLRKTTKGANKNVASVKTLSPGKLKQLIQERDVKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 MSRSRHARPSRLVRKEDVNKKKKNSQLRKTTKGANKNVASVKTLSPGKLKQLIQERDVKK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 KTEPKPPVPVRSLLTRAGAARMNLDRTEVLFQNPESLTCNGFTMALRSTSLSRRLSQPPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 KTEPKPPVPVRSLLTRAGAARMNLDRTEVLFQNPESLTCNGFTMALRSTSLSRRLSQPPL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 VVAKSKKVPLSKGLEKQHDCDYKILPALGVKHSENDSVPMQDTQVLPDIETLIGVQNPSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 VVAKSKKVPLSKGLEKQHDCDYKILPALGVKHSENDSVPMQDTQVLPDIETLIGVQNPSL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 LKGKSQETTQFWTQRVEDSKINIPTHSGPAAEILPGPLEGTRCGEGLFSEETLNDTSGSP
::::::::::::.:::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 LKGKSQETTQFWSQRVEDSKINIPTHSGPAAEILPGPLEGTRCGEGLFSEETLNDTSGSP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 KMFAQDTVCAPFPQRVTPKVTSQGNPSIQLEELGSRVESLKLSDSYLDPIKSEHDCYPTS
:::::::::::::::.::::::::::::::::::::::::::::::::::::::::::::
CCDS72 KMFAQDTVCAPFPQRATPKVTSQGNPSIQLEELGSRVESLKLSDSYLDPIKSEHDCYPTS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 SLNKVIPDLNLRNCLALGGSTSPTSVIKFLLAGSKQATLGAKPDHQEAFEATANQQEVSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 SLNKVIPDLNLRNCLALGGSTSPTSVIKFLLAGSKQATLGAKPDHQEAFEATANQQEVSD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 TTSFLGQAFGAIPHQWELPGADPVHGEALGETPDLPEIPGAIPVQGEVFGTILDQQETLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 TTSFLGQAFGAIPHQWELPGADPVHGEALGETPDLPEIPGAIPVQGEVFGTILDQQETLG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 MSGSVVPDLPVFLPVPPNPIATFNAPSKWPEPQSTVSYGLAVQGAIQILPLGSGHTPQSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 MSGSVVPDLPVFLPVPPNPIATFNAPSKWPEPQSTVSYGLAVQGAIQILPLGSGHTPQSS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 SNSEKNSLPPVMAISNVENEKQVHISFLPANTQGFPLAPERGLFHASLGIAQLSQAGPSK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 SNSEKNSLPPVMAISNVENEKQVHISFLPANTQGFPLAPERGLFHASLGIAQLSQAGPSK
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 SDRGSSQVSVTSTVHVVNTTVVTMPVPMVSTSSSSYTTLLPTLEKKKRKRCGVCEPCQQK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 SDRGSSQVSVTSTVHVVNTTVVTMPVPMVSTSSSSYTTLLPTLEKKKRKRCGVCEPCQQK
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE2 TNCGECTYCKNRKNSHQICKKRKCEELKKKPSVVVPLEVIKENKRPQREKKPKVLKADFD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 TNCGECTYCKNRKNSHQICKKRKCEELKKKPSVVVPLEVIKENKRPQREKKPKVLKADFD
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE2 NKPVNGPKSESMDYSRCGHGEEQKLELNPHTVENVTKNEDSMTGIEVEKWTQNKKSQLTD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 NKPVNGPKSESMDYSRCGHGEEQKLELNPHTVENVTKNEDSMTGIEVEKWTQNKKSQLTD
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE2 HVKGDFSANVPEAEKSKNSEVDKKRTKSPKLFVQTVRNGIKHVHCLPAETNVSFKKFNIE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 HVKGDFSANVPEAEKSKNSEVDKKRTKSPKLFVQTVRNGIKHVHCLPAETNVSFKKFNIE
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE2 EFGKTLENNSYKFLKDTANHKNAMSSVATDMSCDHLKGRSNVLVFQQPGFNCSSIPHSSH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 EFGKTLENNSYKFLKDTANHKNAMSSVATDMSCDHLKGRSNVLVFQQPGFNCSSIPHSSH
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE2 SIINHHASIHNEGDQPKTPENIPSKEPKDGSPVQPSLLSLMKDRRLTLEQVVAIEALTQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 SIINHHASIHNEGDQPKTPENIPSKEPKDGSPVQPSLLSLMKDRRLTLEQVVAIEALTQL
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE2 SEAPSENSSPSKSEKDEESEQRTASLLNSCKAILYTVRKDLQDPNLQGEPPKLNHCPSLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 SEAPSENSSPSKSEKDEESEQRTASLLNSCKAILYTVRKDLQDPNLQGEPPKLNHCPSLE
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE2 KQSSCNTVVFNGQTTTLSNSHINSATNQASTKSHEYSKVTNSLSLFIPKSNSSKIDTNKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 KQSSCNTVVFNGQTTTLSNSHINSATNQASTKSHEYSKVTNSLSLFIPKSNSSKIDTNKS
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE2 IAQGIITLDNCSNDLHQLPPRNNEVEYCNQLLDSSKKLDSDDLSCQDATHTQIEEDVATQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 IAQGIITLDNCSNDLHQLPPRNNEVEYCNQLLDSSKKLDSDDLSCQDATHTQIEEDVATQ
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE2 LTQLASIIKINYIKPEDKKVESTPTSLVTCNVQQKYNQEKGTMQQKPPSSVHNNHGSSLT
::::::::::::::::::::::::::::::::::::::::::.:::::::::::::::::
CCDS72 LTQLASIIKINYIKPEDKKVESTPTSLVTCNVQQKYNQEKGTIQQKPPSSVHNNHGSSLT
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE2 KQKNPTQKKTKSTPSRDRRKKKPTVVSYQENDRQKWEKLSYMYGTICDIWIASKFQNFGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 KQKNPTQKKTKSTPSRDRRKKKPTVVSYQENDRQKWEKLSYMYGTICDIWIASKFQNFGQ
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE2 FCPHDFPTVFGKISSSTKIWKPLAQTRSIMQPKTVFPPLTQIKLQRYPESAEEKVKVEPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 FCPHDFPTVFGKISSSTKIWKPLAQTRSIMQPKTVFPPLTQIKLQRYPESAEEKVKVEPL
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE2 DSLSLFHLKTESNGKAFTDKAYNSQVQLTVNANQKAHPLTQPSSPPNQCANVMAGDDQIR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 DSLSLFHLKTESNGKAFTDKAYNSQVQLTVNANQKAHPLTQPSSPPNQCANVMAGDDQIR
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE2 FQQVVKEQLMHQRLPTLPGISHETPLPESALTLRNVNVVCSGGITVVSTKSEEEVCSSSF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 FQQVVKEQLMHQRLPTLPGISHETPLPESALTLRNVNVVCSGGITVVSTKSEEEVCSSSF
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE2 GTSEFSTVDSAQKNFNDYAMNFFTNPTKNLVSITKDSELPTCSCLDRVIQKDKGPYYTHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 GTSEFSTVDSAQKNFNDYAMNFFTNPTKNLVSITKDSELPTCSCLDRVIQKDKGPYYTHL
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE2 GAGPSVAAVREIMENRYGQKGNAIRIEIVVYTGKEGKSSHGCPIAKWVLRRSSDEEKVLC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 GAGPSVAAVREIMENRYGQKGNAIRIEIVVYTGKEGKSSHGCPIAKWVLRRSSDEEKVLC
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE2 LVRQRTGHHCPTAVMVVLIMVWDGIPLPMADRLYTELTENLKSYNGHPTDRRCTLNENRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 LVRQRTGHHCPTAVMVVLIMVWDGIPLPMADRLYTELTENLKSYNGHPTDRRCTLNENRT
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KE2 CTCQGIDPETCGASFSFGCSWSMYFNGCKFGRSPSPRRFRIDPSSPLHEKNLEDNLQSLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 CTCQGIDPETCGASFSFGCSWSMYFNGCKFGRSPSPRRFRIDPSSPLHEKNLEDNLQSLA
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KE2 TRLAPIYKQYAPVAYQNQVEYENVARECRLGSKEGRPFSGVTACLDFCAHPHRDIHNMNN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 TRLAPIYKQYAPVAYQNQVEYENVARECRLGSKEGRPFSGVTACLDFCAHPHRDIHNMNN
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KE2 GSTVVCTLTREDNRSLGVIPQDEQLHVLPLYKLSDTDEFGSKEGMEAKIKSGAIEVLAPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 GSTVVCTLTREDNRSLGVIPQDEQLHVLPLYKLSDTDEFGSKEGMEAKIKSGAIEVLAPR
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KE2 RKKRTCFTQPVPRSGKKRAAMMTEVLAHKIRAVEKKPIPRIKRKNNSTTTNNSKPSSLPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 RKKRTCFTQPVPRSGKKRAAMMTEVLAHKIRAVEKKPIPRIKRKNNSTTTNNSKPSSLPT
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KE2 LGSNTETVQPEVKSETEPHFILKSSDNTKTYSLMPSAPHPVKEASPGFSWSPKTASATPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 LGSNTETVQPEVKSETEPHFILKSSDNTKTYSLMPSAPHPVKEASPGFSWSPKTASATPA
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KE2 PLKNDATASCGFSERSSTPHCTMPSGRLSGANAAAADGPGISQLGEVAPLPTLSAPVMEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 PLKNDATASCGFSERSSTPHCTMPSGRLSGANAAAADGPGISQLGEVAPLPTLSAPVMEP
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KE2 LINSEPSTGVTEPLTPHQPNHQPSFLTSPQDLASSPMEEDEQHSEADEPPSDEPLSDDPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 LINSEPSTGVTEPLTPHQPNHQPSFLTSPQDLASSPMEEDEQHSEADEPPSDEPLSDDPL
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KE2 SPAEEKLPHIDEYWSDSEHIFLDANIGGVAIAPAHGSVLIECARRELHATTPVEHPNRNH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 SPAEEKLPHIDEYWSDSEHIFLDANIGGVAIAPAHGSVLIECARRELHATTPVEHPNRNH
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KE2 PTRLSLVFYQHKNLNKPQHGFELNKIKFEAKEAKNKKMKASEQKDQAANEGPEQSSEVNE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 PTRLSLVFYQHKNLNKPQHGFELNKIKFEAKEAKNKKMKASEQKDQAANEGPEQSSEVNE
2050 2060 2070 2080 2090 2100
2110 2120 2130
pF1KE2 LNQIPSHKALTLTHDNVVTVSPYALTHVAGPYNHWV
::::::::::::::::::::::::::::::::::::
CCDS72 LNQIPSHKALTLTHDNVVTVSPYALTHVAGPYNHWV
2110 2120 2130
>>CCDS47120.1 TET2 gene_id:54790|Hs108|chr4 (2002 aa)
initn: 2130 init1: 999 opt: 1809 Z-score: 1352.5 bits: 263.9 E(32554): 5.2e-69
Smith-Waterman score: 1859; 35.1% identity (62.6% similar) in 1070 aa overlap (941-1970:653-1674)
920 930 940 950 960 970
pF1KE2 SKSEKDEESEQRTASLLNSCKAILYTVRKDLQDPNLQGEPPKLNHCPSLEKQSSCNTVVF
.: :. : . : .: :. . :: :.:
CCDS47 KTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQVHFSKTDHLPKAHVQSLCGTRFH
630 640 650 660 670 680
980 990 1000 1010
pF1KE2 -----NGQTTTLSN----SHINSATNQAS--TKSHEYSKVTNSLSLFIPKSNSSKIDTNK
..:: : . .:.:. .... ..:: .. .. . :.::.. :.
CCDS47 FQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQHKPHKQAAQTQPSQSSHLPQNQ
690 700 710 720 730 740
1020 1030 1040 1050 1060 1070
pF1KE2 SIAQGIITLDNCSNDLHQLP-PR-NNEVEYCNQLLDSSKKLDSDDLSCQDATHTQIE-ED
. : . . : . :. .: :. ::. . .... ..: . : . ...: ..
CCDS47 QQQQKL-QIKNKEEILQTFPHPQSNNDQQREGSFFGQTKVEECFHGENQYSKSSEFETHN
750 760 770 780 790 800
1080 1090 1100 1110 1120 1130
pF1KE2 VATQLTQLASIIKINYIKPEDKKVESTPTSL-VTCNVQQKYNQEKGTMQQKPPSSVHNNH
: : .. .: . : .: .. ..:. .. :.:. . . .:. . .: . :.
CCDS47 VQMGLEEVQNINRRN--SPYSQTMKSSACKIQVSCSNNTHLVSENKEQTTHPELFAGNKT
810 820 830 840 850
1140 1150 1160 1170 1180 1190
pF1KE2 GSSLTKQKNPTQKKTKSTPSRDRRKKKPTVVSYQENDRQKWEKLSYMYGTICDIWIASKF
. : :.. :..: .. .::.. :: .. : . : :
CCDS47 QNLHHMQYFPNN----VIPKQDLLHR-----CFQEQE-QKSQQASVLQGYKNRNQDMSGQ
860 870 880 890 900
1200 1210 1220 1230 1240 1250
pF1KE2 Q--NFGQ--FCPHDFPTVFGKISSSTKIWKPLAQTRSIMQPKTV-FPPLTQIKLQRYPES
: ...: . :. .:: ... ..:.. : : : ::. ..
CCDS47 QAAQLAQQRYLIHNHANVFPVPDQGG------SHTQTPPQKDTQKHAALRWHLLQKQEQQ
910 920 930 940 950 960
1260 1270 1280 1290 1300 1310
pF1KE2 AEEKVKVEPLDSLSLFHLKTESNGKAFTDKAYNSQVQLTVNANQKAHPLTQPSSPPNQCA
.. ..: : .:.: . : .. .. . :. . .:. .:: .:
CCDS47 QTQQPQTESCHSQMHRPIKVEPGCKP------HACMHTAPPENKTWKKVTKQENPPASCD
970 980 990 1000 1010
1320 1330 1340 1350 1360
pF1KE2 NVMAGDDQIRFQQVVKEQLMHQRLPTLPGISHETPLPESALTLRN---VNVVCSGGITVV
:: :: . :.:.: . . : . ..::::.. :.: :: .::.
CCDS47 NV---------QQKSIIETMEQHLKQFHAKSL---FDHKALTLKSQKQVKVEMSGPVTVL
1020 1030 1040 1050 1060
1370 1380 1390 1400 1410
pF1KE2 STKSE-----------EEVCSSSFGTSEFSTVDSAQKNFNDYAMNFFTNPTKNLVS--IT
. .. :. .:: : :. :. .:: . ... .: :::.. .
CCDS47 TRQTTAAELDSHTPALEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVK
1070 1080 1090 1100 1110 1120
1420 1430 1440 1450 1460 1470
pF1KE2 KDSELPTCSCLDRVIQKDKGPYYTHLGAGPSVAAVREIMENRYGQKGNAIRIEIVVYTGK
. ..:.: :....:.::.::.::::::::.:::.:::::.:.::::.::::: :.::::
CCDS47 TQYDFPSCRCVEQIIEKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVIYTGK
1130 1140 1150 1160 1170 1180
1480 1490 1500 1510 1520 1530
pF1KE2 EGKSSHGCPIAKWVLRRSSDEEKVLCLVRQRTGHHCPTAVMVVLIMVWDGIPLPMADRLY
:::::.::::::::.::::.:::.:::::.:.:: : .::.:.::.::.:::: .::.::
CCDS47 EGKSSQGCPIAKWVVRRSSSEEKLLCLVRERAGHTCEAAVIVILILVWEGIPLSLADKLY
1190 1200 1210 1220 1230 1240
1540 1550 1560 1570 1580 1590
pF1KE2 TELTENLKSYNGHPTDRRCTLNENRTCTCQGIDPETCGASFSFGCSWSMYFNGCKFGRSP
.::::.:..: : :.:::.:::.:::.:::.::::::::::::::::::.:::::.::
CCDS47 SELTETLRKY-GTLTNRRCALNEERTCACQGLDPETCGASFSFGCSWSMYYNGCKFARSK
1250 1260 1270 1280 1290 1300
1600 1610 1620 1630 1640 1650
pF1KE2 SPRRFRIDPSSPLHEKNLEDNLQSLATRLAPIYKQYAPVAYQNQVEYENVARECRLGSKE
::.:.. ..: .:..::..::.:.: .:: ::. :: ::.::.:::. : ::::: ::
CCDS47 IPRKFKLLGDDPKEEEKLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLGLKE
1310 1320 1330 1340 1350 1360
1660 1670 1680 1690 1700 1710
pF1KE2 GRPFSGVTACLDFCAHPHRDIHNMNNGSTVVCTLTREDNRSLGVIPQDEQLHVLPLYKLS
:::::::::::::::: :::.:::.::::.:::::::::: .: :.:::::::::::.:
CCDS47 GRPFSGVTACLDFCAHAHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLYKVS
1370 1380 1390 1400 1410 1420
1720 1730 1740 1750 1760 1770
pF1KE2 DTDEFGSKEGMEAKIKSGAIEVLAPRRKKRTCFTQPVPRSGKKRAAMMTEVLAHKIRAVE
:.::::: :..: : .::::.::. :.: ...:: .. ..: .. :.:. ..:
CCDS47 DVDEFGSVEAQEEKKRSGAIQVLSSFRRKVRMLAEPV-KTCRQRKLEAKKAAAEKLSSLE
1430 1440 1450 1460 1470 1480
1780 1790 1800 1810 1820 1830
pF1KE2 KKPIPRIKRKNNSTTTNNSKPSSLPT-LGSNTETVQPEVKSETEPHFILKSSDNTKTYSL
.. :.:. . :.... .: :. . : ... .:. . :. . . .
CCDS47 NSSNKNEKEKSAPSRTKQTENASQAKQLAELLRLSGPVMQQSQQPQPLQKQPPQPQQQQR
1490 1500 1510 1520 1530 1540
1840 1850 1860 1870 1880 1890
pF1KE2 -MPSAPH-PVKEASPGFSWSPKTASATPAPLKNDATASCGFSERSSTPHCTMPSGRLSGA
. . :: : :. ..: : .: : : .. . :. :. : : . : .
CCDS47 PQQQQPHHPQTESVNSYSASGSTNPYMRRP--NPVSPYPNSSHTSDIYGSTSPMNFYSTS
1550 1560 1570 1580 1590 1600
1900 1910 1920 1930 1940 1950
pF1KE2 NAAAADGPGISQLGEVAPLP-TLSAPVMEPLINSEPSTGVTEPLTPHQPNHQPSFLTSPQ
. :: : ... . . : : :. .. : . . . .: . .:. ...:. ..:.
CCDS47 SQAA--GSYLNSSNPMNPYPGLLNQNTQYPSYQCNGNLSV-DNCSPYLGSYSPQ--SQPM
1610 1620 1630 1640 1650
1960 1970 1980 1990 2000 2010
pF1KE2 DLASSPMEEDEQHSEADEPPSDEPLSDDPLSPAEEKLPHIDEYWSDSEHIFLDANIGGVA
:: : .. :. . ::
CCDS47 DLYRYPSQDPL--SKLSLPPIHTLYQPRFGNSQSFTSKYLGYGNQNMQGDGFSSCTIRPN
1660 1670 1680 1690 1700 1710
>--
initn: 528 init1: 414 opt: 510 Z-score: 382.5 bits: 84.4 E(32554): 5.5e-15
Smith-Waterman score: 510; 50.0% identity (78.1% similar) in 160 aa overlap (1991-2136:1844-2002)
1970 1980 1990 2000 2010 2020
pF1KE2 EQHSEADEPPSDEPLSDDPLSPAEEKLPHIDEYWSDSEHIFLDANIGGVAIAPAHGSVLI
:: :::::. ::: .:::::.::.:::.::
CCDS47 GGLHKLSDANGQEKQPLALVQGVASGAEDNDEVWSDSEQSFLDPDIGGVAVAPTHGSILI
1820 1830 1840 1850 1860 1870
2030 2040 2050 2060 2070
pF1KE2 ECARRELHATTPVEHPNRNHPTRLSLVFYQHKNLNKPQHGFELNKIKFEAKEAKNKK---
:::.::::::::...::::::::.::::::::..:.:.::. : . :. :..:..:.
CCDS47 ECAKRELHATTPLKNPNRNHPTRISLVFYQHKSMNEPKHGLALWEAKM-AEKAREKEEEC
1880 1890 1900 1910 1920 1930
2080 2090 2100 2110 2120
pF1KE2 ---------MKASEQKDQAANEGPEQSSEVNELNQIPS--HKALTLTHDNVVTVSPYALT
.:. .: . :...:: . : : : ......: :..::.::::.:
CCDS47 EKYGPDYVPQKSHGKKVKREPAEPHETSEPTYLRFIKSLAERTMSVTTDSTVTTSPYAFT
1940 1950 1960 1970 1980 1990
2130
pF1KE2 HVAGPYNHWV
.:.::::...
CCDS47 RVTGPYNRYI
2000
>>CCDS46339.2 TET3 gene_id:200424|Hs108|chr2 (1795 aa)
initn: 1717 init1: 958 opt: 1727 Z-score: 1292.0 bits: 252.5 E(32554): 1.2e-65
Smith-Waterman score: 2049; 31.6% identity (57.0% similar) in 1510 aa overlap (585-2013:51-1446)
560 570 580 590 600 610
pF1KE2 HVVNTTVVTMPVPMVSTSSSSYTTLLPTLEKKKRKRCGVCEPCQQKTNCGECTYCKNRKN
.:::::::.::::.. ::: :: : ::.
CCDS46 PQRQVMVGSFPGSGLSMAGSESQLRGGGDGRKKRKRCGTCEPCRRLENCGACTSCTNRR-
30 40 50 60 70
620 630 640 650 660 670
pF1KE2 SHQICKKRKCEELKKKPSVVVPLEVIKENKRPQREKKPKVLKADFDNKPVNGPKSESMDY
.::::: :::: :::: ... .: :: .. . ..:. . .::.:: .::
CCDS46 THQICKLRKCEVLKKKVGLLKEVE-IKAGEGAGPWGQGAAVKTGSELSPVDGPVPGQMDS
80 90 100 110 120 130
680 690 700 710 720
pF1KE2 SRCGHGEEQKLELNPHTVENVTKNED-SMTGIEVEKWTQNKK------------SQLTD-
. ::. ..: . :... . :. : : ..: ..: :
CCDS46 GPVYHGDSRQLSASGVPVNGAREPAGPSLLGTG-GPWRVDQKPDWEAAPGPAHTARLEDA
140 150 160 170 180 190
730 740 750 760 770 780
pF1KE2 HVKGDFSANVPEAEKSKNSEVDKKRTKSPKLFVQTVRNGIKHVHCLPAETNVSFKKFNIE
: ::: : :: .: .. . . . . . :. . . : ... . ..
CCDS46 HDLVAFSA-VAEAVSSYGALSTRLYETFNREMSREAGNNSRGPRPGPEGCSAGSEDLDTL
200 210 220 230 240 250
790 800 810 820 830 840
pF1KE2 EFGKTLENNSYKFLKDTANHKNAMSSVATDMSCDHLKGRSNVLVFQQPGFNCSSIPHSSH
. . .: ...: . : . :. . :.:. . .:.. : . .:
CCDS46 QTALALARHGMK-----PPNCNCDGPECPDY-LEWLEGKIKSVVMEG-GEERPRLP---G
260 270 280 290 300
850 860 870 880 890 900
pF1KE2 SIINHHASIHNEGDQPKTPENIPSKEPKDGSPVQPSLLSLMKDRRLTLEQVVAIEALTQL
. .:.. . .: ..:. :..: :.. : ::. :.. ..:. ..::::::::
CCDS46 PLPPGEAGLPAPSTRPLLSSEVPQISPQEGLPLSQSALSIAKEKNISLQTAIAIEALTQL
310 320 330 340 350 360
910 920 930 940 950
pF1KE2 SEA---PSENSSPSKSEKDEESEQRTASLLNSCKAILYTVRKDLQDPNLQGEPPKLNHCP
: : :: .:.:. : :. : : . . .. :. :. ::.
CCDS46 SSALPQPS-HSTPQASCPLPEAL--------SPPAPFRSPQSYLRAPSWPVVPPE-----
370 380 390 400 410
960 970 980 990 1000 1010
pF1KE2 SLEKQSSCNTVVFNGQTTTLSNSHINSATNQASTKSHEYSKVTNSLSLFIPKSNSSKIDT
:.:. . . : : : . ...
CCDS46 -------------------------------------EHSSFAPDSSAFPPATPRTEFPE
420 430
1020 1030 1040 1050 1060 1070
pF1KE2 NKSIAQGIITLDNCSNDLHQLP-PRNNEVEYCNQLLDSSKKLDSDDLSCQDATHTQIEED
: : : . .: : . . .::: :.. .. .. .: :. .
CCDS46 ----AWGTDTPPATPRSSWPMPRPSPDPMAELEQLLGSASDYIQSVFKRPEALPTKPKVK
440 450 460 470 480 490
1080 1090 1100 1110 1120 1130
pF1KE2 VATQLTQLASIIKINYIKPEDKKVESTPTSLVTCNVQQKYNQEKGTMQQKPPSSVHNNHG
: . .. : . : .. ::.: ...:: . ..:: : .:
CCDS46 VEAPSSSPAPAPS-----PVLQREAPTPSS--EPDTHQK---AQTALQQ------HLHHK
500 510 520 530
1140 1150 1160 1170 1180 1190
pF1KE2 SSL-TKQKNPTQKKTKSTPSRDRRKKKPTVVSYQENDRQKWEKLSYMYGTICDIWIASKF
:: .: . :. . : :: :. . :: :: .:.
CCDS46 RSLFLEQVHDTSFPAPSEPSAPGWWPPPSSPVPRLPDRPPKEK-------------KKKL
540 550 560 570 580
1200 1210 1220 1230 1240 1250
pF1KE2 QNFGQFCPHDFPTVFGKISSSTK--IWKPLAQTRS-IMQPKTVFPPLTQIKLQRYPESAE
. : :. : . . : . ::. .: . . .:::. :: :. :
CCDS46 PT-----PAGGPVGTEKAAPGIKPSVRKPIQIKKSRPREAQPLFPPVRQIVLEGLRSPAS
590 600 610 620 630
1260 1270 1280 1290 1300
pF1KE2 EKVKVEPLDSL-----SLFHLKTESNGKAFTDKAYNSQVQLTVNANQKAHPLTQPSSPPN
..:...: : : : : . :. . ... .. .. :.: . :.
CCDS46 QEVQAHPPAPLPASQGSAVPLPPEPSLALFAPSPSRDSLLPPTQEMRSPSPMT--ALQPG
640 650 660 670 680 690
1310 1320 1330 1340 1350
pF1KE2 QCANVMAGDDQI-----RFQQVVKEQLMHQRLPTLPGISHET-----PLPESALTLRN--
. . . .::.. .:. ... :..: . :. : ::: .. :.
CCDS46 STGPLPPADDKLEELIRQFEAEFGDSFGLPGPPSVPIQDPENQQTCLPAPESPFATRSPK
700 710 720 730 740 750
1360 1370 1380 1390 1400 1410
pF1KE2 -VNVVCSGGITVVSTKS--EEEVCSSSFGTSEFSTVDSAQKNFNDYAMNFFTNPTKNLVS
... ::..::.:: :: . . :. . . . ..: . .... .:::.:..
CCDS46 QIKIESSGAVTVLSTTCFHSEEGGQEATPTKAENPLTPTLSGFLESPLKYLDTPTKSLLD
760 770 780 790 800 810
1420 1430 1440 1450 1460
pF1KE2 ITK---DSELPTCSCLDRVIQKDKGPYYTHLGAGPSVAAVREIMENRYGQKGNAIRIEIV
..:.:::.:......::.::::::::.::.::..::.::.:::.::.::::: :
CCDS46 TPAKRAQAEFPTCDCVEQIVEKDEGPYYTHLGSGPTVASIRELMEERYGEKGKAIRIEKV
820 830 840 850 860 870
1470 1480 1490 1500 1510 1520
pF1KE2 VYTGKEGKSSHGCPIAKWVLRRSSDEEKVLCLVRQRTGHHCPTAVMVVLIMVWDGIPLPM
.:::::::::.::::::::.:: . :::.:::::.:.:::: .::.:.::..:.::: .
CCDS46 IYTGKEGKSSRGCPIAKWVIRRHTLEEKLLCLVRHRAGHHCQNAVIVILILAWEGIPRSL
880 890 900 910 920 930
1530 1540 1550 1560 1570 1580
pF1KE2 ADRLYTELTENLKSYNGHPTDRRCTLNENRTCTCQGIDPETCGASFSFGCSWSMYFNGCK
.: :: :::..:..: :.::.::: ::..:::.::: ::.::::::::::::::::::::
CCDS46 GDTLYQELTDTLRKY-GNPTSRRCGLNDDRTCACQGKDPNTCGASFSFGCSWSMYFNGCK
940 950 960 970 980 990
1590 1600 1610 1620 1630 1640
pF1KE2 FGRSPSPRRFRIDPSSPLHEKNLEDNLQSLATRLAPIYKQYAPVAYQNQVEYENVARECR
..:: .::.::. ..: .:. :. ..:.:::..::.::. :: :::::: :..: .::
CCDS46 YARSKTPRKFRLAGDNPKEEEVLRKSFQDLATEVAPLYKRLAPQAYQNQVTNEEIAIDCR
1000 1010 1020 1030 1040 1050
1650 1660 1670 1680 1690 1700
pF1KE2 LGSKEGRPFSGVTACLDFCAHPHRDIHNMNNGSTVVCTLTREDNRSLGVIPQDEQLHVLP
:: ::::::.:::::.::::: :.: ::. :: :::::::.:::: .: ::.::::::::
CCDS46 LGLKEGRPFAGVTACMDFCAHAHKDQHNLYNGCTVVCTLTKEDNRCVGKIPEDEQLHVLP
1060 1070 1080 1090 1100 1110
1710 1720 1730 1740 1750 1760
pF1KE2 LYKLSDTDEFGSKEGMEAKIKSGAIEVLA--PRRKKRTCFTQPVP-RSGKKRAAMMTEVL
:::...::::::.:...::. ::::.::. ::. .: : : .: ..: ..
CCDS46 LYKMANTDEFGSEENQNAKVGSGAIQVLTAFPREVRRL----PEPAKSCRQRQLEARKAA
1120 1130 1140 1150 1160 1170
1770 1780 1790 1800 1810 1820
pF1KE2 AHKIRAV-EKKPIP-RIKRKNNSTTTNNSKPSSLPTLGSNTETVQPEVKSETEPHFI-LK
:.: . :: : .::.. . .: :. : . . ..: .: : . :: .:
CCDS46 AEKKKIQKEKLSTPEKIKQEALELAGITSDPGLSLKGGLSQQGLKPSLKVEPQNHFSSFK
1180 1190 1200 1210 1220 1230
1830 1840 1850 1860 1870
pF1KE2 SSDNT--KTYSLM----PSAPHPVKEASPGFSW--SPKTASATPAPLKNDATASCGFSER
: :. ..::.. :: :. .. . :. .:. .:.. : . ..
CCDS46 YSGNAVVESYSVLGNCRPSDPYSMNSVYSYHSYYAQPSLTSVNGFHSKYALPSFSYYGFP
1240 1250 1260 1270 1280 1290
1880 1890 1900 1910
pF1KE2 SSTPHCTMPSGRL-------SGANAAAADGPGISQL----------GEVAPLPTLSAPV-
::.: ..:: : ::.... : . : .: : ::. ..:.
CCDS46 SSNP--VFPSQFLGPGAWGHSGSSGSFEKKPDLHALHNSLSPAYGGAEFAELPSQAVPTD
1300 1310 1320 1330 1340
1920 1930 1940 1950 1960 1970
pF1KE2 -MEPLIN-SEPS-TGVTEPLTPHQPN-HQPSFLTSPQDLASSPMEEDEQHSEADEPPSDE
.: . ..:. : : : :. : :. : :: .:. .... .. .: . :
CCDS46 AHHPTPHHQQPAYPGPKEYLLPKAPLLHSVSRDPSPFAQSSNCYNRSIKQEPVDPLTQAE
1350 1360 1370 1380 1390 1400
1980 1990 2000 2010 2020 2030
pF1KE2 PLSDDPLSPAEEKLPHIDEYWSDSEHIFLDANIGGVAIAPAHGSVLIECARRELHATTPV
:. : . .. : .... . : :.. . . :: ...:
CCDS46 PVPRDAGKMGKTPLSEVSQNGGPS-HLWGQYS-GGPSMSPKRTNGVGGSWGVFSSGESPA
1410 1420 1430 1440 1450 1460
2040 2050 2060 2070 2080 2090
pF1KE2 EHPNRNHPTRLSLVFYQHKNLNKPQHGFELNKIKFEAKEAKNKKMKASEQKDQAANEGPE
CCDS46 IVPDKLSSFGASCLAPSHFTDGQWGLFPGEGQQAASHSGGRLRGKPWSPCKFGNSTSALA
1470 1480 1490 1500 1510 1520
>--
initn: 595 init1: 425 opt: 553 Z-score: 415.4 bits: 90.3 E(32554): 8.1e-17
Smith-Waterman score: 553; 35.1% identity (62.5% similar) in 339 aa overlap (1826-2136:1470-1795)
1800 1810 1820 1830 1840 1850
pF1KE2 SSLPTLGSNTETVQPEVKSETEPHFILKSSDNTKTYSLMPSAPHPVKEASPGF--SWSPK
:. .... :: ... :. . . .
CCDS46 GGPSMSPKRTNGVGGSWGVFSSGESPAIVPDKLSSFGASCLAPSHFTDGQWGLFPGEGQQ
1440 1450 1460 1470 1480 1490
1860 1870 1880 1890 1900
pF1KE2 TASATPAPLKNDATASCGFSERSST---PHCTMPSGRLSGA--NAAAADGPGISQL----
.:: . . :.. . : :.. .:. : : :... :.: .::...
CCDS46 AASHSGGRLRGKPWSPCKFGNSTSALAGPSLTEKPWALGAGDFNSALKGSPGFQDKLWNP
1500 1510 1520 1530 1540 1550
1910 1920 1930 1940 1950 1960
pF1KE2 --GEVAPLPTLSAPVMEPLINSEP-STGVTEPLTPHQPNHQPSFLTSPQDLASSPMEEDE
:: . .:. .: .. .: : .: : ... : .: .: .:
CCDS46 MKGEEGRIPAAGASQLDRAWQSFGLPLGSSEKLFGALKSEEK--LWDPFSLEEGP-----
1560 1570 1580 1590 1600 1610
1970 1980 1990 2000 2010 2020
pF1KE2 QHSEADEPPSDEPLSDDPLSPAEEKLPHIDEYWSDSEHIFLDANIGGVAIAPAHGSVLIE
:.:::: .... . . :. . .: :::::: ::: ::::::.::::::.:::
CCDS46 ----AEEPPSKGAVKEEKGGGGAEE--EEEELWSDSEHNFLDENIGGVAVAPAHGSILIE
1620 1630 1640 1650 1660
2030 2040 2050 2060 2070
pF1KE2 CARRELHATTPVEHPNRNHPTRLSLVFYQHKNLNKPQHGFEL--NKIKFEAKEAKNKKMK
:::::::::::...::: ::::.:::::::::::.:.::. : :.: :..:. .. .
CCDS46 CARRELHATTPLKKPNRCHPTRISLVFYQHKNLNQPNHGLALWEAKMKQLAERARARQEE
1670 1680 1690 1700 1710 1720
2080 2090 2100 2110 2120
pF1KE2 ASEQ---KDQAANEGPEQS---SEVNELNQ------IPSHKALTLTHDNVVTVSPYALTH
:.. ...: : ... . : : .: .:...::.. :..:::: :: :.
CCDS46 AARLGLGQQEAKLYGKKRKWGGTVVAEPQQKEKKGVVPTRQALAVPTDSAVTVSSYAYTK
1730 1740 1750 1760 1770 1780
2130
pF1KE2 VAGPYNHWV
:.:::..:.
CCDS46 VTGPYSRWI
1790
2136 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 15:27:14 2016 done: Sun Nov 6 15:27:16 2016
Total Scan time: 6.540 Total Display time: 0.400
Function used was FASTA [36.3.4 Apr, 2011]