FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2295, 2136 aa 1>>>pF1KE2295 2136 - 2136 aa - 2136 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.1548+/-0.00116; mu= 7.2754+/- 0.070 mean_var=179.3537+/-36.285, 0's: 0 Z-trim(108.3): 28 B-trim: 0 in 0/52 Lambda= 0.095768 statistics sampled from 10099 (10114) to 10099 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.646), E-opt: 0.2 (0.311), width: 16 Scan time: 6.540 The best scores are: opt bits E(32554) CCDS7281.1 TET1 gene_id:80312|Hs108|chr10 (2136) 14256 1983.6 0 CCDS47120.1 TET2 gene_id:54790|Hs108|chr4 (2002) 1809 263.9 5.2e-69 CCDS46339.2 TET3 gene_id:200424|Hs108|chr2 (1795) 1727 252.5 1.2e-65 >>CCDS7281.1 TET1 gene_id:80312|Hs108|chr10 (2136 aa) initn: 14256 init1: 14256 opt: 14256 Z-score: 10646.2 bits: 1983.6 E(32554): 0 Smith-Waterman score: 14256; 99.9% identity (100.0% similar) in 2136 aa overlap (1-2136:1-2136) 10 20 30 40 50 60 pF1KE2 MSRSRHARPSRLVRKEDVNKKKKNSQLRKTTKGANKNVASVKTLSPGKLKQLIQERDVKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 MSRSRHARPSRLVRKEDVNKKKKNSQLRKTTKGANKNVASVKTLSPGKLKQLIQERDVKK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 KTEPKPPVPVRSLLTRAGAARMNLDRTEVLFQNPESLTCNGFTMALRSTSLSRRLSQPPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 KTEPKPPVPVRSLLTRAGAARMNLDRTEVLFQNPESLTCNGFTMALRSTSLSRRLSQPPL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 VVAKSKKVPLSKGLEKQHDCDYKILPALGVKHSENDSVPMQDTQVLPDIETLIGVQNPSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 VVAKSKKVPLSKGLEKQHDCDYKILPALGVKHSENDSVPMQDTQVLPDIETLIGVQNPSL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 LKGKSQETTQFWTQRVEDSKINIPTHSGPAAEILPGPLEGTRCGEGLFSEETLNDTSGSP ::::::::::::.::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 LKGKSQETTQFWSQRVEDSKINIPTHSGPAAEILPGPLEGTRCGEGLFSEETLNDTSGSP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 KMFAQDTVCAPFPQRVTPKVTSQGNPSIQLEELGSRVESLKLSDSYLDPIKSEHDCYPTS :::::::::::::::.:::::::::::::::::::::::::::::::::::::::::::: CCDS72 KMFAQDTVCAPFPQRATPKVTSQGNPSIQLEELGSRVESLKLSDSYLDPIKSEHDCYPTS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 SLNKVIPDLNLRNCLALGGSTSPTSVIKFLLAGSKQATLGAKPDHQEAFEATANQQEVSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 SLNKVIPDLNLRNCLALGGSTSPTSVIKFLLAGSKQATLGAKPDHQEAFEATANQQEVSD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 TTSFLGQAFGAIPHQWELPGADPVHGEALGETPDLPEIPGAIPVQGEVFGTILDQQETLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 TTSFLGQAFGAIPHQWELPGADPVHGEALGETPDLPEIPGAIPVQGEVFGTILDQQETLG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 MSGSVVPDLPVFLPVPPNPIATFNAPSKWPEPQSTVSYGLAVQGAIQILPLGSGHTPQSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 MSGSVVPDLPVFLPVPPNPIATFNAPSKWPEPQSTVSYGLAVQGAIQILPLGSGHTPQSS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 SNSEKNSLPPVMAISNVENEKQVHISFLPANTQGFPLAPERGLFHASLGIAQLSQAGPSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 SNSEKNSLPPVMAISNVENEKQVHISFLPANTQGFPLAPERGLFHASLGIAQLSQAGPSK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 SDRGSSQVSVTSTVHVVNTTVVTMPVPMVSTSSSSYTTLLPTLEKKKRKRCGVCEPCQQK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 SDRGSSQVSVTSTVHVVNTTVVTMPVPMVSTSSSSYTTLLPTLEKKKRKRCGVCEPCQQK 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 TNCGECTYCKNRKNSHQICKKRKCEELKKKPSVVVPLEVIKENKRPQREKKPKVLKADFD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 TNCGECTYCKNRKNSHQICKKRKCEELKKKPSVVVPLEVIKENKRPQREKKPKVLKADFD 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 NKPVNGPKSESMDYSRCGHGEEQKLELNPHTVENVTKNEDSMTGIEVEKWTQNKKSQLTD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 NKPVNGPKSESMDYSRCGHGEEQKLELNPHTVENVTKNEDSMTGIEVEKWTQNKKSQLTD 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 HVKGDFSANVPEAEKSKNSEVDKKRTKSPKLFVQTVRNGIKHVHCLPAETNVSFKKFNIE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 HVKGDFSANVPEAEKSKNSEVDKKRTKSPKLFVQTVRNGIKHVHCLPAETNVSFKKFNIE 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE2 EFGKTLENNSYKFLKDTANHKNAMSSVATDMSCDHLKGRSNVLVFQQPGFNCSSIPHSSH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 EFGKTLENNSYKFLKDTANHKNAMSSVATDMSCDHLKGRSNVLVFQQPGFNCSSIPHSSH 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE2 SIINHHASIHNEGDQPKTPENIPSKEPKDGSPVQPSLLSLMKDRRLTLEQVVAIEALTQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 SIINHHASIHNEGDQPKTPENIPSKEPKDGSPVQPSLLSLMKDRRLTLEQVVAIEALTQL 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE2 SEAPSENSSPSKSEKDEESEQRTASLLNSCKAILYTVRKDLQDPNLQGEPPKLNHCPSLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 SEAPSENSSPSKSEKDEESEQRTASLLNSCKAILYTVRKDLQDPNLQGEPPKLNHCPSLE 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE2 KQSSCNTVVFNGQTTTLSNSHINSATNQASTKSHEYSKVTNSLSLFIPKSNSSKIDTNKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 KQSSCNTVVFNGQTTTLSNSHINSATNQASTKSHEYSKVTNSLSLFIPKSNSSKIDTNKS 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE2 IAQGIITLDNCSNDLHQLPPRNNEVEYCNQLLDSSKKLDSDDLSCQDATHTQIEEDVATQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 IAQGIITLDNCSNDLHQLPPRNNEVEYCNQLLDSSKKLDSDDLSCQDATHTQIEEDVATQ 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE2 LTQLASIIKINYIKPEDKKVESTPTSLVTCNVQQKYNQEKGTMQQKPPSSVHNNHGSSLT ::::::::::::::::::::::::::::::::::::::::::.::::::::::::::::: CCDS72 LTQLASIIKINYIKPEDKKVESTPTSLVTCNVQQKYNQEKGTIQQKPPSSVHNNHGSSLT 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE2 KQKNPTQKKTKSTPSRDRRKKKPTVVSYQENDRQKWEKLSYMYGTICDIWIASKFQNFGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 KQKNPTQKKTKSTPSRDRRKKKPTVVSYQENDRQKWEKLSYMYGTICDIWIASKFQNFGQ 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE2 FCPHDFPTVFGKISSSTKIWKPLAQTRSIMQPKTVFPPLTQIKLQRYPESAEEKVKVEPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 FCPHDFPTVFGKISSSTKIWKPLAQTRSIMQPKTVFPPLTQIKLQRYPESAEEKVKVEPL 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE2 DSLSLFHLKTESNGKAFTDKAYNSQVQLTVNANQKAHPLTQPSSPPNQCANVMAGDDQIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 DSLSLFHLKTESNGKAFTDKAYNSQVQLTVNANQKAHPLTQPSSPPNQCANVMAGDDQIR 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE2 FQQVVKEQLMHQRLPTLPGISHETPLPESALTLRNVNVVCSGGITVVSTKSEEEVCSSSF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 FQQVVKEQLMHQRLPTLPGISHETPLPESALTLRNVNVVCSGGITVVSTKSEEEVCSSSF 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE2 GTSEFSTVDSAQKNFNDYAMNFFTNPTKNLVSITKDSELPTCSCLDRVIQKDKGPYYTHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 GTSEFSTVDSAQKNFNDYAMNFFTNPTKNLVSITKDSELPTCSCLDRVIQKDKGPYYTHL 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KE2 GAGPSVAAVREIMENRYGQKGNAIRIEIVVYTGKEGKSSHGCPIAKWVLRRSSDEEKVLC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 GAGPSVAAVREIMENRYGQKGNAIRIEIVVYTGKEGKSSHGCPIAKWVLRRSSDEEKVLC 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KE2 LVRQRTGHHCPTAVMVVLIMVWDGIPLPMADRLYTELTENLKSYNGHPTDRRCTLNENRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 LVRQRTGHHCPTAVMVVLIMVWDGIPLPMADRLYTELTENLKSYNGHPTDRRCTLNENRT 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KE2 CTCQGIDPETCGASFSFGCSWSMYFNGCKFGRSPSPRRFRIDPSSPLHEKNLEDNLQSLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 CTCQGIDPETCGASFSFGCSWSMYFNGCKFGRSPSPRRFRIDPSSPLHEKNLEDNLQSLA 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KE2 TRLAPIYKQYAPVAYQNQVEYENVARECRLGSKEGRPFSGVTACLDFCAHPHRDIHNMNN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 TRLAPIYKQYAPVAYQNQVEYENVARECRLGSKEGRPFSGVTACLDFCAHPHRDIHNMNN 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KE2 GSTVVCTLTREDNRSLGVIPQDEQLHVLPLYKLSDTDEFGSKEGMEAKIKSGAIEVLAPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 GSTVVCTLTREDNRSLGVIPQDEQLHVLPLYKLSDTDEFGSKEGMEAKIKSGAIEVLAPR 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KE2 RKKRTCFTQPVPRSGKKRAAMMTEVLAHKIRAVEKKPIPRIKRKNNSTTTNNSKPSSLPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 RKKRTCFTQPVPRSGKKRAAMMTEVLAHKIRAVEKKPIPRIKRKNNSTTTNNSKPSSLPT 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KE2 LGSNTETVQPEVKSETEPHFILKSSDNTKTYSLMPSAPHPVKEASPGFSWSPKTASATPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 LGSNTETVQPEVKSETEPHFILKSSDNTKTYSLMPSAPHPVKEASPGFSWSPKTASATPA 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KE2 PLKNDATASCGFSERSSTPHCTMPSGRLSGANAAAADGPGISQLGEVAPLPTLSAPVMEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 PLKNDATASCGFSERSSTPHCTMPSGRLSGANAAAADGPGISQLGEVAPLPTLSAPVMEP 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KE2 LINSEPSTGVTEPLTPHQPNHQPSFLTSPQDLASSPMEEDEQHSEADEPPSDEPLSDDPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 LINSEPSTGVTEPLTPHQPNHQPSFLTSPQDLASSPMEEDEQHSEADEPPSDEPLSDDPL 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KE2 SPAEEKLPHIDEYWSDSEHIFLDANIGGVAIAPAHGSVLIECARRELHATTPVEHPNRNH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 SPAEEKLPHIDEYWSDSEHIFLDANIGGVAIAPAHGSVLIECARRELHATTPVEHPNRNH 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 pF1KE2 PTRLSLVFYQHKNLNKPQHGFELNKIKFEAKEAKNKKMKASEQKDQAANEGPEQSSEVNE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 PTRLSLVFYQHKNLNKPQHGFELNKIKFEAKEAKNKKMKASEQKDQAANEGPEQSSEVNE 2050 2060 2070 2080 2090 2100 2110 2120 2130 pF1KE2 LNQIPSHKALTLTHDNVVTVSPYALTHVAGPYNHWV :::::::::::::::::::::::::::::::::::: CCDS72 LNQIPSHKALTLTHDNVVTVSPYALTHVAGPYNHWV 2110 2120 2130 >>CCDS47120.1 TET2 gene_id:54790|Hs108|chr4 (2002 aa) initn: 2130 init1: 999 opt: 1809 Z-score: 1352.5 bits: 263.9 E(32554): 5.2e-69 Smith-Waterman score: 1859; 35.1% identity (62.6% similar) in 1070 aa overlap (941-1970:653-1674) 920 930 940 950 960 970 pF1KE2 SKSEKDEESEQRTASLLNSCKAILYTVRKDLQDPNLQGEPPKLNHCPSLEKQSSCNTVVF .: :. : . : .: :. . :: :.: CCDS47 KTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQVHFSKTDHLPKAHVQSLCGTRFH 630 640 650 660 670 680 980 990 1000 1010 pF1KE2 -----NGQTTTLSN----SHINSATNQAS--TKSHEYSKVTNSLSLFIPKSNSSKIDTNK ..:: : . .:.:. .... ..:: .. .. . :.::.. :. CCDS47 FQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQHKPHKQAAQTQPSQSSHLPQNQ 690 700 710 720 730 740 1020 1030 1040 1050 1060 1070 pF1KE2 SIAQGIITLDNCSNDLHQLP-PR-NNEVEYCNQLLDSSKKLDSDDLSCQDATHTQIE-ED . : . . : . :. .: :. ::. . .... ..: . : . ...: .. CCDS47 QQQQKL-QIKNKEEILQTFPHPQSNNDQQREGSFFGQTKVEECFHGENQYSKSSEFETHN 750 760 770 780 790 800 1080 1090 1100 1110 1120 1130 pF1KE2 VATQLTQLASIIKINYIKPEDKKVESTPTSL-VTCNVQQKYNQEKGTMQQKPPSSVHNNH : : .. .: . : .: .. ..:. .. :.:. . . .:. . .: . :. CCDS47 VQMGLEEVQNINRRN--SPYSQTMKSSACKIQVSCSNNTHLVSENKEQTTHPELFAGNKT 810 820 830 840 850 1140 1150 1160 1170 1180 1190 pF1KE2 GSSLTKQKNPTQKKTKSTPSRDRRKKKPTVVSYQENDRQKWEKLSYMYGTICDIWIASKF . : :.. :..: .. .::.. :: .. : . : : CCDS47 QNLHHMQYFPNN----VIPKQDLLHR-----CFQEQE-QKSQQASVLQGYKNRNQDMSGQ 860 870 880 890 900 1200 1210 1220 1230 1240 1250 pF1KE2 Q--NFGQ--FCPHDFPTVFGKISSSTKIWKPLAQTRSIMQPKTV-FPPLTQIKLQRYPES : ...: . :. .:: ... ..:.. : : : ::. .. CCDS47 QAAQLAQQRYLIHNHANVFPVPDQGG------SHTQTPPQKDTQKHAALRWHLLQKQEQQ 910 920 930 940 950 960 1260 1270 1280 1290 1300 1310 pF1KE2 AEEKVKVEPLDSLSLFHLKTESNGKAFTDKAYNSQVQLTVNANQKAHPLTQPSSPPNQCA .. ..: : .:.: . : .. .. . :. . .:. .:: .: CCDS47 QTQQPQTESCHSQMHRPIKVEPGCKP------HACMHTAPPENKTWKKVTKQENPPASCD 970 980 990 1000 1010 1320 1330 1340 1350 1360 pF1KE2 NVMAGDDQIRFQQVVKEQLMHQRLPTLPGISHETPLPESALTLRN---VNVVCSGGITVV :: :: . :.:.: . . : . ..::::.. :.: :: .::. CCDS47 NV---------QQKSIIETMEQHLKQFHAKSL---FDHKALTLKSQKQVKVEMSGPVTVL 1020 1030 1040 1050 1060 1370 1380 1390 1400 1410 pF1KE2 STKSE-----------EEVCSSSFGTSEFSTVDSAQKNFNDYAMNFFTNPTKNLVS--IT . .. :. .:: : :. :. .:: . ... .: :::.. . CCDS47 TRQTTAAELDSHTPALEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVK 1070 1080 1090 1100 1110 1120 1420 1430 1440 1450 1460 1470 pF1KE2 KDSELPTCSCLDRVIQKDKGPYYTHLGAGPSVAAVREIMENRYGQKGNAIRIEIVVYTGK . ..:.: :....:.::.::.::::::::.:::.:::::.:.::::.::::: :.:::: CCDS47 TQYDFPSCRCVEQIIEKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVIYTGK 1130 1140 1150 1160 1170 1180 1480 1490 1500 1510 1520 1530 pF1KE2 EGKSSHGCPIAKWVLRRSSDEEKVLCLVRQRTGHHCPTAVMVVLIMVWDGIPLPMADRLY :::::.::::::::.::::.:::.:::::.:.:: : .::.:.::.::.:::: .::.:: CCDS47 EGKSSQGCPIAKWVVRRSSSEEKLLCLVRERAGHTCEAAVIVILILVWEGIPLSLADKLY 1190 1200 1210 1220 1230 1240 1540 1550 1560 1570 1580 1590 pF1KE2 TELTENLKSYNGHPTDRRCTLNENRTCTCQGIDPETCGASFSFGCSWSMYFNGCKFGRSP .::::.:..: : :.:::.:::.:::.:::.::::::::::::::::::.:::::.:: CCDS47 SELTETLRKY-GTLTNRRCALNEERTCACQGLDPETCGASFSFGCSWSMYYNGCKFARSK 1250 1260 1270 1280 1290 1300 1600 1610 1620 1630 1640 1650 pF1KE2 SPRRFRIDPSSPLHEKNLEDNLQSLATRLAPIYKQYAPVAYQNQVEYENVARECRLGSKE ::.:.. ..: .:..::..::.:.: .:: ::. :: ::.::.:::. : ::::: :: CCDS47 IPRKFKLLGDDPKEEEKLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLGLKE 1310 1320 1330 1340 1350 1360 1660 1670 1680 1690 1700 1710 pF1KE2 GRPFSGVTACLDFCAHPHRDIHNMNNGSTVVCTLTREDNRSLGVIPQDEQLHVLPLYKLS :::::::::::::::: :::.:::.::::.:::::::::: .: :.:::::::::::.: CCDS47 GRPFSGVTACLDFCAHAHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLYKVS 1370 1380 1390 1400 1410 1420 1720 1730 1740 1750 1760 1770 pF1KE2 DTDEFGSKEGMEAKIKSGAIEVLAPRRKKRTCFTQPVPRSGKKRAAMMTEVLAHKIRAVE :.::::: :..: : .::::.::. :.: ...:: .. ..: .. :.:. ..: CCDS47 DVDEFGSVEAQEEKKRSGAIQVLSSFRRKVRMLAEPV-KTCRQRKLEAKKAAAEKLSSLE 1430 1440 1450 1460 1470 1480 1780 1790 1800 1810 1820 1830 pF1KE2 KKPIPRIKRKNNSTTTNNSKPSSLPT-LGSNTETVQPEVKSETEPHFILKSSDNTKTYSL .. :.:. . :.... .: :. . : ... .:. . :. . . . CCDS47 NSSNKNEKEKSAPSRTKQTENASQAKQLAELLRLSGPVMQQSQQPQPLQKQPPQPQQQQR 1490 1500 1510 1520 1530 1540 1840 1850 1860 1870 1880 1890 pF1KE2 -MPSAPH-PVKEASPGFSWSPKTASATPAPLKNDATASCGFSERSSTPHCTMPSGRLSGA . . :: : :. ..: : .: : : .. . :. :. : : . : . CCDS47 PQQQQPHHPQTESVNSYSASGSTNPYMRRP--NPVSPYPNSSHTSDIYGSTSPMNFYSTS 1550 1560 1570 1580 1590 1600 1900 1910 1920 1930 1940 1950 pF1KE2 NAAAADGPGISQLGEVAPLP-TLSAPVMEPLINSEPSTGVTEPLTPHQPNHQPSFLTSPQ . :: : ... . . : : :. .. : . . . .: . .:. ...:. ..:. CCDS47 SQAA--GSYLNSSNPMNPYPGLLNQNTQYPSYQCNGNLSV-DNCSPYLGSYSPQ--SQPM 1610 1620 1630 1640 1650 1960 1970 1980 1990 2000 2010 pF1KE2 DLASSPMEEDEQHSEADEPPSDEPLSDDPLSPAEEKLPHIDEYWSDSEHIFLDANIGGVA :: : .. :. . :: CCDS47 DLYRYPSQDPL--SKLSLPPIHTLYQPRFGNSQSFTSKYLGYGNQNMQGDGFSSCTIRPN 1660 1670 1680 1690 1700 1710 >-- initn: 528 init1: 414 opt: 510 Z-score: 382.5 bits: 84.4 E(32554): 5.5e-15 Smith-Waterman score: 510; 50.0% identity (78.1% similar) in 160 aa overlap (1991-2136:1844-2002) 1970 1980 1990 2000 2010 2020 pF1KE2 EQHSEADEPPSDEPLSDDPLSPAEEKLPHIDEYWSDSEHIFLDANIGGVAIAPAHGSVLI :: :::::. ::: .:::::.::.:::.:: CCDS47 GGLHKLSDANGQEKQPLALVQGVASGAEDNDEVWSDSEQSFLDPDIGGVAVAPTHGSILI 1820 1830 1840 1850 1860 1870 2030 2040 2050 2060 2070 pF1KE2 ECARRELHATTPVEHPNRNHPTRLSLVFYQHKNLNKPQHGFELNKIKFEAKEAKNKK--- :::.::::::::...::::::::.::::::::..:.:.::. : . :. :..:..:. CCDS47 ECAKRELHATTPLKNPNRNHPTRISLVFYQHKSMNEPKHGLALWEAKM-AEKAREKEEEC 1880 1890 1900 1910 1920 1930 2080 2090 2100 2110 2120 pF1KE2 ---------MKASEQKDQAANEGPEQSSEVNELNQIPS--HKALTLTHDNVVTVSPYALT .:. .: . :...:: . : : : ......: :..::.::::.: CCDS47 EKYGPDYVPQKSHGKKVKREPAEPHETSEPTYLRFIKSLAERTMSVTTDSTVTTSPYAFT 1940 1950 1960 1970 1980 1990 2130 pF1KE2 HVAGPYNHWV .:.::::... CCDS47 RVTGPYNRYI 2000 >>CCDS46339.2 TET3 gene_id:200424|Hs108|chr2 (1795 aa) initn: 1717 init1: 958 opt: 1727 Z-score: 1292.0 bits: 252.5 E(32554): 1.2e-65 Smith-Waterman score: 2049; 31.6% identity (57.0% similar) in 1510 aa overlap (585-2013:51-1446) 560 570 580 590 600 610 pF1KE2 HVVNTTVVTMPVPMVSTSSSSYTTLLPTLEKKKRKRCGVCEPCQQKTNCGECTYCKNRKN .:::::::.::::.. ::: :: : ::. CCDS46 PQRQVMVGSFPGSGLSMAGSESQLRGGGDGRKKRKRCGTCEPCRRLENCGACTSCTNRR- 30 40 50 60 70 620 630 640 650 660 670 pF1KE2 SHQICKKRKCEELKKKPSVVVPLEVIKENKRPQREKKPKVLKADFDNKPVNGPKSESMDY .::::: :::: :::: ... .: :: .. . ..:. . .::.:: .:: CCDS46 THQICKLRKCEVLKKKVGLLKEVE-IKAGEGAGPWGQGAAVKTGSELSPVDGPVPGQMDS 80 90 100 110 120 130 680 690 700 710 720 pF1KE2 SRCGHGEEQKLELNPHTVENVTKNED-SMTGIEVEKWTQNKK------------SQLTD- . ::. ..: . :... . :. : : ..: ..: : CCDS46 GPVYHGDSRQLSASGVPVNGAREPAGPSLLGTG-GPWRVDQKPDWEAAPGPAHTARLEDA 140 150 160 170 180 190 730 740 750 760 770 780 pF1KE2 HVKGDFSANVPEAEKSKNSEVDKKRTKSPKLFVQTVRNGIKHVHCLPAETNVSFKKFNIE : ::: : :: .: .. . . . . . :. . . : ... . .. CCDS46 HDLVAFSA-VAEAVSSYGALSTRLYETFNREMSREAGNNSRGPRPGPEGCSAGSEDLDTL 200 210 220 230 240 250 790 800 810 820 830 840 pF1KE2 EFGKTLENNSYKFLKDTANHKNAMSSVATDMSCDHLKGRSNVLVFQQPGFNCSSIPHSSH . . .: ...: . : . :. . :.:. . .:.. : . .: CCDS46 QTALALARHGMK-----PPNCNCDGPECPDY-LEWLEGKIKSVVMEG-GEERPRLP---G 260 270 280 290 300 850 860 870 880 890 900 pF1KE2 SIINHHASIHNEGDQPKTPENIPSKEPKDGSPVQPSLLSLMKDRRLTLEQVVAIEALTQL . .:.. . .: ..:. :..: :.. : ::. :.. ..:. ..:::::::: CCDS46 PLPPGEAGLPAPSTRPLLSSEVPQISPQEGLPLSQSALSIAKEKNISLQTAIAIEALTQL 310 320 330 340 350 360 910 920 930 940 950 pF1KE2 SEA---PSENSSPSKSEKDEESEQRTASLLNSCKAILYTVRKDLQDPNLQGEPPKLNHCP : : :: .:.:. : :. : : . . .. :. :. ::. CCDS46 SSALPQPS-HSTPQASCPLPEAL--------SPPAPFRSPQSYLRAPSWPVVPPE----- 370 380 390 400 410 960 970 980 990 1000 1010 pF1KE2 SLEKQSSCNTVVFNGQTTTLSNSHINSATNQASTKSHEYSKVTNSLSLFIPKSNSSKIDT :.:. . . : : : . ... CCDS46 -------------------------------------EHSSFAPDSSAFPPATPRTEFPE 420 430 1020 1030 1040 1050 1060 1070 pF1KE2 NKSIAQGIITLDNCSNDLHQLP-PRNNEVEYCNQLLDSSKKLDSDDLSCQDATHTQIEED : : : . .: : . . .::: :.. .. .. .: :. . CCDS46 ----AWGTDTPPATPRSSWPMPRPSPDPMAELEQLLGSASDYIQSVFKRPEALPTKPKVK 440 450 460 470 480 490 1080 1090 1100 1110 1120 1130 pF1KE2 VATQLTQLASIIKINYIKPEDKKVESTPTSLVTCNVQQKYNQEKGTMQQKPPSSVHNNHG : . .. : . : .. ::.: ...:: . ..:: : .: CCDS46 VEAPSSSPAPAPS-----PVLQREAPTPSS--EPDTHQK---AQTALQQ------HLHHK 500 510 520 530 1140 1150 1160 1170 1180 1190 pF1KE2 SSL-TKQKNPTQKKTKSTPSRDRRKKKPTVVSYQENDRQKWEKLSYMYGTICDIWIASKF :: .: . :. . : :: :. . :: :: .:. CCDS46 RSLFLEQVHDTSFPAPSEPSAPGWWPPPSSPVPRLPDRPPKEK-------------KKKL 540 550 560 570 580 1200 1210 1220 1230 1240 1250 pF1KE2 QNFGQFCPHDFPTVFGKISSSTK--IWKPLAQTRS-IMQPKTVFPPLTQIKLQRYPESAE . : :. : . . : . ::. .: . . .:::. :: :. : CCDS46 PT-----PAGGPVGTEKAAPGIKPSVRKPIQIKKSRPREAQPLFPPVRQIVLEGLRSPAS 590 600 610 620 630 1260 1270 1280 1290 1300 pF1KE2 EKVKVEPLDSL-----SLFHLKTESNGKAFTDKAYNSQVQLTVNANQKAHPLTQPSSPPN ..:...: : : : : . :. . ... .. .. :.: . :. CCDS46 QEVQAHPPAPLPASQGSAVPLPPEPSLALFAPSPSRDSLLPPTQEMRSPSPMT--ALQPG 640 650 660 670 680 690 1310 1320 1330 1340 1350 pF1KE2 QCANVMAGDDQI-----RFQQVVKEQLMHQRLPTLPGISHET-----PLPESALTLRN-- . . . .::.. .:. ... :..: . :. : ::: .. :. CCDS46 STGPLPPADDKLEELIRQFEAEFGDSFGLPGPPSVPIQDPENQQTCLPAPESPFATRSPK 700 710 720 730 740 750 1360 1370 1380 1390 1400 1410 pF1KE2 -VNVVCSGGITVVSTKS--EEEVCSSSFGTSEFSTVDSAQKNFNDYAMNFFTNPTKNLVS ... ::..::.:: :: . . :. . . . ..: . .... .:::.:.. CCDS46 QIKIESSGAVTVLSTTCFHSEEGGQEATPTKAENPLTPTLSGFLESPLKYLDTPTKSLLD 760 770 780 790 800 810 1420 1430 1440 1450 1460 pF1KE2 ITK---DSELPTCSCLDRVIQKDKGPYYTHLGAGPSVAAVREIMENRYGQKGNAIRIEIV ..:.:::.:......::.::::::::.::.::..::.::.:::.::.::::: : CCDS46 TPAKRAQAEFPTCDCVEQIVEKDEGPYYTHLGSGPTVASIRELMEERYGEKGKAIRIEKV 820 830 840 850 860 870 1470 1480 1490 1500 1510 1520 pF1KE2 VYTGKEGKSSHGCPIAKWVLRRSSDEEKVLCLVRQRTGHHCPTAVMVVLIMVWDGIPLPM .:::::::::.::::::::.:: . :::.:::::.:.:::: .::.:.::..:.::: . CCDS46 IYTGKEGKSSRGCPIAKWVIRRHTLEEKLLCLVRHRAGHHCQNAVIVILILAWEGIPRSL 880 890 900 910 920 930 1530 1540 1550 1560 1570 1580 pF1KE2 ADRLYTELTENLKSYNGHPTDRRCTLNENRTCTCQGIDPETCGASFSFGCSWSMYFNGCK .: :: :::..:..: :.::.::: ::..:::.::: ::.:::::::::::::::::::: CCDS46 GDTLYQELTDTLRKY-GNPTSRRCGLNDDRTCACQGKDPNTCGASFSFGCSWSMYFNGCK 940 950 960 970 980 990 1590 1600 1610 1620 1630 1640 pF1KE2 FGRSPSPRRFRIDPSSPLHEKNLEDNLQSLATRLAPIYKQYAPVAYQNQVEYENVARECR ..:: .::.::. ..: .:. :. ..:.:::..::.::. :: :::::: :..: .:: CCDS46 YARSKTPRKFRLAGDNPKEEEVLRKSFQDLATEVAPLYKRLAPQAYQNQVTNEEIAIDCR 1000 1010 1020 1030 1040 1050 1650 1660 1670 1680 1690 1700 pF1KE2 LGSKEGRPFSGVTACLDFCAHPHRDIHNMNNGSTVVCTLTREDNRSLGVIPQDEQLHVLP :: ::::::.:::::.::::: :.: ::. :: :::::::.:::: .: ::.:::::::: CCDS46 LGLKEGRPFAGVTACMDFCAHAHKDQHNLYNGCTVVCTLTKEDNRCVGKIPEDEQLHVLP 1060 1070 1080 1090 1100 1110 1710 1720 1730 1740 1750 1760 pF1KE2 LYKLSDTDEFGSKEGMEAKIKSGAIEVLA--PRRKKRTCFTQPVP-RSGKKRAAMMTEVL :::...::::::.:...::. ::::.::. ::. .: : : .: ..: .. CCDS46 LYKMANTDEFGSEENQNAKVGSGAIQVLTAFPREVRRL----PEPAKSCRQRQLEARKAA 1120 1130 1140 1150 1160 1170 1770 1780 1790 1800 1810 1820 pF1KE2 AHKIRAV-EKKPIP-RIKRKNNSTTTNNSKPSSLPTLGSNTETVQPEVKSETEPHFI-LK :.: . :: : .::.. . .: :. : . . ..: .: : . :: .: CCDS46 AEKKKIQKEKLSTPEKIKQEALELAGITSDPGLSLKGGLSQQGLKPSLKVEPQNHFSSFK 1180 1190 1200 1210 1220 1230 1830 1840 1850 1860 1870 pF1KE2 SSDNT--KTYSLM----PSAPHPVKEASPGFSW--SPKTASATPAPLKNDATASCGFSER : :. ..::.. :: :. .. . :. .:. .:.. : . .. CCDS46 YSGNAVVESYSVLGNCRPSDPYSMNSVYSYHSYYAQPSLTSVNGFHSKYALPSFSYYGFP 1240 1250 1260 1270 1280 1290 1880 1890 1900 1910 pF1KE2 SSTPHCTMPSGRL-------SGANAAAADGPGISQL----------GEVAPLPTLSAPV- ::.: ..:: : ::.... : . : .: : ::. ..:. CCDS46 SSNP--VFPSQFLGPGAWGHSGSSGSFEKKPDLHALHNSLSPAYGGAEFAELPSQAVPTD 1300 1310 1320 1330 1340 1920 1930 1940 1950 1960 1970 pF1KE2 -MEPLIN-SEPS-TGVTEPLTPHQPN-HQPSFLTSPQDLASSPMEEDEQHSEADEPPSDE .: . ..:. : : : :. : :. : :: .:. .... .. .: . : CCDS46 AHHPTPHHQQPAYPGPKEYLLPKAPLLHSVSRDPSPFAQSSNCYNRSIKQEPVDPLTQAE 1350 1360 1370 1380 1390 1400 1980 1990 2000 2010 2020 2030 pF1KE2 PLSDDPLSPAEEKLPHIDEYWSDSEHIFLDANIGGVAIAPAHGSVLIECARRELHATTPV :. : . .. : .... . : :.. . . :: ...: CCDS46 PVPRDAGKMGKTPLSEVSQNGGPS-HLWGQYS-GGPSMSPKRTNGVGGSWGVFSSGESPA 1410 1420 1430 1440 1450 1460 2040 2050 2060 2070 2080 2090 pF1KE2 EHPNRNHPTRLSLVFYQHKNLNKPQHGFELNKIKFEAKEAKNKKMKASEQKDQAANEGPE CCDS46 IVPDKLSSFGASCLAPSHFTDGQWGLFPGEGQQAASHSGGRLRGKPWSPCKFGNSTSALA 1470 1480 1490 1500 1510 1520 >-- initn: 595 init1: 425 opt: 553 Z-score: 415.4 bits: 90.3 E(32554): 8.1e-17 Smith-Waterman score: 553; 35.1% identity (62.5% similar) in 339 aa overlap (1826-2136:1470-1795) 1800 1810 1820 1830 1840 1850 pF1KE2 SSLPTLGSNTETVQPEVKSETEPHFILKSSDNTKTYSLMPSAPHPVKEASPGF--SWSPK :. .... :: ... :. . . . CCDS46 GGPSMSPKRTNGVGGSWGVFSSGESPAIVPDKLSSFGASCLAPSHFTDGQWGLFPGEGQQ 1440 1450 1460 1470 1480 1490 1860 1870 1880 1890 1900 pF1KE2 TASATPAPLKNDATASCGFSERSST---PHCTMPSGRLSGA--NAAAADGPGISQL---- .:: . . :.. . : :.. .:. : : :... :.: .::... CCDS46 AASHSGGRLRGKPWSPCKFGNSTSALAGPSLTEKPWALGAGDFNSALKGSPGFQDKLWNP 1500 1510 1520 1530 1540 1550 1910 1920 1930 1940 1950 1960 pF1KE2 --GEVAPLPTLSAPVMEPLINSEP-STGVTEPLTPHQPNHQPSFLTSPQDLASSPMEEDE :: . .:. .: .. .: : .: : ... : .: .: .: CCDS46 MKGEEGRIPAAGASQLDRAWQSFGLPLGSSEKLFGALKSEEK--LWDPFSLEEGP----- 1560 1570 1580 1590 1600 1610 1970 1980 1990 2000 2010 2020 pF1KE2 QHSEADEPPSDEPLSDDPLSPAEEKLPHIDEYWSDSEHIFLDANIGGVAIAPAHGSVLIE :.:::: .... . . :. . .: :::::: ::: ::::::.::::::.::: CCDS46 ----AEEPPSKGAVKEEKGGGGAEE--EEEELWSDSEHNFLDENIGGVAVAPAHGSILIE 1620 1630 1640 1650 1660 2030 2040 2050 2060 2070 pF1KE2 CARRELHATTPVEHPNRNHPTRLSLVFYQHKNLNKPQHGFEL--NKIKFEAKEAKNKKMK :::::::::::...::: ::::.:::::::::::.:.::. : :.: :..:. .. . CCDS46 CARRELHATTPLKKPNRCHPTRISLVFYQHKNLNQPNHGLALWEAKMKQLAERARARQEE 1670 1680 1690 1700 1710 1720 2080 2090 2100 2110 2120 pF1KE2 ASEQ---KDQAANEGPEQS---SEVNELNQ------IPSHKALTLTHDNVVTVSPYALTH :.. ...: : ... . : : .: .:...::.. :..:::: :: :. CCDS46 AARLGLGQQEAKLYGKKRKWGGTVVAEPQQKEKKGVVPTRQALAVPTDSAVTVSSYAYTK 1730 1740 1750 1760 1770 1780 2130 pF1KE2 VAGPYNHWV :.:::..:. CCDS46 VTGPYSRWI 1790 2136 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 15:27:14 2016 done: Sun Nov 6 15:27:16 2016 Total Scan time: 6.540 Total Display time: 0.400 Function used was FASTA [36.3.4 Apr, 2011]