FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5786, 707 aa 1>>>pF1KE5786 707 - 707 aa - 707 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.3390+/-0.00102; mu= 14.1826+/- 0.061 mean_var=76.5201+/-14.926, 0's: 0 Z-trim(104.3): 50 B-trim: 38 in 1/50 Lambda= 0.146618 statistics sampled from 7794 (7841) to 7794 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.603), E-opt: 0.2 (0.241), width: 16 Scan time: 3.040 The best scores are: opt bits E(32554) CCDS53868.1 SETDB2 gene_id:83852|Hs108|chr13 ( 707) 4759 1016.7 0 CCDS9417.1 SETDB2 gene_id:83852|Hs108|chr13 ( 719) 4330 925.9 0 CCDS972.1 SETDB1 gene_id:9869|Hs108|chr1 (1290) 857 191.4 7.4e-48 CCDS44217.1 SETDB1 gene_id:9869|Hs108|chr1 (1291) 857 191.4 7.4e-48 >>CCDS53868.1 SETDB2 gene_id:83852|Hs108|chr13 (707 aa) initn: 4759 init1: 4759 opt: 4759 Z-score: 5437.7 bits: 1016.7 E(32554): 0 Smith-Waterman score: 4759; 99.7% identity (99.9% similar) in 707 aa overlap (1-707:1-707) 10 20 30 40 50 60 pF1KE5 MGEKNGDAKTFWMELEDDGKVDFIFEQVQNVLQSLKQKIKDGSATNKEYIQAMILVNEAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 MGEKNGDAKTFWMELEDDGKVDFIFEQVQNVLQSLKQKIKDGSATNKEYIQAMILVNEAT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 IINSSTSIKDPMPVTQKEQENKSNAFPSTSCENSFPEDCTFLTTGNKEILSLEDKVVDFR :::::::::::::::::::::::::::::::::::::::::::: ::::::::::::::: CCDS53 IINSSTSIKDPMPVTQKEQENKSNAFPSTSCENSFPEDCTFLTTENKEILSLEDKVVDFR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 EKDSSSNLSYQSHDCSGACLMKMPLNLKGENPLQLPIKCHFQRRHAKTNSHSSALHVSYK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 EKDSSSNLSYQSHDCSGACLMKMPLNLKGENPLQLPIKCHFQRRHAKTNSHSSALHVSYK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 TPCGRSLRNVEEVFRYLLETECNFLFTDNFSFNTYVQLARNYPKQKEVVSDVDISNGVES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 TPCGRSLRNVEEVFRYLLETECNFLFTDNFSFNTYVQLARNYPKQKEVVSDVDISNGVES 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 VPISFCNEIDSRKLPQFKYRKTVWPRAYNLTNFSSMFTDSCDCSEGCIDITKCACLQLTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 VPISFCNEIDSRKLPQFKYRKTVWPRAYNLTNFSSMFTDSCDCSEGCIDITKCACLQLTA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 RNAKTSPLSSDKITTGYKYKRLQRQIPTGIYECSLLCKCNRQLCQNRVVQHGPQVRLQVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 RNAKTSPLSSDKITTGYKYKRLQRQIPTGIYECSLLCKCNRQLCQNRVVQHGPQVRLQVF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 KTEQKGWGVRCLDDIDRGTFVCIYSGRLLSRANTEKSYGIDENGRDENTMKNIFSKKRKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KTEQKGWGVRCLDDIDRGTFVCIYSGRLLSRANTEKSYGIDENGRDENTMKNIFSKKRKL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 EVACSDCEVEVLPLGLETHPRTAKTEKCPPKFSNNPKELTMETKYDNISRIQYHSVIRDP ::::::::::::::::::::::::::::::::::::::::.::::::::::::::::::: CCDS53 EVACSDCEVEVLPLGLETHPRTAKTEKCPPKFSNNPKELTVETKYDNISRIQYHSVIRDP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE5 ESKTAIFQHNGKKMEFVSSESVTPEDNDGFKPPREHLNSKTKGAQKDSSSNHVDEFEDNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 ESKTAIFQHNGKKMEFVSSESVTPEDNDGFKPPREHLNSKTKGAQKDSSSNHVDEFEDNL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE5 LIESDVIDITKYREETPPRSRCNQATTLDNQNIKKAIEVQIQKPQEGRSTACQRQQVFCD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 LIESDVIDITKYREETPPRSRCNQATTLDNQNIKKAIEVQIQKPQEGRSTACQRQQVFCD 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE5 EELLSETKNTSSDSLTKFNKGNVFLLDATKEGNVGRFLNHSCCPNLLVQNVFVETHNRNF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 EELLSETKNTSSDSLTKFNKGNVFLLDATKEGNVGRFLNHSCCPNLLVQNVFVETHNRNF 610 620 630 640 650 660 670 680 690 700 pF1KE5 PLVAFFTNRYVKARTELTWDYGYEAGTVPEKEIFCQCGVNKCRKKIL ::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 PLVAFFTNRYVKARTELTWDYGYEAGTVPEKEIFCQCGVNKCRKKIL 670 680 690 700 >>CCDS9417.1 SETDB2 gene_id:83852|Hs108|chr13 (719 aa) initn: 4745 init1: 4325 opt: 4330 Z-score: 4947.2 bits: 925.9 E(32554): 0 Smith-Waterman score: 4725; 98.1% identity (98.2% similar) in 719 aa overlap (1-707:1-719) 10 20 30 40 50 60 pF1KE5 MGEKNGDAKTFWMELEDDGKVDFIFEQVQNVLQSLKQKIKDGSATNKEYIQAMILVNEAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 MGEKNGDAKTFWMELEDDGKVDFIFEQVQNVLQSLKQKIKDGSATNKEYIQAMILVNEAT 10 20 30 40 50 60 70 80 90 100 pF1KE5 IINSSTSIK------------DPMPVTQKEQENKSNAFPSTSCENSFPEDCTFLTTGNKE ::::::::: ::::::::::::::::::::::::::::::::::: ::: CCDS94 IINSSTSIKGASQKEVNAQSSDPMPVTQKEQENKSNAFPSTSCENSFPEDCTFLTTENKE 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE5 ILSLEDKVVDFREKDSSSNLSYQSHDCSGACLMKMPLNLKGENPLQLPIKCHFQRRHAKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 ILSLEDKVVDFREKDSSSNLSYQSHDCSGACLMKMPLNLKGENPLQLPIKCHFQRRHAKT 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE5 NSHSSALHVSYKTPCGRSLRNVEEVFRYLLETECNFLFTDNFSFNTYVQLARNYPKQKEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 NSHSSALHVSYKTPCGRSLRNVEEVFRYLLETECNFLFTDNFSFNTYVQLARNYPKQKEV 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE5 VSDVDISNGVESVPISFCNEIDSRKLPQFKYRKTVWPRAYNLTNFSSMFTDSCDCSEGCI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 VSDVDISNGVESVPISFCNEIDSRKLPQFKYRKTVWPRAYNLTNFSSMFTDSCDCSEGCI 250 260 270 280 290 300 290 300 310 320 330 340 pF1KE5 DITKCACLQLTARNAKTSPLSSDKITTGYKYKRLQRQIPTGIYECSLLCKCNRQLCQNRV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 DITKCACLQLTARNAKTSPLSSDKITTGYKYKRLQRQIPTGIYECSLLCKCNRQLCQNRV 310 320 330 340 350 360 350 360 370 380 390 400 pF1KE5 VQHGPQVRLQVFKTEQKGWGVRCLDDIDRGTFVCIYSGRLLSRANTEKSYGIDENGRDEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 VQHGPQVRLQVFKTEQKGWGVRCLDDIDRGTFVCIYSGRLLSRANTEKSYGIDENGRDEN 370 380 390 400 410 420 410 420 430 440 450 460 pF1KE5 TMKNIFSKKRKLEVACSDCEVEVLPLGLETHPRTAKTEKCPPKFSNNPKELTMETKYDNI ::::::::::::::::::::::::::::::::::::::::::::::::::::.::::::: CCDS94 TMKNIFSKKRKLEVACSDCEVEVLPLGLETHPRTAKTEKCPPKFSNNPKELTVETKYDNI 430 440 450 460 470 480 470 480 490 500 510 520 pF1KE5 SRIQYHSVIRDPESKTAIFQHNGKKMEFVSSESVTPEDNDGFKPPREHLNSKTKGAQKDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 SRIQYHSVIRDPESKTAIFQHNGKKMEFVSSESVTPEDNDGFKPPREHLNSKTKGAQKDS 490 500 510 520 530 540 530 540 550 560 570 580 pF1KE5 SSNHVDEFEDNLLIESDVIDITKYREETPPRSRCNQATTLDNQNIKKAIEVQIQKPQEGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 SSNHVDEFEDNLLIESDVIDITKYREETPPRSRCNQATTLDNQNIKKAIEVQIQKPQEGR 550 560 570 580 590 600 590 600 610 620 630 640 pF1KE5 STACQRQQVFCDEELLSETKNTSSDSLTKFNKGNVFLLDATKEGNVGRFLNHSCCPNLLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 STACQRQQVFCDEELLSETKNTSSDSLTKFNKGNVFLLDATKEGNVGRFLNHSCCPNLLV 610 620 630 640 650 660 650 660 670 680 690 700 pF1KE5 QNVFVETHNRNFPLVAFFTNRYVKARTELTWDYGYEAGTVPEKEIFCQCGVNKCRKKIL ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 QNVFVETHNRNFPLVAFFTNRYVKARTELTWDYGYEAGTVPEKEIFCQCGVNKCRKKIL 670 680 690 700 710 >>CCDS972.1 SETDB1 gene_id:9869|Hs108|chr1 (1290 aa) initn: 1159 init1: 764 opt: 857 Z-score: 972.7 bits: 191.4 E(32554): 7.4e-48 Smith-Waterman score: 857; 36.3% identity (62.7% similar) in 391 aa overlap (128-513:571-955) 100 110 120 130 140 150 pF1KE5 DCTFLTTGNKEILSLEDKVVDFREKDSSSNLSYQSHDCSGACLMKM-PL---NLKGENPL : : : :: .:: .. :. . .:.::: CCDS97 ALPAPPAPPVFHGMLERAPAEPSYRAPMEKLFYLPHVCSYTCLSRVRPMRNEQYRGKNPL 550 560 570 580 590 600 160 170 180 190 200 210 pF1KE5 QLPIKCHFQRRHAKTN-SHSSALHVSYKTPCGRSLRNVEEVFRYLLETECNFLFTDNFSF .:. :.: :. ... ..:: :::::: ::...:. :::.:: :.::: . : . CCDS97 LVPLLYDFRRMTARRRVNRKMGFHVIYKTPCGLCLRTMQEIERYLFETGCDFLFLEMFCL 610 620 630 640 650 660 220 230 240 250 260 270 pF1KE5 NTYVQLARNYPKQKEVVSDVDISNGVESVPISFCNEIDSRKLPQFKYRKTVWPRAYNLTN . :: . :.. : .::. : :.::.: ::::. :: : : : . : CCDS97 DPYVLVDRKFQPYKPFYYILDITYGKEDVPLSCVNEIDTTPPPQVAYSKERIPGKGVFIN 670 680 690 700 710 720 280 290 300 310 320 330 pF1KE5 FSSMFTDSCDCSEGCIDITKCACLQLTARNAKTSPLSSDKITTGYKYKRLQRQIPTGIYE . : .:::..:: : .:::: ::: . . .: .. . ..::.::::.. .:::.:: CCDS97 TGPEFLVGCDCKDGCRDKSKCACHQLTIQATACTPGGQINPNSGYQYKRLEECLPTGVYE 730 740 750 760 770 780 340 350 360 370 380 390 pF1KE5 CSLLCKCNRQLCQNRVVQHGPQVRLQVFKTEQKGWGVRCLDDIDRGTFVCIYSGRLLSRA :. :::. ..: ::.:::: :::::.:::..::::.:::::: .:.:::::.:..:. CCDS97 CNKRCKCDPNMCTNRLVQHGLQVRLQLFKTQNKGWGIRCLDDIAKGSFVCIYAGKILTDD 790 800 810 820 830 840 400 410 420 430 440 450 pF1KE5 NTEKSYGIDENGRDENTMKNIFSKKRKLEVACSDCEVEVLPLGLETHPRTAKTEKCPPKF ..: :.. . . .. .: : . : :: : . .. : .. . CCDS97 FADKE-GLEMGDEYFANLDHIESVENFKEGYESDA-----PCSSDSSGVDLKDQEDGNSG 850 860 870 880 890 460 470 480 490 500 510 pF1KE5 SNNPKELTMETKYDNISRIQYHSVIRDPESKTAIFQHNGKKMEFVSSESVTPEDNDGFKP ...:.: . ... ::. . . :. .: .. : :.: . .: . . : CCDS97 TEDPEESNDDSSDDNFCKDEDFSTSSVWRSYATRRQTRGQKENGLSETTSKDSHPPDLGP 900 910 920 930 940 950 520 530 540 550 560 570 pF1KE5 PREHLNSKTKGAQKDSSSNHVDEFEDNLLIESDVIDITKYREETPPRSRCNQATTLDNQN : CCDS97 PHIPVPPSIPVGGCNPPSSEETPKNKVASWLSCNSVSEGGFADSDSHSSFKTNEGGEGRA 960 970 980 990 1000 1010 >-- initn: 381 init1: 210 opt: 380 Z-score: 427.4 bits: 90.5 E(32554): 1.7e-17 Smith-Waterman score: 380; 31.8% identity (59.7% similar) in 233 aa overlap (477-707:1073-1290) 450 460 470 480 490 500 pF1KE5 KCPPKFSNNPKELTMETKYDNISRIQYHSVIRDPESKTAIFQHNGKKMEFVSSESVTPED .: : :::.. :..... ..: . .:.: CCDS97 EDTDDRNKMSVVTESSRNYGYNPSPVKPEGLRRPPSKTSM--HQSRRL--MASAQSNPDD 1050 1060 1070 1080 1090 510 520 530 540 550 560 pF1KE5 NDGFKPPREHLNSKTKGAQKDSSSNHVDEFEDNLLIESDVIDITKYREETPPRSRCNQAT .. .....: . : . . . . . .:. :.. : ... :.. CCDS97 VLTLSS-----STESEGESGTSRKPTAGQTSATAVDSDDIQTISSGSEGDDFEDKKNMTG 1100 1110 1120 1130 1140 1150 570 580 590 600 610 620 pF1KE5 TLDNQNIKKAIEVQIQKPQEGRSTACQRQQVFCDEELLSETKNTSSDSLTKFNKG--NVF . : :. . : .: . . : ::: .: : . . CCDS97 PMKRQVAVKSTRGFALKSTHGIAIKSTNMASVDKGESAPVRKNTR-----QFYDGEESCY 1160 1170 1180 1190 1200 630 640 650 660 670 680 pF1KE5 LLDATKEGNVGRFLNHSCCPNLLVQNVFVETHNRNFPLVAFFTNRYVKARTELTWDYGYE ..:: :::.::.::::: :::.::::::.::. :: ::::... ..: :::::::.:: CCDS97 IIDAKLEGNLGRYLNHSCSPNLFVQNVFVDTHDLRFPWVAFFASK-IRAGTELTWDYNYE 1210 1220 1230 1240 1250 1260 690 700 pF1KE5 AGTVPEKEIFCQCGVNKCRKKIL .:.: ::..: ::. .:: ..: CCDS97 VGSVEGKELLCCCGAIECRGRLL 1270 1280 1290 >>CCDS44217.1 SETDB1 gene_id:9869|Hs108|chr1 (1291 aa) initn: 1181 init1: 764 opt: 857 Z-score: 972.7 bits: 191.4 E(32554): 7.4e-48 Smith-Waterman score: 857; 36.3% identity (62.7% similar) in 391 aa overlap (128-513:571-955) 100 110 120 130 140 150 pF1KE5 DCTFLTTGNKEILSLEDKVVDFREKDSSSNLSYQSHDCSGACLMKM-PL---NLKGENPL : : : :: .:: .. :. . .:.::: CCDS44 ALPAPPAPPVFHGMLERAPAEPSYRAPMEKLFYLPHVCSYTCLSRVRPMRNEQYRGKNPL 550 560 570 580 590 600 160 170 180 190 200 210 pF1KE5 QLPIKCHFQRRHAKTN-SHSSALHVSYKTPCGRSLRNVEEVFRYLLETECNFLFTDNFSF .:. :.: :. ... ..:: :::::: ::...:. :::.:: :.::: . : . CCDS44 LVPLLYDFRRMTARRRVNRKMGFHVIYKTPCGLCLRTMQEIERYLFETGCDFLFLEMFCL 610 620 630 640 650 660 220 230 240 250 260 270 pF1KE5 NTYVQLARNYPKQKEVVSDVDISNGVESVPISFCNEIDSRKLPQFKYRKTVWPRAYNLTN . :: . :.. : .::. : :.::.: ::::. :: : : : . : CCDS44 DPYVLVDRKFQPYKPFYYILDITYGKEDVPLSCVNEIDTTPPPQVAYSKERIPGKGVFIN 670 680 690 700 710 720 280 290 300 310 320 330 pF1KE5 FSSMFTDSCDCSEGCIDITKCACLQLTARNAKTSPLSSDKITTGYKYKRLQRQIPTGIYE . : .:::..:: : .:::: ::: . . .: .. . ..::.::::.. .:::.:: CCDS44 TGPEFLVGCDCKDGCRDKSKCACHQLTIQATACTPGGQINPNSGYQYKRLEECLPTGVYE 730 740 750 760 770 780 340 350 360 370 380 390 pF1KE5 CSLLCKCNRQLCQNRVVQHGPQVRLQVFKTEQKGWGVRCLDDIDRGTFVCIYSGRLLSRA :. :::. ..: ::.:::: :::::.:::..::::.:::::: .:.:::::.:..:. CCDS44 CNKRCKCDPNMCTNRLVQHGLQVRLQLFKTQNKGWGIRCLDDIAKGSFVCIYAGKILTDD 790 800 810 820 830 840 400 410 420 430 440 450 pF1KE5 NTEKSYGIDENGRDENTMKNIFSKKRKLEVACSDCEVEVLPLGLETHPRTAKTEKCPPKF ..: :.. . . .. .: : . : :: : . .. : .. . CCDS44 FADKE-GLEMGDEYFANLDHIESVENFKEGYESDA-----PCSSDSSGVDLKDQEDGNSG 850 860 870 880 890 460 470 480 490 500 510 pF1KE5 SNNPKELTMETKYDNISRIQYHSVIRDPESKTAIFQHNGKKMEFVSSESVTPEDNDGFKP ...:.: . ... ::. . . :. .: .. : :.: . .: . . : CCDS44 TEDPEESNDDSSDDNFCKDEDFSTSSVWRSYATRRQTRGQKENGLSETTSKDSHPPDLGP 900 910 920 930 940 950 520 530 540 550 560 570 pF1KE5 PREHLNSKTKGAQKDSSSNHVDEFEDNLLIESDVIDITKYREETPPRSRCNQATTLDNQN : CCDS44 PHIPVPPSIPVGGCNPPSSEETPKNKVASWLSCNSVSEGGFADSDSHSSFKTNEGGEGRA 960 970 980 990 1000 1010 >-- initn: 415 init1: 367 opt: 391 Z-score: 440.0 bits: 92.8 E(32554): 3.5e-18 Smith-Waterman score: 391; 31.8% identity (59.7% similar) in 233 aa overlap (477-707:1073-1291) 450 460 470 480 490 500 pF1KE5 KCPPKFSNNPKELTMETKYDNISRIQYHSVIRDPESKTAIFQHNGKKMEFVSSESVTPED .: : :::.. :..... ..: . .:.: CCDS44 EDTDDRNKMSVVTESSRNYGYNPSPVKPEGLRRPPSKTSM--HQSRRL--MASAQSNPDD 1050 1060 1070 1080 1090 510 520 530 540 550 560 pF1KE5 NDGFKPPREHLNSKTKGAQKDSSSNHVDEFEDNLLIESDVIDITKYREETPPRSRCNQAT .. .....: . : . . . . . .:. :.. : ... :.. CCDS44 VLTLSS-----STESEGESGTSRKPTAGQTSATAVDSDDIQTISSGSEGDDFEDKKNMTG 1100 1110 1120 1130 1140 1150 570 580 590 600 610 620 pF1KE5 TLDNQNIKKAIEVQIQKPQEGRSTACQRQQVFCDEELLSETKNTSSDSLTKFNKG--NVF . : :. . : .: . . : ::: .: : . . CCDS44 PMKRQVAVKSTRGFALKSTHGIAIKSTNMASVDKGESAPVRKNTR-----QFYDGEESCY 1160 1170 1180 1190 1200 630 640 650 660 670 680 pF1KE5 LLDATKEGNVGRFLNHSCCPNLLVQNVFVETHNRNFPLVAFFTNRYVKARTELTWDYGYE ..:: :::.::.::::: :::.::::::.::. :: ::::... ..: :::::::.:: CCDS44 IIDAKLEGNLGRYLNHSCSPNLFVQNVFVDTHDLRFPWVAFFASKRIRAGTELTWDYNYE 1210 1220 1230 1240 1250 1260 690 700 pF1KE5 AGTVPEKEIFCQCGVNKCRKKIL .:.: ::..: ::. .:: ..: CCDS44 VGSVEGKELLCCCGAIECRGRLL 1270 1280 1290 707 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 04:57:32 2016 done: Tue Nov 8 04:57:33 2016 Total Scan time: 3.040 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]