FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3830, 2964 aa 1>>>pF1KE3830 2964 - 2964 aa - 2964 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.0272+/-0.00117; mu= 6.0203+/- 0.071 mean_var=240.6428+/-48.332, 0's: 0 Z-trim(110.3): 58 B-trim: 6 in 1/51 Lambda= 0.082678 statistics sampled from 11486 (11540) to 11486 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.669), E-opt: 0.2 (0.354), width: 16 Scan time: 7.400 The best scores are: opt bits E(32554) CCDS1113.2 ASH1L gene_id:55870|Hs108|chr1 (2964) 19783 2374.8 0 CCDS11923.2 SETBP1 gene_id:26040|Hs108|chr18 (1596) 1216 160.0 1e-37 CCDS4413.1 NSD1 gene_id:64324|Hs108|chr5 (2427) 672 95.2 5.1e-18 CCDS4412.1 NSD1 gene_id:64324|Hs108|chr5 (2696) 672 95.2 5.5e-18 CCDS43729.1 WHSC1L1 gene_id:54904|Hs108|chr8 (1437) 658 93.4 1e-17 CCDS33940.1 WHSC1 gene_id:7468|Hs108|chr4 (1365) 648 92.2 2.3e-17 CCDS2749.2 SETD2 gene_id:29072|Hs108|chr3 (2564) 649 92.5 3.6e-17 >>CCDS1113.2 ASH1L gene_id:55870|Hs108|chr1 (2964 aa) initn: 19783 init1: 19783 opt: 19783 Z-score: 12755.3 bits: 2374.8 E(32554): 0 Smith-Waterman score: 19783; 100.0% identity (100.0% similar) in 2964 aa overlap (1-2964:1-2964) 10 20 30 40 50 60 pF1KE3 MDPRNTAMLGLGSDSEGFSRKSPSAISTGTLVSKREVELEKNTKEEEDLRKRNRERNIEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MDPRNTAMLGLGSDSEGFSRKSPSAISTGTLVSKREVELEKNTKEEEDLRKRNRERNIEA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 GKDDGLTDAQQQFSVKETNFSEGNLKLKIGLQAKRTKKPPKNLENYVCRPAIKTTIKHPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GKDDGLTDAQQQFSVKETNFSEGNLKLKIGLQAKRTKKPPKNLENYVCRPAIKTTIKHPR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 KALKSGKMTDEKNEHCPSKRDPSKLYKKADDVAAIECQSEEVIRLHSQGENNPLSKKLSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 KALKSGKMTDEKNEHCPSKRDPSKLYKKADDVAAIECQSEEVIRLHSQGENNPLSKKLSP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 VHSEMADYINATPSTLLGSRDPDLKDRALLNGGTSVTEKLAQLIATCPPSKSSKTKPKKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 VHSEMADYINATPSTLLGSRDPDLKDRALLNGGTSVTEKLAQLIATCPPSKSSKTKPKKL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 GTGTTAGLVSKDLIRKAGVGSVAGIIHKDLIKKPTISTAVGLVTKDPGKKPVFNAAVGLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GTGTTAGLVSKDLIRKAGVGSVAGIIHKDLIKKPTISTAVGLVTKDPGKKPVFNAAVGLV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 NKDSVKKLGTGTTAVFINKNLGKKPGTITTVGLLSKDSGKKLGIGIVPGLVHKESGKKLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 NKDSVKKLGTGTTAVFINKNLGKKPGTITTVGLLSKDSGKKLGIGIVPGLVHKESGKKLG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 LGTVVGLVNKDLGKKLGSTVGLVAKDCAKKIVASSAMGLVNKDIGKKLMSCPLAGLISKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LGTVVGLVNKDLGKKLGSTVGLVAKDCAKKIVASSAMGLVNKDIGKKLMSCPLAGLISKD 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 AINLKAEALLPTQEPLKASCSTNINNQESQELSESLKDSATSKTFEKNVVRQNKESILEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 AINLKAEALLPTQEPLKASCSTNINNQESQELSESLKDSATSKTFEKNVVRQNKESILEK 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 FSVRKEIINLEKEMFNEGTCIQQDSFSSSEKGSYETSKHEKQPPVYCTSPDFKMGGASDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 FSVRKEIINLEKEMFNEGTCIQQDSFSSSEKGSYETSKHEKQPPVYCTSPDFKMGGASDV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 STAKSPFSAVGESNLPSPSPTVSVNPLTRSPPETSSQLAPNPLLLSSTTELIEEISESVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 STAKSPFSAVGESNLPSPSPTVSVNPLTRSPPETSSQLAPNPLLLSSTTELIEEISESVG 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE3 KNQFTSESTHLNVGHRSVGHSISIECKGIDKEVNDSKTTHIDIPRISSSLGKKPSLTSES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 KNQFTSESTHLNVGHRSVGHSISIECKGIDKEVNDSKTTHIDIPRISSSLGKKPSLTSES 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE3 SIHTITPSVVNFTSLFSNKPFLKLGAVSASDKHCQVAESLSTSLQSKPLKKRKGRKPRWT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SIHTITPSVVNFTSLFSNKPFLKLGAVSASDKHCQVAESLSTSLQSKPLKKRKGRKPRWT 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE3 KVVARSTCRSPKGLELERSELFKNVSCSSLSNSNSEPAKFMKNIGPPSFVDHDFLKRRLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 KVVARSTCRSPKGLELERSELFKNVSCSSLSNSNSEPAKFMKNIGPPSFVDHDFLKRRLP 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE3 KLSKSTAPSLALLADSEKPSHKSFATHKLSSSMCVSSDLLSDIYKPKRGRPKSKEMPQLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 KLSKSTAPSLALLADSEKPSHKSFATHKLSSSMCVSSDLLSDIYKPKRGRPKSKEMPQLE 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE3 GPPKRTLKIPASKVFSLQSKEEQEPPILQPEIEIPSFKQGLSVSPFPKKRGRPKRQMRSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GPPKRTLKIPASKVFSLQSKEEQEPPILQPEIEIPSFKQGLSVSPFPKKRGRPKRQMRSP 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE3 VKMKPPVLSVAPFVATESPSKLESESDNHRSSSDFFESEDQLQDPDDLDDSHRPSVCSMS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 VKMKPPVLSVAPFVATESPSKLESESDNHRSSSDFFESEDQLQDPDDLDDSHRPSVCSMS 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE3 DLEMEPDKKITKRNNGQLMKTIIRKINKMKTLKRKKLLNQILSSSVESSNKGKVQSKLHN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 DLEMEPDKKITKRNNGQLMKTIIRKINKMKTLKRKKLLNQILSSSVESSNKGKVQSKLHN 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE3 TVSSLAATFGSKLGQQINVSKKGTIYIGKRRGRKPKTVLNGILSGSPTSLAVLEQTAQQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 TVSSLAATFGSKLGQQINVSKKGTIYIGKRRGRKPKTVLNGILSGSPTSLAVLEQTAQQA 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE3 AGSALGQILPPLLPSSASSSEILPSPICSQSSGTSGGQSPVSSDAGFVEPSSVPYLHLHS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 AGSALGQILPPLLPSSASSSEILPSPICSQSSGTSGGQSPVSSDAGFVEPSSVPYLHLHS 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE3 RQGSMIQTLAMKKASKGRRRLSPPTLLPNSPSHLSELTSLKEATPSPISESHSDETIPSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RQGSMIQTLAMKKASKGRRRLSPPTLLPNSPSHLSELTSLKEATPSPISESHSDETIPSD 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE3 SGIGTDNNSTSDRAEKFCGQKKRRHSFEHVSLIPPETSTVLSSLKEKHKHKCKRRNHDYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SGIGTDNNSTSDRAEKFCGQKKRRHSFEHVSLIPPETSTVLSSLKEKHKHKCKRRNHDYL 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE3 SYDKMKRQKRKRKKKYPQLRNRQDPDFIAELEELISRLSEIRITHRSHHFIPRDLLPTIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SYDKMKRQKRKRKKKYPQLRNRQDPDFIAELEELISRLSEIRITHRSHHFIPRDLLPTIF 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE3 RINFNSFYTHPSFPLDPLHYIRKPDLKKKRGRPPKMREAMAEMPFMHSLSFPLSSTGFYP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RINFNSFYTHPSFPLDPLHYIRKPDLKKKRGRPPKMREAMAEMPFMHSLSFPLSSTGFYP 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE3 SYGMPYSPSPLTAAPIGLGYYGRYPPTLYPPPPSPSFTTPLPPPSYMHAGHLLLNPAKYH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SYGMPYSPSPLTAAPIGLGYYGRYPPTLYPPPPSPSFTTPLPPPSYMHAGHLLLNPAKYH 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KE3 KKKHKLLRQEAFLTTSRTPLLSMSTYPSVPPEMAYGWMVEHKHRHRHKHREHRSSEQPQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 KKKHKLLRQEAFLTTSRTPLLSMSTYPSVPPEMAYGWMVEHKHRHRHKHREHRSSEQPQV 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KE3 SMDTGSSRSVLESLKRYRFGKDAVGERYKHKEKHRCHMSCPHLSPSKSLINREEQWVHRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SMDTGSSRSVLESLKRYRFGKDAVGERYKHKEKHRCHMSCPHLSPSKSLINREEQWVHRE 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KE3 PSESSPLALGLQTPLQIDCSESSPSLSLGGFTPNSEPASSDEHTNLFTSAIGSCRVSNPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PSESSPLALGLQTPLQIDCSESSPSLSLGGFTPNSEPASSDEHTNLFTSAIGSCRVSNPN 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KE3 SSGRKKLTDSPGLFSAQDTSLNRLHRKESLPSNERAVQTLAGSQPTSDKPSQRPSESTNC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SSGRKKLTDSPGLFSAQDTSLNRLHRKESLPSNERAVQTLAGSQPTSDKPSQRPSESTNC 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KE3 SPTRKRSSSESTSSTVNGVPSRSPRLVASGDDSVDSLLQRMVQNEDQEPMEKSIDAVIAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SPTRKRSSSESTSSTVNGVPSRSPRLVASGDDSVDSLLQRMVQNEDQEPMEKSIDAVIAT 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KE3 ASAPPSSSPGRSHSKDRTLGKPDSLLVPAVTSDSCNNSISLLSEKLTSSCSPHHIKRSVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ASAPPSSSPGRSHSKDRTLGKPDSLLVPAVTSDSCNNSISLLSEKLTSSCSPHHIKRSVV 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KE3 EAMQRQARKMCNYDKILATKKNLDHVNKILKAKKLQRQARTGNNFVKRRPGRPRKCPLQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 EAMQRQARKMCNYDKILATKKNLDHVNKILKAKKLQRQARTGNNFVKRRPGRPRKCPLQA 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KE3 VVSMQAFQAAQFVNPELNRDEEGAALHLSPDTVTDVIEAVVQSVNLNPEHKKGLKRKGWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 VVSMQAFQAAQFVNPELNRDEEGAALHLSPDTVTDVIEAVVQSVNLNPEHKKGLKRKGWL 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KE3 LEEQTRKKQKPLPEEEEQENNKSFNEAPVEIPSPSETPAKPSEPESTLQPVLSLIPREKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LEEQTRKKQKPLPEEEEQENNKSFNEAPVEIPSPSETPAKPSEPESTLQPVLSLIPREKK 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KE3 PPRPPKKKYQKAGLYSDVYKTTDPKSRLIQLKKEKLEYTPGEHEYGLFPAPIHVGKYLRQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PPRPPKKKYQKAGLYSDVYKTTDPKSRLIQLKKEKLEYTPGEHEYGLFPAPIHVGKYLRQ 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 pF1KE3 KRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSNVYVDVKPLSGYEATTCNCKKPDDDT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 KRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSNVYVDVKPLSGYEATTCNCKKPDDDT 2050 2060 2070 2080 2090 2100 2110 2120 2130 2140 2150 2160 pF1KE3 RKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFRAEEKGWGIRTKEPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFRAEEKGWGIRTKEPL 2110 2120 2130 2140 2150 2160 2170 2180 2190 2200 2210 2220 pF1KE3 KAGQFIIEYLGEVVSEQEFRNRMIEQYHNHSDHYCLNLDSGMVIDSYRMGNEARFINHSC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 KAGQFIIEYLGEVVSEQEFRNRMIEQYHNHSDHYCLNLDSGMVIDSYRMGNEARFINHSC 2170 2180 2190 2200 2210 2220 2230 2240 2250 2260 2270 2280 pF1KE3 DPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQQLCKCGFEKCRGIIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 DPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQQLCKCGFEKCRGIIG 2230 2240 2250 2260 2270 2280 2290 2300 2310 2320 2330 2340 pF1KE3 GKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLSEEPSENINTPTRLTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLSEEPSENINTPTRLTP 2290 2300 2310 2320 2330 2340 2350 2360 2370 2380 2390 2400 pF1KE3 QLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHSASLYTRWNGICRDDG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 QLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHSASLYTRWNGICRDDG 2350 2360 2370 2380 2390 2400 2410 2420 2430 2440 2450 2460 pF1KE3 NIKSDVFMTQFSALQTARSVRTRRLAAAEENIEVARAARLAQIFKEICDGIISYKDSSRQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 NIKSDVFMTQFSALQTARSVRTRRLAAAEENIEVARAARLAQIFKEICDGIISYKDSSRQ 2410 2420 2430 2440 2450 2460 2470 2480 2490 2500 2510 2520 pF1KE3 ALAAPLLNLPPKKKNADYYEKISDPLDLITIEKQILTGYYKTVEAFDADMLKVFRNAEKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ALAAPLLNLPPKKKNADYYEKISDPLDLITIEKQILTGYYKTVEAFDADMLKVFRNAEKY 2470 2480 2490 2500 2510 2520 2530 2540 2550 2560 2570 2580 pF1KE3 YGRKSPVGRDVCRLRKAYYNARHEASAQIDEIVGETASEADSSETSVSEKENGHEKDDDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 YGRKSPVGRDVCRLRKAYYNARHEASAQIDEIVGETASEADSSETSVSEKENGHEKDDDV 2530 2540 2550 2560 2570 2580 2590 2600 2610 2620 2630 2640 pF1KE3 IRCICGLYKDEGLMIQCDKCMVWQHCDCMGVNSDVEHYLCEQCDPRPVDREVPMIPRPHY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 IRCICGLYKDEGLMIQCDKCMVWQHCDCMGVNSDVEHYLCEQCDPRPVDREVPMIPRPHY 2590 2600 2610 2620 2630 2640 2650 2660 2670 2680 2690 2700 pF1KE3 AQPGCVYFICLLRDDLLLRQGDCVYLMRDSRRTPDGHPVRQSYRLLSHINRDKLDIFRIE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 AQPGCVYFICLLRDDLLLRQGDCVYLMRDSRRTPDGHPVRQSYRLLSHINRDKLDIFRIE 2650 2660 2670 2680 2690 2700 2710 2720 2730 2740 2750 2760 pF1KE3 KLWKNEKEERFAFGHHYFRPHETHHSPSRRFYHNELFRVPLYEIIPLEAVVGTCCVLDLY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 KLWKNEKEERFAFGHHYFRPHETHHSPSRRFYHNELFRVPLYEIIPLEAVVGTCCVLDLY 2710 2720 2730 2740 2750 2760 2770 2780 2790 2800 2810 2820 pF1KE3 TYCKGRPKGVKEQDVYICDYRLDKSAHLFYKIHRNRYPVCTKPYAFDHFPKKLTPKKDFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 TYCKGRPKGVKEQDVYICDYRLDKSAHLFYKIHRNRYPVCTKPYAFDHFPKKLTPKKDFS 2770 2780 2790 2800 2810 2820 2830 2840 2850 2860 2870 2880 pF1KE3 PHYVPDNYKRNGGRSSWKSERSKPPLKDLGQEDDALPLIEEVLASQEQAANEIPSLEEPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PHYVPDNYKRNGGRSSWKSERSKPPLKDLGQEDDALPLIEEVLASQEQAANEIPSLEEPE 2830 2840 2850 2860 2870 2880 2890 2900 2910 2920 2930 2940 pF1KE3 REGATANVSEGEKKTEESSQEPQSTCTPEERRHNQRERLNQILLNLLEKIPGKNAIDVTY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 REGATANVSEGEKKTEESSQEPQSTCTPEERRHNQRERLNQILLNLLEKIPGKNAIDVTY 2890 2900 2910 2920 2930 2940 2950 2960 pF1KE3 LLEEGSGRKLRRRTLFIPENSFRK :::::::::::::::::::::::: CCDS11 LLEEGSGRKLRRRTLFIPENSFRK 2950 2960 >>CCDS11923.2 SETBP1 gene_id:26040|Hs108|chr18 (1596 aa) initn: 1133 init1: 344 opt: 1216 Z-score: 790.4 bits: 160.0 E(32554): 1e-37 Smith-Waterman score: 1710; 30.7% identity (56.3% similar) in 1536 aa overlap (501-1985:231-1572) 480 490 500 510 520 530 pF1KE3 RQNKESILEKFSVRKEIINLEKEMFNEGTCIQQDSFSSSEKGSYETSKHEKQPPVYCTSP . :. : : :.: ::.. : : . .. CCDS11 FTGDTLKPKHQQKSSSQNHMDWSTNSDSGPVTQNCFISPESGR-ETASTSKIPALEPVAS 210 220 230 240 250 540 550 560 570 580 pF1KE3 DFKMGGASDVSTAKSPFSAVGESNLP------SPSPTVSVNPLTRSPPETSSQLAPNPLL : : . ..: . .: ....: .:::. .: .:: .:.. : CCDS11 FAKAQGKK--GSAGNTWSQLSNNNKDLLLGGVAPSPSSHSSP---APPSSSAECNGLQPL 260 270 280 290 300 310 590 600 610 620 630 640 pF1KE3 LSSTTELIEEISE--SVGKNQFTSESTHLNVGHRSVGHSISIECKGIDKEVNDSKTTHID ... .: : .::... .:.. . : .: .: : .:. CCDS11 VDQDGGGTKEPPEPPTVGSKKKSSKKDVI---------SQTIPNPDLDWVKNAQKA---- 320 330 340 350 360 650 660 670 680 690 pF1KE3 IPRISSSLGKKPSLTSESSIHTITPSVVNFTSLFSNKPFLKLGAVSASDKHCQV-----A .... ::. . ...:. . .:. : .: ...: ...: .. : CCDS11 ---FDNTEGKREGYSADSA-QEASPARQNVSS--ASNP-------ENDSSHVRITIPIKA 370 380 390 400 700 710 720 730 740 750 pF1KE3 ESLSTSLQSKPLKKRKGRKPRWTKVVARSTCRSPKGLELERSELFKNVSCSSLSNSNSEP ::. . ... :::.. : :.. ... : :. . ::. . . ::::.. CCDS11 PSLDPTNHKR--KKRQSIKAVVEKIMPEKALAS--GITMS-SEVVNRI----LSNSEG-- 410 420 430 440 450 760 770 780 790 800 810 pF1KE3 AKFMKNIGPPSFVDHDFLKRRLPKLSK---STAPSLALLA--DSEKPSHKSFATHKLSSS : : :.::::: . .::..: . ..:: . . . . CCDS11 -----NKKDP----------RVPKLSKMIENESPSVGLETGGNAEKVIPGGVSKPR-KPP 460 470 480 490 500 820 830 840 850 860 pF1KE3 MCVSSDLLSDIYKPKRGRPKSKEMPQLEGPPKRTLKIPASK------VFSLQSKEEQEPP : .. .: ..:.: :. .. :.. . . : . : . :.. ..: ::: CCDS11 MVMTPPTCTD-HSPSRKLPEIQH-PKFAAKRRWTCSKPKPSTMLREAVMATSDKLMLEPP 510 520 530 540 550 870 880 890 900 910 920 pF1KE3 I---LQPEIEIPSFKQGLSV-SPFPKKRGRPKRQMRSPVKMKPPVLSVAPFVATESPSKL . : . . ..:.: .: :::::::.: :. :..: :: . CCDS11 SAYPITPSSPLYTNTDSLTVITPVKKKRGRPKKQPLLTVETIHEGTSTSPV----SPISR 560 570 580 590 600 610 930 940 950 960 970 980 pF1KE3 ESESDNHRSSSDFFESEDQLQDPDDLDDSHRPSVCSMSDLEMEPDKKITKRNNGQLMKTI : . ..:. . . :: .: .: :: ::. ::. : : : : CCDS11 EFPGTKKRKRRRNLAKLAQLVPGED-----KP----MS--EMKFHKKVGKL--GVLDKKT 620 630 640 650 660 990 1000 1010 1020 1030 1040 pF1KE3 IRKINKMKTLKRKKLLNQILSSSVESSNKGKVQSKLHNTVSSLAATFGSKLGQQINVSKK :. ::::::::::..:::::: : . :.:. . .: ::.. ::::.::::::. CCDS11 IKTINKMKTLKRKNILNQILSCSSSVALKAKAPPE----TSPGAAAIESKLGKQINVSKR 670 680 690 700 710 1050 1060 1070 1080 1090 pF1KE3 GTIYIGKRRGRKPKTVLNGILSGSPTSLAVLEQTAQQAAGSALGQILPPLLPSS----AS :::::::.:::::.. : : : .:: . . .: : .::. .. CCDS11 GTIYIGKKRGRKPRAEL------PPPSEE--PKTAIKHPRPVSSQPDVPAVPSNFQSLVA 720 730 740 750 760 770 1100 1110 1120 1130 1140 1150 pF1KE3 SSEILPSPICSQSSGTSGGQSPVSSDAGFVEPSSVPYLHLHSRQGSMIQTLAMKKASKGR :: :. .: .:..:. ::.:....: : ...: :. : . : ..: .: CCDS11 SSPAAMHPLSTQLGGSNGNLSPASTETNFSELKTMPNLQ----PISALPTKTQKGIHSGT 780 790 800 810 820 1160 1170 1180 1190 1200 1210 pF1KE3 RRLSPPTLLPNSPSHLSELTSLKEATPSPISESHSDETIPSDSGIGTDNNSTSDRAEKFC .:::: :. :::::: :. :::: : ::.:::::.::::::::::::::::::.::: CCDS11 WKLSPPRLMANSPSHLCEIGSLKEITLSPVSESHSEETIPSDSGIGTDNNSTSDQAEK-S 830 840 850 860 870 880 1220 1230 1240 1250 1260 1270 pF1KE3 GQKKRRHSFEHVSLIPPETSTVLSSLKEKHKHKCKRRNHD-YLSYDKMKRQKRKRKKKYP ....::.::. :: ::. .: :..: :. :. : .:.....:. :.:::.: CCDS11 SESRRRYSFDFCSLDNPEAIPSDTSTKNRHGHRQKHLIVDNFLAHESLKKPKHKRKRK-- 890 900 910 920 930 940 1280 1290 1300 1310 1320 1330 pF1KE3 QLRNRQDPDFIAELEELISRLSEIRITHRSHHFIPRDLLPTIFRINFNSFYTHPSFPLDP .:.::.: .:.:.:::::.... .::.:::. : .. :.::::::. .: : . :: CCDS11 SLQNRDDLQFLADLEELITKFQVFRISHRSYTFYHENPYPSIFRINFDHYYPVPYIQYDP 950 960 970 980 990 1000 1340 1350 1360 1370 1380 1390 pF1KE3 LHYIRKP-DLK--KKRGRPPKMREAMAEMPFMHSLSFPLSSTGFYPSYGMPYSPSPLTAA : :.:. ::: :::::: : ..:...::....:.:. : ..: :::::. :. CCDS11 LLYLRRTSDLKSKKKRGRPAKTNDTMTKVPFLQGFSYPIPSGSYYAPYGMPYTSMPM--- 1010 1020 1030 1040 1050 1060 1400 1410 1420 1430 1440 1450 pF1KE3 PIGLGYYGRYPPTLYPP----PPSPSFTTPLPPPSYMHAGHLLLNPAKYHKKKHKLLRQE ..:::::.:: :: :: . .:::.. .:. .. : :: :: . : CCDS11 -MNLGYYGQYPAPLYLSHTLGAASPFMRPTVPPPQFHTNSHVKMSGAAKHKAKHGVHLQ- 1070 1080 1090 1100 1110 1460 1470 1480 1490 1500 pF1KE3 AFLTTSRTPLLSMSTYPSV-PPEMAYGWMVEHKHRHRHKHREHRSSEQPQVSMDTGSSRS . .. . . . :.: .. : . ..::.:.:::.: : . : .. : CCDS11 GPVSMGLGDMQPSLNPPKVGSASLSSGRLHKRKHKHKHKHKEDRI-------LGTHDNLS 1120 1130 1140 1150 1160 1170 1510 1520 1530 1540 1550 1560 pF1KE3 VLESLKRYRFGKDAVGERYKHKEKHRCHMSCPHLSPSKSLINREEQWVHREPSESSPLAL : . : :.. ..:: . .:. : .: ... ..:.: ... ::.. : CCDS11 GLFAGKATGFSSHILSERLSSADKE-----LPLVSEKNK--HKEKQ--KHQHSEAGHKAS 1180 1190 1200 1210 1220 1570 1580 1590 1600 1610 1620 pF1KE3 GLQTPLQIDCSESSPSLSLGGFTPNSEPASSDEHTNLFTSAIGSC--RVSNPNSSGRKKL .. ...: .:: ... .. ... :. .: . . :: : :. ...: . CCDS11 --KNNFEVD------TLSTLSLSDAQHWTQAKEKGDLSSEPVDSCTKRYSGSGGDGGSTR 1230 1240 1250 1260 1270 1630 1640 1650 1660 1670 1680 pF1KE3 TDSPGLFSAQDTSLNRLHRKESLPSNERAVQTLAGSQPTSDKP--SQRPSESTNCSPTRK ... .:: .. :::.. . ..::. : . . : .. . .:: CCDS11 SENLDVFSEMN------------PSNDKWDSDVSGSKRRSYEGFGTYREKDIQAFKMNRK 1280 1290 1300 1310 1320 1690 1700 1710 1720 1730 1740 pF1KE3 RSSSESTSSTVNGVPSRSPRLVASGDDSVDSLLQRMVQNEDQEP--MEKSIDAVIATASA . :: . :: :.:: :.: .. . .: : .:: . : : .. :.. ... CCDS11 ERSSYD-SSMSPGMPS--PHLKVD-QTAVHS------KNEGSVPTMMTRKKPAAVDSVTI 1330 1340 1350 1360 1370 1750 1760 1770 1780 1790 1800 pF1KE3 PPSSSPGRSHSKDRTLGKPDSLLVPAVTSDSCNNSISLLSEKLTSSCSPHHIKRSVVEAM ::. : : : . :.:::. ..:.. ...:: .::. CCDS11 PPA--PVLS-----------LLAASAATSDAVGSSLK------------KRFKRREIEAI 1380 1390 1400 1810 1820 1830 1840 1850 pF1KE3 QRQARKMCNYDKILATKKNLDHVNKILKAKKLQRQARTGNNFVKRRPGRPRKCPLQ---- : ..:::::: :::.:::::::::::::::.::::..:::::::.: ::::: : : CCDS11 QCEVRKMCNYTKILSTKKNLDHVNKILKAKRLQRQSKTGNNFVKKRRGRPRKQPTQFDED 1410 1420 1430 1440 1450 1460 1860 1870 1880 1890 1900 1910 pF1KE3 AVVSMQAFQAAQFVNPELNRDEEGAALHLSPDTVTDVIEAVVQSVNLNPEHKKGLKRKGW . .: ... . . .. . : : : . :.: :....: : . :.. CCDS11 SRDQMPVLEKCIDLPSKRGQKPSLSPLVLEPAASQDTIMATIEAVI----H---MAREAP 1470 1480 1490 1500 1510 1520 1920 1930 1940 1950 1960 1970 pF1KE3 LLEEQTRKKQKPLPEEEEQENNKSFNEAPVEIPSPSETPAKPSEPESTLQPVLSLIPREK : ::: : .: : : : . .: : .. CCDS11 PLPPPP---PPPLPPPP-----------PPPLPPPPPLPKTPRGGKRKHKPQAPAQPPQQ 1530 1540 1550 1560 1980 1990 2000 2010 2020 2030 pF1KE3 KPPRPPKKKYQKAGLYSDVYKTTDPKSRLIQLKKEKLEYTPGEHEYGLFPAPIHVGKYLR .::. : CCDS11 SPPQQPLPQEEEVKAKRQRKSRGSESEVLP 1570 1580 1590 >>CCDS4413.1 NSD1 gene_id:64324|Hs108|chr5 (2427 aa) initn: 388 init1: 347 opt: 672 Z-score: 437.0 bits: 95.2 E(32554): 5.1e-18 Smith-Waterman score: 698; 41.5% identity (68.8% similar) in 272 aa overlap (2062-2327:1596-1847) 2040 2050 2060 2070 2080 pF1KE3 IHVGKYLRQKRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSN-----VYVDVKPLSGY ::: : ::.:. : : . . :: CCDS44 KKALQEAAARFEELKAQKELRQLQEDRKNDKKP--PPYKHIKVNRPIGRVQIFTADLS-- 1570 1580 1590 1600 1610 1620 2090 2100 2110 2120 2130 2140 pF1KE3 EATTCNCKKPDDDTRKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFR : :::: :.. : ..:.:::.. :: :..:: : .: :: ...... . .: :: CCDS44 EIPRCNCKATDENP-CGIDSECINRMLLYECHPTVCPAGGRCQNQCFSKRQYPE-VEIFR 1630 1640 1650 1660 1670 2150 2160 2170 2180 2190 2200 pF1KE3 AEEKGWGIRTKEPLKAGQFIIEYLGEVVSEQEFRNRM-IEQYHNHSDHYCLNLDSGMVID . ..:::.::: .: :.:. ::.::...:.: : :. : :. .. : :.::. .:: CCDS44 TLQRGWGLRTKTDIKKGEFVNEYVGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIID 1680 1690 1700 1710 1720 1730 2210 2220 2230 2240 2250 2260 pF1KE3 SYRMGNEARFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQ . :: :::.:: :.:::: ::::::: :.::.::.:. ::::::..::.. .. : CCDS44 AGPKGNYARFMNHCCQPNCETQKWSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKT 1740 1750 1760 1770 1780 1790 2270 2280 2290 2300 2310 2320 pF1KE3 QLCKCGFEKCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLS .:::: .: :..: . :: ::.::..:: . :.:...: .. .:... CCDS44 -VCKCGAPNCSGFLGVRP---------KN-QPIATEEKSKKFKKKQQGK---RRTQGEIT 1800 1810 1820 1830 1840 2330 2340 2350 2360 2370 2380 pF1KE3 EEPSENINTPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHS .: CCDS44 KEREDECFSCGDAGQLVSCKKPGCPKVYHADCLNLTKRPAGKWECPWHQCDICGKEAASF 1850 1860 1870 1880 1890 1900 >>CCDS4412.1 NSD1 gene_id:64324|Hs108|chr5 (2696 aa) initn: 388 init1: 347 opt: 672 Z-score: 436.3 bits: 95.2 E(32554): 5.5e-18 Smith-Waterman score: 698; 41.5% identity (68.8% similar) in 272 aa overlap (2062-2327:1865-2116) 2040 2050 2060 2070 2080 pF1KE3 IHVGKYLRQKRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSN-----VYVDVKPLSGY ::: : ::.:. : : . . :: CCDS44 KKALQEAAARFEELKAQKELRQLQEDRKNDKKP--PPYKHIKVNRPIGRVQIFTADLS-- 1840 1850 1860 1870 1880 1890 2090 2100 2110 2120 2130 2140 pF1KE3 EATTCNCKKPDDDTRKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFR : :::: :.. : ..:.:::.. :: :..:: : .: :: ...... . .: :: CCDS44 EIPRCNCKATDENP-CGIDSECINRMLLYECHPTVCPAGGRCQNQCFSKRQYPE-VEIFR 1900 1910 1920 1930 1940 2150 2160 2170 2180 2190 2200 pF1KE3 AEEKGWGIRTKEPLKAGQFIIEYLGEVVSEQEFRNRM-IEQYHNHSDHYCLNLDSGMVID . ..:::.::: .: :.:. ::.::...:.: : :. : :. .. : :.::. .:: CCDS44 TLQRGWGLRTKTDIKKGEFVNEYVGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIID 1950 1960 1970 1980 1990 2000 2210 2220 2230 2240 2250 2260 pF1KE3 SYRMGNEARFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQ . :: :::.:: :.:::: ::::::: :.::.::.:. ::::::..::.. .. : CCDS44 AGPKGNYARFMNHCCQPNCETQKWSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKT 2010 2020 2030 2040 2050 2060 2270 2280 2290 2300 2310 2320 pF1KE3 QLCKCGFEKCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLS .:::: .: :..: . :: ::.::..:: . :.:...: .. .:... CCDS44 -VCKCGAPNCSGFLGVRP---------KN-QPIATEEKSKKFKKKQQGK---RRTQGEIT 2070 2080 2090 2100 2110 2330 2340 2350 2360 2370 2380 pF1KE3 EEPSENINTPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHS .: CCDS44 KEREDECFSCGDAGQLVSCKKPGCPKVYHADCLNLTKRPAGKWECPWHQCDICGKEAASF 2120 2130 2140 2150 2160 2170 >>CCDS43729.1 WHSC1L1 gene_id:54904|Hs108|chr8 (1437 aa) initn: 500 init1: 332 opt: 658 Z-score: 431.4 bits: 93.4 E(32554): 1e-17 Smith-Waterman score: 658; 38.3% identity (69.0% similar) in 261 aa overlap (2062-2316:1068-1321) 2040 2050 2060 2070 2080 pF1KE3 IHVGKYLRQKRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSN-----VYVDVKPLSGY .:: : ::.:..: : ..: :: CCDS43 KKALEEAAKRFQELKAQRESKEALEIEKNSRKP--PPYKHIKANKVIGKVQIQVADLS-- 1040 1050 1060 1070 1080 1090 2090 2100 2110 2120 2130 2140 pF1KE3 EATTCNCKKPDDDTRKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFR : :::: : :.. : ..:::::. :: :..:: :..: :: . .. . . : .. CCDS43 EIPRCNCK-PADENPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDA-EIIK 1100 1110 1120 1130 1140 1150 2150 2160 2170 2180 2190 2200 pF1KE3 AEEKGWGIRTKEPLKAGQFIIEYLGEVVSEQEFRNRMIEQYHNH-SDHYCLNLDSGMVID .:..:::.:::. .: :.:. ::.::...:.: : :. . ..: .. : :.. . .:: CCDS43 TERRGWGLRTKRSIKKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIID 1160 1170 1180 1190 1200 1210 2210 2220 2230 2240 2250 2260 pF1KE3 SYRMGNEARFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQ . :: .::.::::.:::: :::.::: :.::.:: :.::: :::..::. .. . CCDS43 AGPKGNYSRFMNHSCNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRT 1220 1230 1240 1250 1260 1270 2270 2280 2290 2300 2310 2320 pF1KE3 QLCKCGFEKCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLS . :.:: ..: :..: . . . . :. .... ..: . : . :. :. CCDS43 E-CHCGADNCSGFLGVRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDG 1280 1290 1300 1310 1320 1330 2330 2340 2350 2360 2370 2380 pF1KE3 EEPSENINTPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHS CCDS43 GELVMCDKKDCPKAYHLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEFCPHSFCKDHE 1340 1350 1360 1370 1380 1390 >>CCDS33940.1 WHSC1 gene_id:7468|Hs108|chr4 (1365 aa) initn: 407 init1: 358 opt: 648 Z-score: 425.3 bits: 92.2 E(32554): 2.3e-17 Smith-Waterman score: 648; 38.6% identity (69.1% similar) in 259 aa overlap (2062-2316:986-1237) 2040 2050 2060 2070 2080 pF1KE3 IHVGKYLRQKRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSNV-YVDVKPLSG--YEA .:: : ::.:. : : :. .. : CCDS33 RVFKNALQEAEARFREIKLQREARETQESERKP--PPYKHIKVNKPYGKVQIYTADISEI 960 970 980 990 1000 1010 2090 2100 2110 2120 2130 2140 pF1KE3 TTCNCKKPDDDTRKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFRAE :::: : :.. : ..:::::.. :: :..:: :: : :: . .... . . .... CCDS33 PKCNCK-PTDENPCGFDSECLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPET-KIIKTD 1020 1030 1040 1050 1060 1070 2150 2160 2170 2180 2190 2200 pF1KE3 EKGWGIRTKEPLKAGQFIIEYLGEVVSEQEFRNRMIEQYHNHSDH-YCLNLDSGMVIDSY ::::. .:. .. :.:. ::.::...:.: :. . ..: : : :..:. .::. CCDS33 GKGWGLVAKRDIRKGEFVNEYVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAG 1080 1090 1100 1110 1120 1130 2210 2220 2230 2240 2250 2260 pF1KE3 RMGNEARFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQQL :: .::.::::.:::: ::.::: :.::.:. :.:::::::..::. .. :: . CCDS33 PKGNYSRFMNHSCQPNCETLKWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKT-V 1140 1150 1160 1170 1180 1190 2270 2280 2290 2300 2310 2320 pF1KE3 CKCGFEKCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLSEE :.:: .: :..: . . . :.: .... :.::. : . : ..:.. CCDS33 CRCGASNCSGFLGDRPKTSTTLSSEEKGK--KTKKKTRRRRAKGEGKRQSEDECFRCGDG 1200 1210 1220 1230 1240 2330 2340 2350 2360 2370 2380 pF1KE3 PSENINTPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHSAS CCDS33 GQLVLCDRKFCTKAYHLSCLGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQ 1250 1260 1270 1280 1290 1300 >>CCDS2749.2 SETD2 gene_id:29072|Hs108|chr3 (2564 aa) initn: 463 init1: 281 opt: 649 Z-score: 421.8 bits: 92.5 E(32554): 3.6e-17 Smith-Waterman score: 657; 26.8% identity (51.9% similar) in 786 aa overlap (1570-2309:1014-1718) 1540 1550 1560 1570 1580 1590 pF1KE3 CPHLSPSKSLINREEQWVHREPSESSPLALGLQTPLQIDCSESSPSL------SLGGFTP :. :. : : .: . . .: . CCDS27 RGEGGHVHTSDDSEVVFSSCDLNLTMEDSDGVTYALKCDSSGHAPEIVSTVHEDYSGSSE 990 1000 1010 1020 1030 1040 1600 1610 1620 1630 1640 pF1KE3 NSEPASSDEHTNLFTSAIGSCRVSN----PNSSGRKKLTDSP-GLFSAQDTSLNRLH-RK .:. :..: :. :.: :... :..: :: . :.:. : . CCDS27 SSNDESDSEDTDSDDSSIPRNRLQSVVVVPKNSTLPMEETSPCSSRSSQSYRHYSDHWED 1050 1060 1070 1080 1090 1100 1650 1660 1670 1680 1690 1700 pF1KE3 ESLPSN----ERAVQTLAGSQ-PTSDKPSQRPSESTNCSPTRKRSSSESTSSTVNGVPSR : : : :. ...:.. : .:: . . :.: :.:. . . .: CCDS27 ERLESRRHLYEEKFESIASKACPQTDKFFLHKG-------TEKNPEISFTQSSRKQIDNR 1110 1120 1130 1140 1150 1710 1720 1730 1740 1750 pF1KE3 SPRLVASGDDSVDSLLQRMVQNEDQ-EPM-EKSIDAVIATASA---PPSSS-----PGRS :.: .:.::: . :... .: :... : : . . : :: :..: CCDS27 LPELSHPQSDGVDSTSHTDVKSDPLGHPNSEETVKAKIPSRQQEELPIYSSDFEDVPNKS 1160 1170 1180 1190 1200 1210 1760 1770 1780 1790 1800 1810 pF1KE3 HSKDRTLGKPDSLLVPAVTSDSCNNSISLLSEKLTSSCSPHHIKRSVVEAMQRQARKMCN .. ..::: : . . :: ..::: :. :. . CCDS27 WQQTTFQNRPDSRL-----------GKTELS--FSSSCEIPHVDGLHSSEELRNLGWDFS 1220 1230 1240 1250 1260 1820 1830 1840 1850 1860 pF1KE3 YDKILATKKNLDHVNKILKAKKLQRQART---------GNNFVKRRPGRPRKCPLQAVVS .: .: .. : ..: :..:. ::.. : ::: : .:: CCDS27 QEKPSTTYQQPDSSYGACGGHKYQQNAEQYGGTRDYWQGNGYWDPRSGRP---PGTGVV- 1270 1280 1290 1300 1310 1870 1880 1890 1900 1910 1920 pF1KE3 MQAFQAAQFVNPELNRDEEGAALHLSPDTVTDVIEAVVQSVNLNPEHKKGLKRKGWLLEE .. .: : . ::..:: : :... .. : . . CCDS27 ---YDRTQ-----------GQV----PDSLTDDRE----------EEENWDQQDGSHFSD 1320 1330 1340 1350 1930 1940 1950 1960 1970 1980 pF1KE3 QTRKKQKPLPEEEEQENNKSFNEAPVEIPSPSETPAKPSEPESTLQPVLSLIPREKKPPR :. : : ...:. .:: :: : : : . . . . . .. : CCDS27 QSDKFLLSL------QKDKGSVQAP-EISSNS---IKDTLAVNEKKDFSKNLEKNDIKDR 1360 1370 1380 1390 1400 1990 2000 2010 2020 2030 2040 pF1KE3 PPKKKYQKAGLYSDVYKTTDPKSRLIQLKKEKLEYTPGEHEYGLFPAPIHVGKYLRQKRI : :: .. .. . .. ..: . :: ..: :: .. :. :: . CCDS27 GPLKKRRQ-----EIESDSESDGELQDRKKVRVEVEQGET--SVPPGSALVGPSCVMD-- 1410 1420 1430 1440 1450 2050 2060 2070 2080 2090 pF1KE3 DFQLPYDILWQWKHNQLYKKPDVPLY-KKIRSNVYVDV----KPLSGYEATTCNCKKPDD ::. : .:: . :. .: : :. :::. : . :.: . CCDS27 DFRDPQ----RWK--ECAKQGKMPCYFDLIEENVYLTERKKNKSHRDIKRMQCECTPLSK 1460 1470 1480 1490 1500 2100 2110 2120 2130 2140 2150 pF1KE3 DTR-KG---CVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFRAEEKGWGI : : .: : .:::::... ::: . :: :. : :.:.::.. .. .: . .:.::::. CCDS27 DERAQGEIACGEDCLNRLLMIECS-SRCPNGDYCSNRRFQRKQHAD-VEVILTEKKGWGL 1510 1520 1530 1540 1550 1560 2160 2170 2180 2190 2200 2210 pF1KE3 RTKEPLKAGQFIIEYLGEVVSEQEFRNRMIEQYHNHSDHY-CLNLDSGMVIDSYRMGNEA :. . : .. :..:: :::....::. :. : .:.. :: . : . .::. . :: . CCDS27 RAAKDLPSNTFVLEYCGEVLDHKEFKARVKEYARNKNIHYYFMALKNDEIIDATQKGNCS 1570 1580 1590 1600 1610 1620 2220 2230 2240 2250 2260 2270 pF1KE3 RFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQQLCKCGFE ::.::::.:::: :::.::: :.:... : .:.:.:::.::.:. .. : :. : :: CCDS27 RFMNHSCEPNCETQKWTVNGQLRVGFFTTKLVPSGSELTFDYQFQRYGKEAQK-CFCGSA 1630 1640 1650 1660 1670 1680 2280 2290 2300 2310 2320 2330 pF1KE3 KCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLSEEPSENIN .::: .::.. ::. ... . . ..::.. . : CCDS27 NCRGYLGGEN-RVSIRAAGGKMKKERSRKKDSVDGELEALMENGEGLSDKNQVLSLSRLM 1690 1700 1710 1720 1730 1740 2340 2350 2360 2370 2380 2390 pF1KE3 TPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHSASLYTRWN CCDS27 VRIETLEQKLTCLELIQNTHSQSCLKSFLERHGLSLLWIWMAELGDGRESNQKLQEEIIK 1750 1760 1770 1780 1790 1800 2964 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 06:57:11 2016 done: Sun Nov 6 06:57:12 2016 Total Scan time: 7.400 Total Display time: 0.840 Function used was FASTA [36.3.4 Apr, 2011]