FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3830, 2964 aa
1>>>pF1KE3830 2964 - 2964 aa - 2964 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.0272+/-0.00117; mu= 6.0203+/- 0.071
mean_var=240.6428+/-48.332, 0's: 0 Z-trim(110.3): 58 B-trim: 6 in 1/51
Lambda= 0.082678
statistics sampled from 11486 (11540) to 11486 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.669), E-opt: 0.2 (0.354), width: 16
Scan time: 7.400
The best scores are: opt bits E(32554)
CCDS1113.2 ASH1L gene_id:55870|Hs108|chr1 (2964) 19783 2374.8 0
CCDS11923.2 SETBP1 gene_id:26040|Hs108|chr18 (1596) 1216 160.0 1e-37
CCDS4413.1 NSD1 gene_id:64324|Hs108|chr5 (2427) 672 95.2 5.1e-18
CCDS4412.1 NSD1 gene_id:64324|Hs108|chr5 (2696) 672 95.2 5.5e-18
CCDS43729.1 WHSC1L1 gene_id:54904|Hs108|chr8 (1437) 658 93.4 1e-17
CCDS33940.1 WHSC1 gene_id:7468|Hs108|chr4 (1365) 648 92.2 2.3e-17
CCDS2749.2 SETD2 gene_id:29072|Hs108|chr3 (2564) 649 92.5 3.6e-17
>>CCDS1113.2 ASH1L gene_id:55870|Hs108|chr1 (2964 aa)
initn: 19783 init1: 19783 opt: 19783 Z-score: 12755.3 bits: 2374.8 E(32554): 0
Smith-Waterman score: 19783; 100.0% identity (100.0% similar) in 2964 aa overlap (1-2964:1-2964)
10 20 30 40 50 60
pF1KE3 MDPRNTAMLGLGSDSEGFSRKSPSAISTGTLVSKREVELEKNTKEEEDLRKRNRERNIEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MDPRNTAMLGLGSDSEGFSRKSPSAISTGTLVSKREVELEKNTKEEEDLRKRNRERNIEA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 GKDDGLTDAQQQFSVKETNFSEGNLKLKIGLQAKRTKKPPKNLENYVCRPAIKTTIKHPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GKDDGLTDAQQQFSVKETNFSEGNLKLKIGLQAKRTKKPPKNLENYVCRPAIKTTIKHPR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 KALKSGKMTDEKNEHCPSKRDPSKLYKKADDVAAIECQSEEVIRLHSQGENNPLSKKLSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KALKSGKMTDEKNEHCPSKRDPSKLYKKADDVAAIECQSEEVIRLHSQGENNPLSKKLSP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 VHSEMADYINATPSTLLGSRDPDLKDRALLNGGTSVTEKLAQLIATCPPSKSSKTKPKKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VHSEMADYINATPSTLLGSRDPDLKDRALLNGGTSVTEKLAQLIATCPPSKSSKTKPKKL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 GTGTTAGLVSKDLIRKAGVGSVAGIIHKDLIKKPTISTAVGLVTKDPGKKPVFNAAVGLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GTGTTAGLVSKDLIRKAGVGSVAGIIHKDLIKKPTISTAVGLVTKDPGKKPVFNAAVGLV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 NKDSVKKLGTGTTAVFINKNLGKKPGTITTVGLLSKDSGKKLGIGIVPGLVHKESGKKLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 NKDSVKKLGTGTTAVFINKNLGKKPGTITTVGLLSKDSGKKLGIGIVPGLVHKESGKKLG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 LGTVVGLVNKDLGKKLGSTVGLVAKDCAKKIVASSAMGLVNKDIGKKLMSCPLAGLISKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LGTVVGLVNKDLGKKLGSTVGLVAKDCAKKIVASSAMGLVNKDIGKKLMSCPLAGLISKD
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 AINLKAEALLPTQEPLKASCSTNINNQESQELSESLKDSATSKTFEKNVVRQNKESILEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AINLKAEALLPTQEPLKASCSTNINNQESQELSESLKDSATSKTFEKNVVRQNKESILEK
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 FSVRKEIINLEKEMFNEGTCIQQDSFSSSEKGSYETSKHEKQPPVYCTSPDFKMGGASDV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 FSVRKEIINLEKEMFNEGTCIQQDSFSSSEKGSYETSKHEKQPPVYCTSPDFKMGGASDV
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 STAKSPFSAVGESNLPSPSPTVSVNPLTRSPPETSSQLAPNPLLLSSTTELIEEISESVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 STAKSPFSAVGESNLPSPSPTVSVNPLTRSPPETSSQLAPNPLLLSSTTELIEEISESVG
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE3 KNQFTSESTHLNVGHRSVGHSISIECKGIDKEVNDSKTTHIDIPRISSSLGKKPSLTSES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KNQFTSESTHLNVGHRSVGHSISIECKGIDKEVNDSKTTHIDIPRISSSLGKKPSLTSES
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE3 SIHTITPSVVNFTSLFSNKPFLKLGAVSASDKHCQVAESLSTSLQSKPLKKRKGRKPRWT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SIHTITPSVVNFTSLFSNKPFLKLGAVSASDKHCQVAESLSTSLQSKPLKKRKGRKPRWT
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE3 KVVARSTCRSPKGLELERSELFKNVSCSSLSNSNSEPAKFMKNIGPPSFVDHDFLKRRLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KVVARSTCRSPKGLELERSELFKNVSCSSLSNSNSEPAKFMKNIGPPSFVDHDFLKRRLP
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE3 KLSKSTAPSLALLADSEKPSHKSFATHKLSSSMCVSSDLLSDIYKPKRGRPKSKEMPQLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KLSKSTAPSLALLADSEKPSHKSFATHKLSSSMCVSSDLLSDIYKPKRGRPKSKEMPQLE
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE3 GPPKRTLKIPASKVFSLQSKEEQEPPILQPEIEIPSFKQGLSVSPFPKKRGRPKRQMRSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GPPKRTLKIPASKVFSLQSKEEQEPPILQPEIEIPSFKQGLSVSPFPKKRGRPKRQMRSP
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE3 VKMKPPVLSVAPFVATESPSKLESESDNHRSSSDFFESEDQLQDPDDLDDSHRPSVCSMS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VKMKPPVLSVAPFVATESPSKLESESDNHRSSSDFFESEDQLQDPDDLDDSHRPSVCSMS
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE3 DLEMEPDKKITKRNNGQLMKTIIRKINKMKTLKRKKLLNQILSSSVESSNKGKVQSKLHN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 DLEMEPDKKITKRNNGQLMKTIIRKINKMKTLKRKKLLNQILSSSVESSNKGKVQSKLHN
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE3 TVSSLAATFGSKLGQQINVSKKGTIYIGKRRGRKPKTVLNGILSGSPTSLAVLEQTAQQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 TVSSLAATFGSKLGQQINVSKKGTIYIGKRRGRKPKTVLNGILSGSPTSLAVLEQTAQQA
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE3 AGSALGQILPPLLPSSASSSEILPSPICSQSSGTSGGQSPVSSDAGFVEPSSVPYLHLHS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AGSALGQILPPLLPSSASSSEILPSPICSQSSGTSGGQSPVSSDAGFVEPSSVPYLHLHS
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE3 RQGSMIQTLAMKKASKGRRRLSPPTLLPNSPSHLSELTSLKEATPSPISESHSDETIPSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RQGSMIQTLAMKKASKGRRRLSPPTLLPNSPSHLSELTSLKEATPSPISESHSDETIPSD
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE3 SGIGTDNNSTSDRAEKFCGQKKRRHSFEHVSLIPPETSTVLSSLKEKHKHKCKRRNHDYL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SGIGTDNNSTSDRAEKFCGQKKRRHSFEHVSLIPPETSTVLSSLKEKHKHKCKRRNHDYL
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE3 SYDKMKRQKRKRKKKYPQLRNRQDPDFIAELEELISRLSEIRITHRSHHFIPRDLLPTIF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SYDKMKRQKRKRKKKYPQLRNRQDPDFIAELEELISRLSEIRITHRSHHFIPRDLLPTIF
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE3 RINFNSFYTHPSFPLDPLHYIRKPDLKKKRGRPPKMREAMAEMPFMHSLSFPLSSTGFYP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RINFNSFYTHPSFPLDPLHYIRKPDLKKKRGRPPKMREAMAEMPFMHSLSFPLSSTGFYP
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE3 SYGMPYSPSPLTAAPIGLGYYGRYPPTLYPPPPSPSFTTPLPPPSYMHAGHLLLNPAKYH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SYGMPYSPSPLTAAPIGLGYYGRYPPTLYPPPPSPSFTTPLPPPSYMHAGHLLLNPAKYH
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE3 KKKHKLLRQEAFLTTSRTPLLSMSTYPSVPPEMAYGWMVEHKHRHRHKHREHRSSEQPQV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KKKHKLLRQEAFLTTSRTPLLSMSTYPSVPPEMAYGWMVEHKHRHRHKHREHRSSEQPQV
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE3 SMDTGSSRSVLESLKRYRFGKDAVGERYKHKEKHRCHMSCPHLSPSKSLINREEQWVHRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SMDTGSSRSVLESLKRYRFGKDAVGERYKHKEKHRCHMSCPHLSPSKSLINREEQWVHRE
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KE3 PSESSPLALGLQTPLQIDCSESSPSLSLGGFTPNSEPASSDEHTNLFTSAIGSCRVSNPN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PSESSPLALGLQTPLQIDCSESSPSLSLGGFTPNSEPASSDEHTNLFTSAIGSCRVSNPN
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KE3 SSGRKKLTDSPGLFSAQDTSLNRLHRKESLPSNERAVQTLAGSQPTSDKPSQRPSESTNC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SSGRKKLTDSPGLFSAQDTSLNRLHRKESLPSNERAVQTLAGSQPTSDKPSQRPSESTNC
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KE3 SPTRKRSSSESTSSTVNGVPSRSPRLVASGDDSVDSLLQRMVQNEDQEPMEKSIDAVIAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SPTRKRSSSESTSSTVNGVPSRSPRLVASGDDSVDSLLQRMVQNEDQEPMEKSIDAVIAT
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KE3 ASAPPSSSPGRSHSKDRTLGKPDSLLVPAVTSDSCNNSISLLSEKLTSSCSPHHIKRSVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 ASAPPSSSPGRSHSKDRTLGKPDSLLVPAVTSDSCNNSISLLSEKLTSSCSPHHIKRSVV
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KE3 EAMQRQARKMCNYDKILATKKNLDHVNKILKAKKLQRQARTGNNFVKRRPGRPRKCPLQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 EAMQRQARKMCNYDKILATKKNLDHVNKILKAKKLQRQARTGNNFVKRRPGRPRKCPLQA
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KE3 VVSMQAFQAAQFVNPELNRDEEGAALHLSPDTVTDVIEAVVQSVNLNPEHKKGLKRKGWL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VVSMQAFQAAQFVNPELNRDEEGAALHLSPDTVTDVIEAVVQSVNLNPEHKKGLKRKGWL
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KE3 LEEQTRKKQKPLPEEEEQENNKSFNEAPVEIPSPSETPAKPSEPESTLQPVLSLIPREKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LEEQTRKKQKPLPEEEEQENNKSFNEAPVEIPSPSETPAKPSEPESTLQPVLSLIPREKK
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KE3 PPRPPKKKYQKAGLYSDVYKTTDPKSRLIQLKKEKLEYTPGEHEYGLFPAPIHVGKYLRQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PPRPPKKKYQKAGLYSDVYKTTDPKSRLIQLKKEKLEYTPGEHEYGLFPAPIHVGKYLRQ
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KE3 KRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSNVYVDVKPLSGYEATTCNCKKPDDDT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSNVYVDVKPLSGYEATTCNCKKPDDDT
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KE3 RKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFRAEEKGWGIRTKEPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFRAEEKGWGIRTKEPL
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KE3 KAGQFIIEYLGEVVSEQEFRNRMIEQYHNHSDHYCLNLDSGMVIDSYRMGNEARFINHSC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KAGQFIIEYLGEVVSEQEFRNRMIEQYHNHSDHYCLNLDSGMVIDSYRMGNEARFINHSC
2170 2180 2190 2200 2210 2220
2230 2240 2250 2260 2270 2280
pF1KE3 DPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQQLCKCGFEKCRGIIG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 DPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQQLCKCGFEKCRGIIG
2230 2240 2250 2260 2270 2280
2290 2300 2310 2320 2330 2340
pF1KE3 GKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLSEEPSENINTPTRLTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLSEEPSENINTPTRLTP
2290 2300 2310 2320 2330 2340
2350 2360 2370 2380 2390 2400
pF1KE3 QLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHSASLYTRWNGICRDDG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 QLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHSASLYTRWNGICRDDG
2350 2360 2370 2380 2390 2400
2410 2420 2430 2440 2450 2460
pF1KE3 NIKSDVFMTQFSALQTARSVRTRRLAAAEENIEVARAARLAQIFKEICDGIISYKDSSRQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 NIKSDVFMTQFSALQTARSVRTRRLAAAEENIEVARAARLAQIFKEICDGIISYKDSSRQ
2410 2420 2430 2440 2450 2460
2470 2480 2490 2500 2510 2520
pF1KE3 ALAAPLLNLPPKKKNADYYEKISDPLDLITIEKQILTGYYKTVEAFDADMLKVFRNAEKY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 ALAAPLLNLPPKKKNADYYEKISDPLDLITIEKQILTGYYKTVEAFDADMLKVFRNAEKY
2470 2480 2490 2500 2510 2520
2530 2540 2550 2560 2570 2580
pF1KE3 YGRKSPVGRDVCRLRKAYYNARHEASAQIDEIVGETASEADSSETSVSEKENGHEKDDDV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 YGRKSPVGRDVCRLRKAYYNARHEASAQIDEIVGETASEADSSETSVSEKENGHEKDDDV
2530 2540 2550 2560 2570 2580
2590 2600 2610 2620 2630 2640
pF1KE3 IRCICGLYKDEGLMIQCDKCMVWQHCDCMGVNSDVEHYLCEQCDPRPVDREVPMIPRPHY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 IRCICGLYKDEGLMIQCDKCMVWQHCDCMGVNSDVEHYLCEQCDPRPVDREVPMIPRPHY
2590 2600 2610 2620 2630 2640
2650 2660 2670 2680 2690 2700
pF1KE3 AQPGCVYFICLLRDDLLLRQGDCVYLMRDSRRTPDGHPVRQSYRLLSHINRDKLDIFRIE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AQPGCVYFICLLRDDLLLRQGDCVYLMRDSRRTPDGHPVRQSYRLLSHINRDKLDIFRIE
2650 2660 2670 2680 2690 2700
2710 2720 2730 2740 2750 2760
pF1KE3 KLWKNEKEERFAFGHHYFRPHETHHSPSRRFYHNELFRVPLYEIIPLEAVVGTCCVLDLY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KLWKNEKEERFAFGHHYFRPHETHHSPSRRFYHNELFRVPLYEIIPLEAVVGTCCVLDLY
2710 2720 2730 2740 2750 2760
2770 2780 2790 2800 2810 2820
pF1KE3 TYCKGRPKGVKEQDVYICDYRLDKSAHLFYKIHRNRYPVCTKPYAFDHFPKKLTPKKDFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 TYCKGRPKGVKEQDVYICDYRLDKSAHLFYKIHRNRYPVCTKPYAFDHFPKKLTPKKDFS
2770 2780 2790 2800 2810 2820
2830 2840 2850 2860 2870 2880
pF1KE3 PHYVPDNYKRNGGRSSWKSERSKPPLKDLGQEDDALPLIEEVLASQEQAANEIPSLEEPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PHYVPDNYKRNGGRSSWKSERSKPPLKDLGQEDDALPLIEEVLASQEQAANEIPSLEEPE
2830 2840 2850 2860 2870 2880
2890 2900 2910 2920 2930 2940
pF1KE3 REGATANVSEGEKKTEESSQEPQSTCTPEERRHNQRERLNQILLNLLEKIPGKNAIDVTY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 REGATANVSEGEKKTEESSQEPQSTCTPEERRHNQRERLNQILLNLLEKIPGKNAIDVTY
2890 2900 2910 2920 2930 2940
2950 2960
pF1KE3 LLEEGSGRKLRRRTLFIPENSFRK
::::::::::::::::::::::::
CCDS11 LLEEGSGRKLRRRTLFIPENSFRK
2950 2960
>>CCDS11923.2 SETBP1 gene_id:26040|Hs108|chr18 (1596 aa)
initn: 1133 init1: 344 opt: 1216 Z-score: 790.4 bits: 160.0 E(32554): 1e-37
Smith-Waterman score: 1710; 30.7% identity (56.3% similar) in 1536 aa overlap (501-1985:231-1572)
480 490 500 510 520 530
pF1KE3 RQNKESILEKFSVRKEIINLEKEMFNEGTCIQQDSFSSSEKGSYETSKHEKQPPVYCTSP
. :. : : :.: ::.. : : . ..
CCDS11 FTGDTLKPKHQQKSSSQNHMDWSTNSDSGPVTQNCFISPESGR-ETASTSKIPALEPVAS
210 220 230 240 250
540 550 560 570 580
pF1KE3 DFKMGGASDVSTAKSPFSAVGESNLP------SPSPTVSVNPLTRSPPETSSQLAPNPLL
: : . ..: . .: ....: .:::. .: .:: .:.. :
CCDS11 FAKAQGKK--GSAGNTWSQLSNNNKDLLLGGVAPSPSSHSSP---APPSSSAECNGLQPL
260 270 280 290 300 310
590 600 610 620 630 640
pF1KE3 LSSTTELIEEISE--SVGKNQFTSESTHLNVGHRSVGHSISIECKGIDKEVNDSKTTHID
... .: : .::... .:.. . : .: .: : .:.
CCDS11 VDQDGGGTKEPPEPPTVGSKKKSSKKDVI---------SQTIPNPDLDWVKNAQKA----
320 330 340 350 360
650 660 670 680 690
pF1KE3 IPRISSSLGKKPSLTSESSIHTITPSVVNFTSLFSNKPFLKLGAVSASDKHCQV-----A
.... ::. . ...:. . .:. : .: ...: ...: .. :
CCDS11 ---FDNTEGKREGYSADSA-QEASPARQNVSS--ASNP-------ENDSSHVRITIPIKA
370 380 390 400
700 710 720 730 740 750
pF1KE3 ESLSTSLQSKPLKKRKGRKPRWTKVVARSTCRSPKGLELERSELFKNVSCSSLSNSNSEP
::. . ... :::.. : :.. ... : :. . ::. . . ::::..
CCDS11 PSLDPTNHKR--KKRQSIKAVVEKIMPEKALAS--GITMS-SEVVNRI----LSNSEG--
410 420 430 440 450
760 770 780 790 800 810
pF1KE3 AKFMKNIGPPSFVDHDFLKRRLPKLSK---STAPSLALLA--DSEKPSHKSFATHKLSSS
: : :.::::: . .::..: . ..:: . . . .
CCDS11 -----NKKDP----------RVPKLSKMIENESPSVGLETGGNAEKVIPGGVSKPR-KPP
460 470 480 490 500
820 830 840 850 860
pF1KE3 MCVSSDLLSDIYKPKRGRPKSKEMPQLEGPPKRTLKIPASK------VFSLQSKEEQEPP
: .. .: ..:.: :. .. :.. . . : . : . :.. ..: :::
CCDS11 MVMTPPTCTD-HSPSRKLPEIQH-PKFAAKRRWTCSKPKPSTMLREAVMATSDKLMLEPP
510 520 530 540 550
870 880 890 900 910 920
pF1KE3 I---LQPEIEIPSFKQGLSV-SPFPKKRGRPKRQMRSPVKMKPPVLSVAPFVATESPSKL
. : . . ..:.: .: :::::::.: :. :..: :: .
CCDS11 SAYPITPSSPLYTNTDSLTVITPVKKKRGRPKKQPLLTVETIHEGTSTSPV----SPISR
560 570 580 590 600 610
930 940 950 960 970 980
pF1KE3 ESESDNHRSSSDFFESEDQLQDPDDLDDSHRPSVCSMSDLEMEPDKKITKRNNGQLMKTI
: . ..:. . . :: .: .: :: ::. ::. : : : :
CCDS11 EFPGTKKRKRRRNLAKLAQLVPGED-----KP----MS--EMKFHKKVGKL--GVLDKKT
620 630 640 650 660
990 1000 1010 1020 1030 1040
pF1KE3 IRKINKMKTLKRKKLLNQILSSSVESSNKGKVQSKLHNTVSSLAATFGSKLGQQINVSKK
:. ::::::::::..:::::: : . :.:. . .: ::.. ::::.::::::.
CCDS11 IKTINKMKTLKRKNILNQILSCSSSVALKAKAPPE----TSPGAAAIESKLGKQINVSKR
670 680 690 700 710
1050 1060 1070 1080 1090
pF1KE3 GTIYIGKRRGRKPKTVLNGILSGSPTSLAVLEQTAQQAAGSALGQILPPLLPSS----AS
:::::::.:::::.. : : : .:: . . .: : .::. ..
CCDS11 GTIYIGKKRGRKPRAEL------PPPSEE--PKTAIKHPRPVSSQPDVPAVPSNFQSLVA
720 730 740 750 760 770
1100 1110 1120 1130 1140 1150
pF1KE3 SSEILPSPICSQSSGTSGGQSPVSSDAGFVEPSSVPYLHLHSRQGSMIQTLAMKKASKGR
:: :. .: .:..:. ::.:....: : ...: :. : . : ..: .:
CCDS11 SSPAAMHPLSTQLGGSNGNLSPASTETNFSELKTMPNLQ----PISALPTKTQKGIHSGT
780 790 800 810 820
1160 1170 1180 1190 1200 1210
pF1KE3 RRLSPPTLLPNSPSHLSELTSLKEATPSPISESHSDETIPSDSGIGTDNNSTSDRAEKFC
.:::: :. :::::: :. :::: : ::.:::::.::::::::::::::::::.:::
CCDS11 WKLSPPRLMANSPSHLCEIGSLKEITLSPVSESHSEETIPSDSGIGTDNNSTSDQAEK-S
830 840 850 860 870 880
1220 1230 1240 1250 1260 1270
pF1KE3 GQKKRRHSFEHVSLIPPETSTVLSSLKEKHKHKCKRRNHD-YLSYDKMKRQKRKRKKKYP
....::.::. :: ::. .: :..: :. :. : .:.....:. :.:::.:
CCDS11 SESRRRYSFDFCSLDNPEAIPSDTSTKNRHGHRQKHLIVDNFLAHESLKKPKHKRKRK--
890 900 910 920 930 940
1280 1290 1300 1310 1320 1330
pF1KE3 QLRNRQDPDFIAELEELISRLSEIRITHRSHHFIPRDLLPTIFRINFNSFYTHPSFPLDP
.:.::.: .:.:.:::::.... .::.:::. : .. :.::::::. .: : . ::
CCDS11 SLQNRDDLQFLADLEELITKFQVFRISHRSYTFYHENPYPSIFRINFDHYYPVPYIQYDP
950 960 970 980 990 1000
1340 1350 1360 1370 1380 1390
pF1KE3 LHYIRKP-DLK--KKRGRPPKMREAMAEMPFMHSLSFPLSSTGFYPSYGMPYSPSPLTAA
: :.:. ::: :::::: : ..:...::....:.:. : ..: :::::. :.
CCDS11 LLYLRRTSDLKSKKKRGRPAKTNDTMTKVPFLQGFSYPIPSGSYYAPYGMPYTSMPM---
1010 1020 1030 1040 1050 1060
1400 1410 1420 1430 1440 1450
pF1KE3 PIGLGYYGRYPPTLYPP----PPSPSFTTPLPPPSYMHAGHLLLNPAKYHKKKHKLLRQE
..:::::.:: :: :: . .:::.. .:. .. : :: :: . :
CCDS11 -MNLGYYGQYPAPLYLSHTLGAASPFMRPTVPPPQFHTNSHVKMSGAAKHKAKHGVHLQ-
1070 1080 1090 1100 1110
1460 1470 1480 1490 1500
pF1KE3 AFLTTSRTPLLSMSTYPSV-PPEMAYGWMVEHKHRHRHKHREHRSSEQPQVSMDTGSSRS
. .. . . . :.: .. : . ..::.:.:::.: : . : .. :
CCDS11 GPVSMGLGDMQPSLNPPKVGSASLSSGRLHKRKHKHKHKHKEDRI-------LGTHDNLS
1120 1130 1140 1150 1160 1170
1510 1520 1530 1540 1550 1560
pF1KE3 VLESLKRYRFGKDAVGERYKHKEKHRCHMSCPHLSPSKSLINREEQWVHREPSESSPLAL
: . : :.. ..:: . .:. : .: ... ..:.: ... ::.. :
CCDS11 GLFAGKATGFSSHILSERLSSADKE-----LPLVSEKNK--HKEKQ--KHQHSEAGHKAS
1180 1190 1200 1210 1220
1570 1580 1590 1600 1610 1620
pF1KE3 GLQTPLQIDCSESSPSLSLGGFTPNSEPASSDEHTNLFTSAIGSC--RVSNPNSSGRKKL
.. ...: .:: ... .. ... :. .: . . :: : :. ...: .
CCDS11 --KNNFEVD------TLSTLSLSDAQHWTQAKEKGDLSSEPVDSCTKRYSGSGGDGGSTR
1230 1240 1250 1260 1270
1630 1640 1650 1660 1670 1680
pF1KE3 TDSPGLFSAQDTSLNRLHRKESLPSNERAVQTLAGSQPTSDKP--SQRPSESTNCSPTRK
... .:: .. :::.. . ..::. : . . : .. . .::
CCDS11 SENLDVFSEMN------------PSNDKWDSDVSGSKRRSYEGFGTYREKDIQAFKMNRK
1280 1290 1300 1310 1320
1690 1700 1710 1720 1730 1740
pF1KE3 RSSSESTSSTVNGVPSRSPRLVASGDDSVDSLLQRMVQNEDQEP--MEKSIDAVIATASA
. :: . :: :.:: :.: .. . .: : .:: . : : .. :.. ...
CCDS11 ERSSYD-SSMSPGMPS--PHLKVD-QTAVHS------KNEGSVPTMMTRKKPAAVDSVTI
1330 1340 1350 1360 1370
1750 1760 1770 1780 1790 1800
pF1KE3 PPSSSPGRSHSKDRTLGKPDSLLVPAVTSDSCNNSISLLSEKLTSSCSPHHIKRSVVEAM
::. : : : . :.:::. ..:.. ...:: .::.
CCDS11 PPA--PVLS-----------LLAASAATSDAVGSSLK------------KRFKRREIEAI
1380 1390 1400
1810 1820 1830 1840 1850
pF1KE3 QRQARKMCNYDKILATKKNLDHVNKILKAKKLQRQARTGNNFVKRRPGRPRKCPLQ----
: ..:::::: :::.:::::::::::::::.::::..:::::::.: ::::: : :
CCDS11 QCEVRKMCNYTKILSTKKNLDHVNKILKAKRLQRQSKTGNNFVKKRRGRPRKQPTQFDED
1410 1420 1430 1440 1450 1460
1860 1870 1880 1890 1900 1910
pF1KE3 AVVSMQAFQAAQFVNPELNRDEEGAALHLSPDTVTDVIEAVVQSVNLNPEHKKGLKRKGW
. .: ... . . .. . : : : . :.: :....: : . :..
CCDS11 SRDQMPVLEKCIDLPSKRGQKPSLSPLVLEPAASQDTIMATIEAVI----H---MAREAP
1470 1480 1490 1500 1510 1520
1920 1930 1940 1950 1960 1970
pF1KE3 LLEEQTRKKQKPLPEEEEQENNKSFNEAPVEIPSPSETPAKPSEPESTLQPVLSLIPREK
: ::: : .: : : : . .: : ..
CCDS11 PLPPPP---PPPLPPPP-----------PPPLPPPPPLPKTPRGGKRKHKPQAPAQPPQQ
1530 1540 1550 1560
1980 1990 2000 2010 2020 2030
pF1KE3 KPPRPPKKKYQKAGLYSDVYKTTDPKSRLIQLKKEKLEYTPGEHEYGLFPAPIHVGKYLR
.::. :
CCDS11 SPPQQPLPQEEEVKAKRQRKSRGSESEVLP
1570 1580 1590
>>CCDS4413.1 NSD1 gene_id:64324|Hs108|chr5 (2427 aa)
initn: 388 init1: 347 opt: 672 Z-score: 437.0 bits: 95.2 E(32554): 5.1e-18
Smith-Waterman score: 698; 41.5% identity (68.8% similar) in 272 aa overlap (2062-2327:1596-1847)
2040 2050 2060 2070 2080
pF1KE3 IHVGKYLRQKRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSN-----VYVDVKPLSGY
::: : ::.:. : : . . ::
CCDS44 KKALQEAAARFEELKAQKELRQLQEDRKNDKKP--PPYKHIKVNRPIGRVQIFTADLS--
1570 1580 1590 1600 1610 1620
2090 2100 2110 2120 2130 2140
pF1KE3 EATTCNCKKPDDDTRKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFR
: :::: :.. : ..:.:::.. :: :..:: : .: :: ...... . .: ::
CCDS44 EIPRCNCKATDENP-CGIDSECINRMLLYECHPTVCPAGGRCQNQCFSKRQYPE-VEIFR
1630 1640 1650 1660 1670
2150 2160 2170 2180 2190 2200
pF1KE3 AEEKGWGIRTKEPLKAGQFIIEYLGEVVSEQEFRNRM-IEQYHNHSDHYCLNLDSGMVID
. ..:::.::: .: :.:. ::.::...:.: : :. : :. .. : :.::. .::
CCDS44 TLQRGWGLRTKTDIKKGEFVNEYVGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIID
1680 1690 1700 1710 1720 1730
2210 2220 2230 2240 2250 2260
pF1KE3 SYRMGNEARFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQ
. :: :::.:: :.:::: ::::::: :.::.::.:. ::::::..::.. .. :
CCDS44 AGPKGNYARFMNHCCQPNCETQKWSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKT
1740 1750 1760 1770 1780 1790
2270 2280 2290 2300 2310 2320
pF1KE3 QLCKCGFEKCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLS
.:::: .: :..: . :: ::.::..:: . :.:...: .. .:...
CCDS44 -VCKCGAPNCSGFLGVRP---------KN-QPIATEEKSKKFKKKQQGK---RRTQGEIT
1800 1810 1820 1830 1840
2330 2340 2350 2360 2370 2380
pF1KE3 EEPSENINTPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHS
.:
CCDS44 KEREDECFSCGDAGQLVSCKKPGCPKVYHADCLNLTKRPAGKWECPWHQCDICGKEAASF
1850 1860 1870 1880 1890 1900
>>CCDS4412.1 NSD1 gene_id:64324|Hs108|chr5 (2696 aa)
initn: 388 init1: 347 opt: 672 Z-score: 436.3 bits: 95.2 E(32554): 5.5e-18
Smith-Waterman score: 698; 41.5% identity (68.8% similar) in 272 aa overlap (2062-2327:1865-2116)
2040 2050 2060 2070 2080
pF1KE3 IHVGKYLRQKRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSN-----VYVDVKPLSGY
::: : ::.:. : : . . ::
CCDS44 KKALQEAAARFEELKAQKELRQLQEDRKNDKKP--PPYKHIKVNRPIGRVQIFTADLS--
1840 1850 1860 1870 1880 1890
2090 2100 2110 2120 2130 2140
pF1KE3 EATTCNCKKPDDDTRKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFR
: :::: :.. : ..:.:::.. :: :..:: : .: :: ...... . .: ::
CCDS44 EIPRCNCKATDENP-CGIDSECINRMLLYECHPTVCPAGGRCQNQCFSKRQYPE-VEIFR
1900 1910 1920 1930 1940
2150 2160 2170 2180 2190 2200
pF1KE3 AEEKGWGIRTKEPLKAGQFIIEYLGEVVSEQEFRNRM-IEQYHNHSDHYCLNLDSGMVID
. ..:::.::: .: :.:. ::.::...:.: : :. : :. .. : :.::. .::
CCDS44 TLQRGWGLRTKTDIKKGEFVNEYVGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIID
1950 1960 1970 1980 1990 2000
2210 2220 2230 2240 2250 2260
pF1KE3 SYRMGNEARFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQ
. :: :::.:: :.:::: ::::::: :.::.::.:. ::::::..::.. .. :
CCDS44 AGPKGNYARFMNHCCQPNCETQKWSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKT
2010 2020 2030 2040 2050 2060
2270 2280 2290 2300 2310 2320
pF1KE3 QLCKCGFEKCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLS
.:::: .: :..: . :: ::.::..:: . :.:...: .. .:...
CCDS44 -VCKCGAPNCSGFLGVRP---------KN-QPIATEEKSKKFKKKQQGK---RRTQGEIT
2070 2080 2090 2100 2110
2330 2340 2350 2360 2370 2380
pF1KE3 EEPSENINTPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHS
.:
CCDS44 KEREDECFSCGDAGQLVSCKKPGCPKVYHADCLNLTKRPAGKWECPWHQCDICGKEAASF
2120 2130 2140 2150 2160 2170
>>CCDS43729.1 WHSC1L1 gene_id:54904|Hs108|chr8 (1437 aa)
initn: 500 init1: 332 opt: 658 Z-score: 431.4 bits: 93.4 E(32554): 1e-17
Smith-Waterman score: 658; 38.3% identity (69.0% similar) in 261 aa overlap (2062-2316:1068-1321)
2040 2050 2060 2070 2080
pF1KE3 IHVGKYLRQKRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSN-----VYVDVKPLSGY
.:: : ::.:..: : ..: ::
CCDS43 KKALEEAAKRFQELKAQRESKEALEIEKNSRKP--PPYKHIKANKVIGKVQIQVADLS--
1040 1050 1060 1070 1080 1090
2090 2100 2110 2120 2130 2140
pF1KE3 EATTCNCKKPDDDTRKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFR
: :::: : :.. : ..:::::. :: :..:: :..: :: . .. . . : ..
CCDS43 EIPRCNCK-PADENPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDA-EIIK
1100 1110 1120 1130 1140 1150
2150 2160 2170 2180 2190 2200
pF1KE3 AEEKGWGIRTKEPLKAGQFIIEYLGEVVSEQEFRNRMIEQYHNH-SDHYCLNLDSGMVID
.:..:::.:::. .: :.:. ::.::...:.: : :. . ..: .. : :.. . .::
CCDS43 TERRGWGLRTKRSIKKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIID
1160 1170 1180 1190 1200 1210
2210 2220 2230 2240 2250 2260
pF1KE3 SYRMGNEARFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQ
. :: .::.::::.:::: :::.::: :.::.:: :.::: :::..::. .. .
CCDS43 AGPKGNYSRFMNHSCNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRT
1220 1230 1240 1250 1260 1270
2270 2280 2290 2300 2310 2320
pF1KE3 QLCKCGFEKCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLS
. :.:: ..: :..: . . . . :. .... ..: . : . :. :.
CCDS43 E-CHCGADNCSGFLGVRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDG
1280 1290 1300 1310 1320 1330
2330 2340 2350 2360 2370 2380
pF1KE3 EEPSENINTPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHS
CCDS43 GELVMCDKKDCPKAYHLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEFCPHSFCKDHE
1340 1350 1360 1370 1380 1390
>>CCDS33940.1 WHSC1 gene_id:7468|Hs108|chr4 (1365 aa)
initn: 407 init1: 358 opt: 648 Z-score: 425.3 bits: 92.2 E(32554): 2.3e-17
Smith-Waterman score: 648; 38.6% identity (69.1% similar) in 259 aa overlap (2062-2316:986-1237)
2040 2050 2060 2070 2080
pF1KE3 IHVGKYLRQKRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSNV-YVDVKPLSG--YEA
.:: : ::.:. : : :. .. :
CCDS33 RVFKNALQEAEARFREIKLQREARETQESERKP--PPYKHIKVNKPYGKVQIYTADISEI
960 970 980 990 1000 1010
2090 2100 2110 2120 2130 2140
pF1KE3 TTCNCKKPDDDTRKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFRAE
:::: : :.. : ..:::::.. :: :..:: :: : :: . .... . . ....
CCDS33 PKCNCK-PTDENPCGFDSECLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPET-KIIKTD
1020 1030 1040 1050 1060 1070
2150 2160 2170 2180 2190 2200
pF1KE3 EKGWGIRTKEPLKAGQFIIEYLGEVVSEQEFRNRMIEQYHNHSDH-YCLNLDSGMVIDSY
::::. .:. .. :.:. ::.::...:.: :. . ..: : : :..:. .::.
CCDS33 GKGWGLVAKRDIRKGEFVNEYVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAG
1080 1090 1100 1110 1120 1130
2210 2220 2230 2240 2250 2260
pF1KE3 RMGNEARFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQQL
:: .::.::::.:::: ::.::: :.::.:. :.:::::::..::. .. :: .
CCDS33 PKGNYSRFMNHSCQPNCETLKWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKT-V
1140 1150 1160 1170 1180 1190
2270 2280 2290 2300 2310 2320
pF1KE3 CKCGFEKCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLSEE
:.:: .: :..: . . . :.: .... :.::. : . : ..:..
CCDS33 CRCGASNCSGFLGDRPKTSTTLSSEEKGK--KTKKKTRRRRAKGEGKRQSEDECFRCGDG
1200 1210 1220 1230 1240
2330 2340 2350 2360 2370 2380
pF1KE3 PSENINTPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHSAS
CCDS33 GQLVLCDRKFCTKAYHLSCLGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQ
1250 1260 1270 1280 1290 1300
>>CCDS2749.2 SETD2 gene_id:29072|Hs108|chr3 (2564 aa)
initn: 463 init1: 281 opt: 649 Z-score: 421.8 bits: 92.5 E(32554): 3.6e-17
Smith-Waterman score: 657; 26.8% identity (51.9% similar) in 786 aa overlap (1570-2309:1014-1718)
1540 1550 1560 1570 1580 1590
pF1KE3 CPHLSPSKSLINREEQWVHREPSESSPLALGLQTPLQIDCSESSPSL------SLGGFTP
:. :. : : .: . . .: .
CCDS27 RGEGGHVHTSDDSEVVFSSCDLNLTMEDSDGVTYALKCDSSGHAPEIVSTVHEDYSGSSE
990 1000 1010 1020 1030 1040
1600 1610 1620 1630 1640
pF1KE3 NSEPASSDEHTNLFTSAIGSCRVSN----PNSSGRKKLTDSP-GLFSAQDTSLNRLH-RK
.:. :..: :. :.: :... :..: :: . :.:. : .
CCDS27 SSNDESDSEDTDSDDSSIPRNRLQSVVVVPKNSTLPMEETSPCSSRSSQSYRHYSDHWED
1050 1060 1070 1080 1090 1100
1650 1660 1670 1680 1690 1700
pF1KE3 ESLPSN----ERAVQTLAGSQ-PTSDKPSQRPSESTNCSPTRKRSSSESTSSTVNGVPSR
: : : :. ...:.. : .:: . . :.: :.:. . . .:
CCDS27 ERLESRRHLYEEKFESIASKACPQTDKFFLHKG-------TEKNPEISFTQSSRKQIDNR
1110 1120 1130 1140 1150
1710 1720 1730 1740 1750
pF1KE3 SPRLVASGDDSVDSLLQRMVQNEDQ-EPM-EKSIDAVIATASA---PPSSS-----PGRS
:.: .:.::: . :... .: :... : : . . : :: :..:
CCDS27 LPELSHPQSDGVDSTSHTDVKSDPLGHPNSEETVKAKIPSRQQEELPIYSSDFEDVPNKS
1160 1170 1180 1190 1200 1210
1760 1770 1780 1790 1800 1810
pF1KE3 HSKDRTLGKPDSLLVPAVTSDSCNNSISLLSEKLTSSCSPHHIKRSVVEAMQRQARKMCN
.. ..::: : . . :: ..::: :. :. .
CCDS27 WQQTTFQNRPDSRL-----------GKTELS--FSSSCEIPHVDGLHSSEELRNLGWDFS
1220 1230 1240 1250 1260
1820 1830 1840 1850 1860
pF1KE3 YDKILATKKNLDHVNKILKAKKLQRQART---------GNNFVKRRPGRPRKCPLQAVVS
.: .: .. : ..: :..:. ::.. : ::: : .::
CCDS27 QEKPSTTYQQPDSSYGACGGHKYQQNAEQYGGTRDYWQGNGYWDPRSGRP---PGTGVV-
1270 1280 1290 1300 1310
1870 1880 1890 1900 1910 1920
pF1KE3 MQAFQAAQFVNPELNRDEEGAALHLSPDTVTDVIEAVVQSVNLNPEHKKGLKRKGWLLEE
.. .: : . ::..:: : :... .. : . .
CCDS27 ---YDRTQ-----------GQV----PDSLTDDRE----------EEENWDQQDGSHFSD
1320 1330 1340 1350
1930 1940 1950 1960 1970 1980
pF1KE3 QTRKKQKPLPEEEEQENNKSFNEAPVEIPSPSETPAKPSEPESTLQPVLSLIPREKKPPR
:. : : ...:. .:: :: : : : . . . . . .. :
CCDS27 QSDKFLLSL------QKDKGSVQAP-EISSNS---IKDTLAVNEKKDFSKNLEKNDIKDR
1360 1370 1380 1390 1400
1990 2000 2010 2020 2030 2040
pF1KE3 PPKKKYQKAGLYSDVYKTTDPKSRLIQLKKEKLEYTPGEHEYGLFPAPIHVGKYLRQKRI
: :: .. .. . .. ..: . :: ..: :: .. :. :: .
CCDS27 GPLKKRRQ-----EIESDSESDGELQDRKKVRVEVEQGET--SVPPGSALVGPSCVMD--
1410 1420 1430 1440 1450
2050 2060 2070 2080 2090
pF1KE3 DFQLPYDILWQWKHNQLYKKPDVPLY-KKIRSNVYVDV----KPLSGYEATTCNCKKPDD
::. : .:: . :. .: : :. :::. : . :.: .
CCDS27 DFRDPQ----RWK--ECAKQGKMPCYFDLIEENVYLTERKKNKSHRDIKRMQCECTPLSK
1460 1470 1480 1490 1500
2100 2110 2120 2130 2140 2150
pF1KE3 DTR-KG---CVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFRAEEKGWGI
: : .: : .:::::... ::: . :: :. : :.:.::.. .. .: . .:.::::.
CCDS27 DERAQGEIACGEDCLNRLLMIECS-SRCPNGDYCSNRRFQRKQHAD-VEVILTEKKGWGL
1510 1520 1530 1540 1550 1560
2160 2170 2180 2190 2200 2210
pF1KE3 RTKEPLKAGQFIIEYLGEVVSEQEFRNRMIEQYHNHSDHY-CLNLDSGMVIDSYRMGNEA
:. . : .. :..:: :::....::. :. : .:.. :: . : . .::. . :: .
CCDS27 RAAKDLPSNTFVLEYCGEVLDHKEFKARVKEYARNKNIHYYFMALKNDEIIDATQKGNCS
1570 1580 1590 1600 1610 1620
2220 2230 2240 2250 2260 2270
pF1KE3 RFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQQLCKCGFE
::.::::.:::: :::.::: :.:... : .:.:.:::.::.:. .. : :. : ::
CCDS27 RFMNHSCEPNCETQKWTVNGQLRVGFFTTKLVPSGSELTFDYQFQRYGKEAQK-CFCGSA
1630 1640 1650 1660 1670 1680
2280 2290 2300 2310 2320 2330
pF1KE3 KCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLSEEPSENIN
.::: .::.. ::. ... . . ..::.. . :
CCDS27 NCRGYLGGEN-RVSIRAAGGKMKKERSRKKDSVDGELEALMENGEGLSDKNQVLSLSRLM
1690 1700 1710 1720 1730 1740
2340 2350 2360 2370 2380 2390
pF1KE3 TPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHSASLYTRWN
CCDS27 VRIETLEQKLTCLELIQNTHSQSCLKSFLERHGLSLLWIWMAELGDGRESNQKLQEEIIK
1750 1760 1770 1780 1790 1800
2964 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 06:57:11 2016 done: Sun Nov 6 06:57:12 2016
Total Scan time: 7.400 Total Display time: 0.840
Function used was FASTA [36.3.4 Apr, 2011]