Result of FASTA (ccds) for pFN21AE3830
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KE3830, 2964 aa
  1>>>pF1KE3830 2964 - 2964 aa - 2964 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 10.0272+/-0.00117; mu= 6.0203+/- 0.071
 mean_var=240.6428+/-48.332, 0's: 0 Z-trim(110.3): 58  B-trim: 6 in 1/51
 Lambda= 0.082678
 statistics sampled from 11486 (11540) to 11486 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.669), E-opt: 0.2 (0.354), width:  16
 Scan time:  7.400

The best scores are:                                      opt bits E(32554)
CCDS1113.2 ASH1L gene_id:55870|Hs108|chr1          (2964) 19783 2374.8       0
CCDS11923.2 SETBP1 gene_id:26040|Hs108|chr18       (1596) 1216 160.0   1e-37
CCDS4413.1 NSD1 gene_id:64324|Hs108|chr5           (2427)  672 95.2 5.1e-18
CCDS4412.1 NSD1 gene_id:64324|Hs108|chr5           (2696)  672 95.2 5.5e-18
CCDS43729.1 WHSC1L1 gene_id:54904|Hs108|chr8       (1437)  658 93.4   1e-17
CCDS33940.1 WHSC1 gene_id:7468|Hs108|chr4          (1365)  648 92.2 2.3e-17
CCDS2749.2 SETD2 gene_id:29072|Hs108|chr3          (2564)  649 92.5 3.6e-17


>>CCDS1113.2 ASH1L gene_id:55870|Hs108|chr1               (2964 aa)
 initn: 19783 init1: 19783 opt: 19783  Z-score: 12755.3  bits: 2374.8 E(32554):    0
Smith-Waterman score: 19783; 100.0% identity (100.0% similar) in 2964 aa overlap (1-2964:1-2964)

               10        20        30        40        50        60
pF1KE3 MDPRNTAMLGLGSDSEGFSRKSPSAISTGTLVSKREVELEKNTKEEEDLRKRNRERNIEA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MDPRNTAMLGLGSDSEGFSRKSPSAISTGTLVSKREVELEKNTKEEEDLRKRNRERNIEA
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KE3 GKDDGLTDAQQQFSVKETNFSEGNLKLKIGLQAKRTKKPPKNLENYVCRPAIKTTIKHPR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GKDDGLTDAQQQFSVKETNFSEGNLKLKIGLQAKRTKKPPKNLENYVCRPAIKTTIKHPR
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KE3 KALKSGKMTDEKNEHCPSKRDPSKLYKKADDVAAIECQSEEVIRLHSQGENNPLSKKLSP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KALKSGKMTDEKNEHCPSKRDPSKLYKKADDVAAIECQSEEVIRLHSQGENNPLSKKLSP
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KE3 VHSEMADYINATPSTLLGSRDPDLKDRALLNGGTSVTEKLAQLIATCPPSKSSKTKPKKL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VHSEMADYINATPSTLLGSRDPDLKDRALLNGGTSVTEKLAQLIATCPPSKSSKTKPKKL
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KE3 GTGTTAGLVSKDLIRKAGVGSVAGIIHKDLIKKPTISTAVGLVTKDPGKKPVFNAAVGLV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GTGTTAGLVSKDLIRKAGVGSVAGIIHKDLIKKPTISTAVGLVTKDPGKKPVFNAAVGLV
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KE3 NKDSVKKLGTGTTAVFINKNLGKKPGTITTVGLLSKDSGKKLGIGIVPGLVHKESGKKLG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 NKDSVKKLGTGTTAVFINKNLGKKPGTITTVGLLSKDSGKKLGIGIVPGLVHKESGKKLG
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KE3 LGTVVGLVNKDLGKKLGSTVGLVAKDCAKKIVASSAMGLVNKDIGKKLMSCPLAGLISKD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LGTVVGLVNKDLGKKLGSTVGLVAKDCAKKIVASSAMGLVNKDIGKKLMSCPLAGLISKD
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KE3 AINLKAEALLPTQEPLKASCSTNINNQESQELSESLKDSATSKTFEKNVVRQNKESILEK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AINLKAEALLPTQEPLKASCSTNINNQESQELSESLKDSATSKTFEKNVVRQNKESILEK
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KE3 FSVRKEIINLEKEMFNEGTCIQQDSFSSSEKGSYETSKHEKQPPVYCTSPDFKMGGASDV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 FSVRKEIINLEKEMFNEGTCIQQDSFSSSEKGSYETSKHEKQPPVYCTSPDFKMGGASDV
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KE3 STAKSPFSAVGESNLPSPSPTVSVNPLTRSPPETSSQLAPNPLLLSSTTELIEEISESVG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 STAKSPFSAVGESNLPSPSPTVSVNPLTRSPPETSSQLAPNPLLLSSTTELIEEISESVG
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KE3 KNQFTSESTHLNVGHRSVGHSISIECKGIDKEVNDSKTTHIDIPRISSSLGKKPSLTSES
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KNQFTSESTHLNVGHRSVGHSISIECKGIDKEVNDSKTTHIDIPRISSSLGKKPSLTSES
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KE3 SIHTITPSVVNFTSLFSNKPFLKLGAVSASDKHCQVAESLSTSLQSKPLKKRKGRKPRWT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SIHTITPSVVNFTSLFSNKPFLKLGAVSASDKHCQVAESLSTSLQSKPLKKRKGRKPRWT
              670       680       690       700       710       720

              730       740       750       760       770       780
pF1KE3 KVVARSTCRSPKGLELERSELFKNVSCSSLSNSNSEPAKFMKNIGPPSFVDHDFLKRRLP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KVVARSTCRSPKGLELERSELFKNVSCSSLSNSNSEPAKFMKNIGPPSFVDHDFLKRRLP
              730       740       750       760       770       780

              790       800       810       820       830       840
pF1KE3 KLSKSTAPSLALLADSEKPSHKSFATHKLSSSMCVSSDLLSDIYKPKRGRPKSKEMPQLE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KLSKSTAPSLALLADSEKPSHKSFATHKLSSSMCVSSDLLSDIYKPKRGRPKSKEMPQLE
              790       800       810       820       830       840

              850       860       870       880       890       900
pF1KE3 GPPKRTLKIPASKVFSLQSKEEQEPPILQPEIEIPSFKQGLSVSPFPKKRGRPKRQMRSP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GPPKRTLKIPASKVFSLQSKEEQEPPILQPEIEIPSFKQGLSVSPFPKKRGRPKRQMRSP
              850       860       870       880       890       900

              910       920       930       940       950       960
pF1KE3 VKMKPPVLSVAPFVATESPSKLESESDNHRSSSDFFESEDQLQDPDDLDDSHRPSVCSMS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VKMKPPVLSVAPFVATESPSKLESESDNHRSSSDFFESEDQLQDPDDLDDSHRPSVCSMS
              910       920       930       940       950       960

              970       980       990      1000      1010      1020
pF1KE3 DLEMEPDKKITKRNNGQLMKTIIRKINKMKTLKRKKLLNQILSSSVESSNKGKVQSKLHN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 DLEMEPDKKITKRNNGQLMKTIIRKINKMKTLKRKKLLNQILSSSVESSNKGKVQSKLHN
              970       980       990      1000      1010      1020

             1030      1040      1050      1060      1070      1080
pF1KE3 TVSSLAATFGSKLGQQINVSKKGTIYIGKRRGRKPKTVLNGILSGSPTSLAVLEQTAQQA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 TVSSLAATFGSKLGQQINVSKKGTIYIGKRRGRKPKTVLNGILSGSPTSLAVLEQTAQQA
             1030      1040      1050      1060      1070      1080

             1090      1100      1110      1120      1130      1140
pF1KE3 AGSALGQILPPLLPSSASSSEILPSPICSQSSGTSGGQSPVSSDAGFVEPSSVPYLHLHS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AGSALGQILPPLLPSSASSSEILPSPICSQSSGTSGGQSPVSSDAGFVEPSSVPYLHLHS
             1090      1100      1110      1120      1130      1140

             1150      1160      1170      1180      1190      1200
pF1KE3 RQGSMIQTLAMKKASKGRRRLSPPTLLPNSPSHLSELTSLKEATPSPISESHSDETIPSD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RQGSMIQTLAMKKASKGRRRLSPPTLLPNSPSHLSELTSLKEATPSPISESHSDETIPSD
             1150      1160      1170      1180      1190      1200

             1210      1220      1230      1240      1250      1260
pF1KE3 SGIGTDNNSTSDRAEKFCGQKKRRHSFEHVSLIPPETSTVLSSLKEKHKHKCKRRNHDYL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SGIGTDNNSTSDRAEKFCGQKKRRHSFEHVSLIPPETSTVLSSLKEKHKHKCKRRNHDYL
             1210      1220      1230      1240      1250      1260

             1270      1280      1290      1300      1310      1320
pF1KE3 SYDKMKRQKRKRKKKYPQLRNRQDPDFIAELEELISRLSEIRITHRSHHFIPRDLLPTIF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SYDKMKRQKRKRKKKYPQLRNRQDPDFIAELEELISRLSEIRITHRSHHFIPRDLLPTIF
             1270      1280      1290      1300      1310      1320

             1330      1340      1350      1360      1370      1380
pF1KE3 RINFNSFYTHPSFPLDPLHYIRKPDLKKKRGRPPKMREAMAEMPFMHSLSFPLSSTGFYP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RINFNSFYTHPSFPLDPLHYIRKPDLKKKRGRPPKMREAMAEMPFMHSLSFPLSSTGFYP
             1330      1340      1350      1360      1370      1380

             1390      1400      1410      1420      1430      1440
pF1KE3 SYGMPYSPSPLTAAPIGLGYYGRYPPTLYPPPPSPSFTTPLPPPSYMHAGHLLLNPAKYH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SYGMPYSPSPLTAAPIGLGYYGRYPPTLYPPPPSPSFTTPLPPPSYMHAGHLLLNPAKYH
             1390      1400      1410      1420      1430      1440

             1450      1460      1470      1480      1490      1500
pF1KE3 KKKHKLLRQEAFLTTSRTPLLSMSTYPSVPPEMAYGWMVEHKHRHRHKHREHRSSEQPQV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KKKHKLLRQEAFLTTSRTPLLSMSTYPSVPPEMAYGWMVEHKHRHRHKHREHRSSEQPQV
             1450      1460      1470      1480      1490      1500

             1510      1520      1530      1540      1550      1560
pF1KE3 SMDTGSSRSVLESLKRYRFGKDAVGERYKHKEKHRCHMSCPHLSPSKSLINREEQWVHRE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SMDTGSSRSVLESLKRYRFGKDAVGERYKHKEKHRCHMSCPHLSPSKSLINREEQWVHRE
             1510      1520      1530      1540      1550      1560

             1570      1580      1590      1600      1610      1620
pF1KE3 PSESSPLALGLQTPLQIDCSESSPSLSLGGFTPNSEPASSDEHTNLFTSAIGSCRVSNPN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PSESSPLALGLQTPLQIDCSESSPSLSLGGFTPNSEPASSDEHTNLFTSAIGSCRVSNPN
             1570      1580      1590      1600      1610      1620

             1630      1640      1650      1660      1670      1680
pF1KE3 SSGRKKLTDSPGLFSAQDTSLNRLHRKESLPSNERAVQTLAGSQPTSDKPSQRPSESTNC
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SSGRKKLTDSPGLFSAQDTSLNRLHRKESLPSNERAVQTLAGSQPTSDKPSQRPSESTNC
             1630      1640      1650      1660      1670      1680

             1690      1700      1710      1720      1730      1740
pF1KE3 SPTRKRSSSESTSSTVNGVPSRSPRLVASGDDSVDSLLQRMVQNEDQEPMEKSIDAVIAT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SPTRKRSSSESTSSTVNGVPSRSPRLVASGDDSVDSLLQRMVQNEDQEPMEKSIDAVIAT
             1690      1700      1710      1720      1730      1740

             1750      1760      1770      1780      1790      1800
pF1KE3 ASAPPSSSPGRSHSKDRTLGKPDSLLVPAVTSDSCNNSISLLSEKLTSSCSPHHIKRSVV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 ASAPPSSSPGRSHSKDRTLGKPDSLLVPAVTSDSCNNSISLLSEKLTSSCSPHHIKRSVV
             1750      1760      1770      1780      1790      1800

             1810      1820      1830      1840      1850      1860
pF1KE3 EAMQRQARKMCNYDKILATKKNLDHVNKILKAKKLQRQARTGNNFVKRRPGRPRKCPLQA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 EAMQRQARKMCNYDKILATKKNLDHVNKILKAKKLQRQARTGNNFVKRRPGRPRKCPLQA
             1810      1820      1830      1840      1850      1860

             1870      1880      1890      1900      1910      1920
pF1KE3 VVSMQAFQAAQFVNPELNRDEEGAALHLSPDTVTDVIEAVVQSVNLNPEHKKGLKRKGWL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VVSMQAFQAAQFVNPELNRDEEGAALHLSPDTVTDVIEAVVQSVNLNPEHKKGLKRKGWL
             1870      1880      1890      1900      1910      1920

             1930      1940      1950      1960      1970      1980
pF1KE3 LEEQTRKKQKPLPEEEEQENNKSFNEAPVEIPSPSETPAKPSEPESTLQPVLSLIPREKK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LEEQTRKKQKPLPEEEEQENNKSFNEAPVEIPSPSETPAKPSEPESTLQPVLSLIPREKK
             1930      1940      1950      1960      1970      1980

             1990      2000      2010      2020      2030      2040
pF1KE3 PPRPPKKKYQKAGLYSDVYKTTDPKSRLIQLKKEKLEYTPGEHEYGLFPAPIHVGKYLRQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PPRPPKKKYQKAGLYSDVYKTTDPKSRLIQLKKEKLEYTPGEHEYGLFPAPIHVGKYLRQ
             1990      2000      2010      2020      2030      2040

             2050      2060      2070      2080      2090      2100
pF1KE3 KRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSNVYVDVKPLSGYEATTCNCKKPDDDT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSNVYVDVKPLSGYEATTCNCKKPDDDT
             2050      2060      2070      2080      2090      2100

             2110      2120      2130      2140      2150      2160
pF1KE3 RKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFRAEEKGWGIRTKEPL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFRAEEKGWGIRTKEPL
             2110      2120      2130      2140      2150      2160

             2170      2180      2190      2200      2210      2220
pF1KE3 KAGQFIIEYLGEVVSEQEFRNRMIEQYHNHSDHYCLNLDSGMVIDSYRMGNEARFINHSC
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KAGQFIIEYLGEVVSEQEFRNRMIEQYHNHSDHYCLNLDSGMVIDSYRMGNEARFINHSC
             2170      2180      2190      2200      2210      2220

             2230      2240      2250      2260      2270      2280
pF1KE3 DPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQQLCKCGFEKCRGIIG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 DPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQQLCKCGFEKCRGIIG
             2230      2240      2250      2260      2270      2280

             2290      2300      2310      2320      2330      2340
pF1KE3 GKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLSEEPSENINTPTRLTP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLSEEPSENINTPTRLTP
             2290      2300      2310      2320      2330      2340

             2350      2360      2370      2380      2390      2400
pF1KE3 QLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHSASLYTRWNGICRDDG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 QLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHSASLYTRWNGICRDDG
             2350      2360      2370      2380      2390      2400

             2410      2420      2430      2440      2450      2460
pF1KE3 NIKSDVFMTQFSALQTARSVRTRRLAAAEENIEVARAARLAQIFKEICDGIISYKDSSRQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 NIKSDVFMTQFSALQTARSVRTRRLAAAEENIEVARAARLAQIFKEICDGIISYKDSSRQ
             2410      2420      2430      2440      2450      2460

             2470      2480      2490      2500      2510      2520
pF1KE3 ALAAPLLNLPPKKKNADYYEKISDPLDLITIEKQILTGYYKTVEAFDADMLKVFRNAEKY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 ALAAPLLNLPPKKKNADYYEKISDPLDLITIEKQILTGYYKTVEAFDADMLKVFRNAEKY
             2470      2480      2490      2500      2510      2520

             2530      2540      2550      2560      2570      2580
pF1KE3 YGRKSPVGRDVCRLRKAYYNARHEASAQIDEIVGETASEADSSETSVSEKENGHEKDDDV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 YGRKSPVGRDVCRLRKAYYNARHEASAQIDEIVGETASEADSSETSVSEKENGHEKDDDV
             2530      2540      2550      2560      2570      2580

             2590      2600      2610      2620      2630      2640
pF1KE3 IRCICGLYKDEGLMIQCDKCMVWQHCDCMGVNSDVEHYLCEQCDPRPVDREVPMIPRPHY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 IRCICGLYKDEGLMIQCDKCMVWQHCDCMGVNSDVEHYLCEQCDPRPVDREVPMIPRPHY
             2590      2600      2610      2620      2630      2640

             2650      2660      2670      2680      2690      2700
pF1KE3 AQPGCVYFICLLRDDLLLRQGDCVYLMRDSRRTPDGHPVRQSYRLLSHINRDKLDIFRIE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AQPGCVYFICLLRDDLLLRQGDCVYLMRDSRRTPDGHPVRQSYRLLSHINRDKLDIFRIE
             2650      2660      2670      2680      2690      2700

             2710      2720      2730      2740      2750      2760
pF1KE3 KLWKNEKEERFAFGHHYFRPHETHHSPSRRFYHNELFRVPLYEIIPLEAVVGTCCVLDLY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KLWKNEKEERFAFGHHYFRPHETHHSPSRRFYHNELFRVPLYEIIPLEAVVGTCCVLDLY
             2710      2720      2730      2740      2750      2760

             2770      2780      2790      2800      2810      2820
pF1KE3 TYCKGRPKGVKEQDVYICDYRLDKSAHLFYKIHRNRYPVCTKPYAFDHFPKKLTPKKDFS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 TYCKGRPKGVKEQDVYICDYRLDKSAHLFYKIHRNRYPVCTKPYAFDHFPKKLTPKKDFS
             2770      2780      2790      2800      2810      2820

             2830      2840      2850      2860      2870      2880
pF1KE3 PHYVPDNYKRNGGRSSWKSERSKPPLKDLGQEDDALPLIEEVLASQEQAANEIPSLEEPE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PHYVPDNYKRNGGRSSWKSERSKPPLKDLGQEDDALPLIEEVLASQEQAANEIPSLEEPE
             2830      2840      2850      2860      2870      2880

             2890      2900      2910      2920      2930      2940
pF1KE3 REGATANVSEGEKKTEESSQEPQSTCTPEERRHNQRERLNQILLNLLEKIPGKNAIDVTY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 REGATANVSEGEKKTEESSQEPQSTCTPEERRHNQRERLNQILLNLLEKIPGKNAIDVTY
             2890      2900      2910      2920      2930      2940

             2950      2960    
pF1KE3 LLEEGSGRKLRRRTLFIPENSFRK
       ::::::::::::::::::::::::
CCDS11 LLEEGSGRKLRRRTLFIPENSFRK
             2950      2960    

>>CCDS11923.2 SETBP1 gene_id:26040|Hs108|chr18            (1596 aa)
 initn: 1133 init1: 344 opt: 1216  Z-score: 790.4  bits: 160.0 E(32554): 1e-37
Smith-Waterman score: 1710; 30.7% identity (56.3% similar) in 1536 aa overlap (501-1985:231-1572)

              480       490       500       510       520       530
pF1KE3 RQNKESILEKFSVRKEIINLEKEMFNEGTCIQQDSFSSSEKGSYETSKHEKQPPVYCTSP
                                     . :. : : :.:  ::..  : : .  .. 
CCDS11 FTGDTLKPKHQQKSSSQNHMDWSTNSDSGPVTQNCFISPESGR-ETASTSKIPALEPVAS
              210       220       230       240        250         

              540       550             560       570       580    
pF1KE3 DFKMGGASDVSTAKSPFSAVGESNLP------SPSPTVSVNPLTRSPPETSSQLAPNPLL
         :  : .  ..: . .: ....:        .:::.   .:   .:: .:..      :
CCDS11 FAKAQGKK--GSAGNTWSQLSNNNKDLLLGGVAPSPSSHSSP---APPSSSAECNGLQPL
     260         270       280       290          300       310    

          590         600       610       620       630       640  
pF1KE3 LSSTTELIEEISE--SVGKNQFTSESTHLNVGHRSVGHSISIECKGIDKEVNDSKTTHID
       ...     .:  :  .::... .:..  .         : .:    .:   : .:.    
CCDS11 VDQDGGGTKEPPEPPTVGSKKKSSKKDVI---------SQTIPNPDLDWVKNAQKA----
          320       330       340                350       360     

            650       660       670       680       690            
pF1KE3 IPRISSSLGKKPSLTSESSIHTITPSVVNFTSLFSNKPFLKLGAVSASDKHCQV-----A
          .... ::. . ...:. .  .:.  : .:  ...:         ...: ..     :
CCDS11 ---FDNTEGKREGYSADSA-QEASPARQNVSS--ASNP-------ENDSSHVRITIPIKA
                370        380         390              400        

       700       710       720       730       740       750       
pF1KE3 ESLSTSLQSKPLKKRKGRKPRWTKVVARSTCRSPKGLELERSELFKNVSCSSLSNSNSEP
        ::. . ...  :::.. :    :.. ...  :  :. .  ::. . .    ::::..  
CCDS11 PSLDPTNHKR--KKRQSIKAVVEKIMPEKALAS--GITMS-SEVVNRI----LSNSEG--
      410         420       430         440        450             

       760       770       780          790         800       810  
pF1KE3 AKFMKNIGPPSFVDHDFLKRRLPKLSK---STAPSLALLA--DSEKPSHKSFATHKLSSS
            :   :          :.:::::   . .::..: .  ..::    . .  . .  
CCDS11 -----NKKDP----------RVPKLSKMIENESPSVGLETGGNAEKVIPGGVSKPR-KPP
            460                 470       480       490        500 

            820       830       840       850             860      
pF1KE3 MCVSSDLLSDIYKPKRGRPKSKEMPQLEGPPKRTLKIPASK------VFSLQSKEEQEPP
       : ..    .: ..:.:  :. .. :.. .  . : . :  .      :.. ..:   :::
CCDS11 MVMTPPTCTD-HSPSRKLPEIQH-PKFAAKRRWTCSKPKPSTMLREAVMATSDKLMLEPP
             510        520        530       540       550         

           870       880        890       900       910       920  
pF1KE3 I---LQPEIEIPSFKQGLSV-SPFPKKRGRPKRQMRSPVKMKPPVLSVAPFVATESPSKL
           . :   . .  ..:.: .:  :::::::.:    :.      :..:     :: . 
CCDS11 SAYPITPSSPLYTNTDSLTVITPVKKKRGRPKKQPLLTVETIHEGTSTSPV----SPISR
     560       570       580       590       600       610         

            930       940       950       960       970       980  
pF1KE3 ESESDNHRSSSDFFESEDQLQDPDDLDDSHRPSVCSMSDLEMEPDKKITKRNNGQLMKTI
       :  . ..:.    . .  ::   .:     .:    ::  ::.  ::. :   : : :  
CCDS11 EFPGTKKRKRRRNLAKLAQLVPGED-----KP----MS--EMKFHKKVGKL--GVLDKKT
         620       630       640                  650         660  

            990      1000      1010      1020      1030      1040  
pF1KE3 IRKINKMKTLKRKKLLNQILSSSVESSNKGKVQSKLHNTVSSLAATFGSKLGQQINVSKK
       :. ::::::::::..:::::: :   . :.:.  .    .:  ::.. ::::.::::::.
CCDS11 IKTINKMKTLKRKNILNQILSCSSSVALKAKAPPE----TSPGAAAIESKLGKQINVSKR
            670       680       690           700       710        

           1050      1060      1070      1080      1090            
pF1KE3 GTIYIGKRRGRKPKTVLNGILSGSPTSLAVLEQTAQQAAGSALGQILPPLLPSS----AS
       :::::::.:::::.. :       : :     .:: .    . .:   : .::.    ..
CCDS11 GTIYIGKKRGRKPRAEL------PPPSEE--PKTAIKHPRPVSSQPDVPAVPSNFQSLVA
      720       730             740         750       760       770

     1100      1110      1120      1130      1140      1150        
pF1KE3 SSEILPSPICSQSSGTSGGQSPVSSDAGFVEPSSVPYLHLHSRQGSMIQTLAMKKASKGR
       ::     :. .: .:..:. ::.:....: : ...: :.      : . : ..:   .: 
CCDS11 SSPAAMHPLSTQLGGSNGNLSPASTETNFSELKTMPNLQ----PISALPTKTQKGIHSGT
              780       790       800           810       820      

     1160      1170      1180      1190      1200      1210        
pF1KE3 RRLSPPTLLPNSPSHLSELTSLKEATPSPISESHSDETIPSDSGIGTDNNSTSDRAEKFC
        .:::: :. :::::: :. :::: : ::.:::::.::::::::::::::::::.:::  
CCDS11 WKLSPPRLMANSPSHLCEIGSLKEITLSPVSESHSEETIPSDSGIGTDNNSTSDQAEK-S
        830       840       850       860       870       880      

     1220      1230      1240      1250       1260      1270       
pF1KE3 GQKKRRHSFEHVSLIPPETSTVLSSLKEKHKHKCKRRNHD-YLSYDKMKRQKRKRKKKYP
       ....::.::.  ::  ::.    .: :..: :. :.   : .:.....:. :.:::.:  
CCDS11 SESRRRYSFDFCSLDNPEAIPSDTSTKNRHGHRQKHLIVDNFLAHESLKKPKHKRKRK--
         890       900       910       920       930       940     

      1280      1290      1300      1310      1320      1330       
pF1KE3 QLRNRQDPDFIAELEELISRLSEIRITHRSHHFIPRDLLPTIFRINFNSFYTHPSFPLDP
       .:.::.: .:.:.:::::.... .::.:::. :  ..  :.::::::. .:  : .  ::
CCDS11 SLQNRDDLQFLADLEELITKFQVFRISHRSYTFYHENPYPSIFRINFDHYYPVPYIQYDP
           950       960       970       980       990      1000   

      1340         1350      1360      1370      1380      1390    
pF1KE3 LHYIRKP-DLK--KKRGRPPKMREAMAEMPFMHSLSFPLSSTGFYPSYGMPYSPSPLTAA
       : :.:.  :::  :::::: :  ..:...::....:.:. : ..:  :::::.  :.   
CCDS11 LLYLRRTSDLKSKKKRGRPAKTNDTMTKVPFLQGFSYPIPSGSYYAPYGMPYTSMPM---
          1010      1020      1030      1040      1050      1060   

         1400      1410          1420      1430      1440      1450
pF1KE3 PIGLGYYGRYPPTLYPP----PPSPSFTTPLPPPSYMHAGHLLLNPAKYHKKKHKLLRQE
        ..:::::.::  ::        :: .   .:::..   .:. .. :  :: :: .  : 
CCDS11 -MNLGYYGQYPAPLYLSHTLGAASPFMRPTVPPPQFHTNSHVKMSGAAKHKAKHGVHLQ-
              1070      1080      1090      1100      1110         

             1460       1470      1480      1490      1500         
pF1KE3 AFLTTSRTPLLSMSTYPSV-PPEMAYGWMVEHKHRHRHKHREHRSSEQPQVSMDTGSSRS
       . .. .   .    . :.:    .. : . ..::.:.:::.: :        . : .. :
CCDS11 GPVSMGLGDMQPSLNPPKVGSASLSSGRLHKRKHKHKHKHKEDRI-------LGTHDNLS
     1120      1130      1140      1150      1160             1170 

    1510      1520      1530      1540      1550      1560         
pF1KE3 VLESLKRYRFGKDAVGERYKHKEKHRCHMSCPHLSPSKSLINREEQWVHREPSESSPLAL
        : . :   :..  ..:: .  .:.      : .: ...  ..:.:  ... ::..  : 
CCDS11 GLFAGKATGFSSHILSERLSSADKE-----LPLVSEKNK--HKEKQ--KHQHSEAGHKAS
            1180      1190           1200        1210        1220  

    1570      1580      1590      1600      1610        1620       
pF1KE3 GLQTPLQIDCSESSPSLSLGGFTPNSEPASSDEHTNLFTSAIGSC--RVSNPNSSGRKKL
         .. ...:      .::  ...  .. ... :. .: .  . ::  : :. ...: .  
CCDS11 --KNNFEVD------TLSTLSLSDAQHWTQAKEKGDLSSEPVDSCTKRYSGSGGDGGSTR
                   1230      1240      1250      1260      1270    

      1630      1640      1650      1660      1670        1680     
pF1KE3 TDSPGLFSAQDTSLNRLHRKESLPSNERAVQTLAGSQPTSDKP--SQRPSESTNCSPTRK
       ...  .:: ..            :::..  . ..::.  : .   . : ..    . .::
CCDS11 SENLDVFSEMN------------PSNDKWDSDVSGSKRRSYEGFGTYREKDIQAFKMNRK
         1280                  1290      1300      1310      1320  

        1690      1700      1710      1720        1730      1740   
pF1KE3 RSSSESTSSTVNGVPSRSPRLVASGDDSVDSLLQRMVQNEDQEP--MEKSIDAVIATASA
       . :: . ::   :.::  :.: .. . .: :      .:: . :  : ..  :.. ... 
CCDS11 ERSSYD-SSMSPGMPS--PHLKVD-QTAVHS------KNEGSVPTMMTRKKPAAVDSVTI
            1330        1340             1350      1360      1370  

          1750      1760      1770      1780      1790      1800   
pF1KE3 PPSSSPGRSHSKDRTLGKPDSLLVPAVTSDSCNNSISLLSEKLTSSCSPHHIKRSVVEAM
       ::.  :  :            : . :.:::. ..:..            ...::  .::.
CCDS11 PPA--PVLS-----------LLAASAATSDAVGSSLK------------KRFKRREIEAI
                        1380      1390                  1400       

          1810      1820      1830      1840      1850             
pF1KE3 QRQARKMCNYDKILATKKNLDHVNKILKAKKLQRQARTGNNFVKRRPGRPRKCPLQ----
       : ..:::::: :::.:::::::::::::::.::::..:::::::.: ::::: : :    
CCDS11 QCEVRKMCNYTKILSTKKNLDHVNKILKAKRLQRQSKTGNNFVKKRRGRPRKQPTQFDED
      1410      1420      1430      1440      1450      1460       

    1860      1870      1880      1890      1900      1910         
pF1KE3 AVVSMQAFQAAQFVNPELNRDEEGAALHLSPDTVTDVIEAVVQSVNLNPEHKKGLKRKGW
       .  .: ...    .  . ..    . : : : .  :.: :....:     :   . :.. 
CCDS11 SRDQMPVLEKCIDLPSKRGQKPSLSPLVLEPAASQDTIMATIEAVI----H---MAREAP
      1470      1480      1490      1500      1510             1520

    1920      1930      1940      1950      1960      1970         
pF1KE3 LLEEQTRKKQKPLPEEEEQENNKSFNEAPVEIPSPSETPAKPSEPESTLQPVLSLIPREK
        :         :::              :  .: :   :  :   .   .:     : ..
CCDS11 PLPPPP---PPPLPPPP-----------PPPLPPPPPLPKTPRGGKRKHKPQAPAQPPQQ
                1530                 1540      1550      1560      

    1980      1990      2000      2010      2020      2030         
pF1KE3 KPPRPPKKKYQKAGLYSDVYKTTDPKSRLIQLKKEKLEYTPGEHEYGLFPAPIHVGKYLR
       .::. :                                                      
CCDS11 SPPQQPLPQEEEVKAKRQRKSRGSESEVLP                              
       1570      1580      1590                                    

>>CCDS4413.1 NSD1 gene_id:64324|Hs108|chr5                (2427 aa)
 initn: 388 init1: 347 opt: 672  Z-score: 437.0  bits: 95.2 E(32554): 5.1e-18
Smith-Waterman score: 698; 41.5% identity (68.8% similar) in 272 aa overlap (2062-2327:1596-1847)

            2040      2050      2060      2070           2080      
pF1KE3 IHVGKYLRQKRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSN-----VYVDVKPLSGY
                                     :::  : ::.:. :     : . .  ::  
CCDS44 KKALQEAAARFEELKAQKELRQLQEDRKNDKKP--PPYKHIKVNRPIGRVQIFTADLS--
        1570      1580      1590        1600      1610      1620   

       2090      2100      2110      2120      2130      2140      
pF1KE3 EATTCNCKKPDDDTRKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFR
       :   ::::  :..   :  ..:.:::.. :: :..:: : .: :: ...... . .: ::
CCDS44 EIPRCNCKATDENP-CGIDSECINRMLLYECHPTVCPAGGRCQNQCFSKRQYPE-VEIFR
            1630       1640      1650      1660      1670          

       2150      2160      2170      2180       2190      2200     
pF1KE3 AEEKGWGIRTKEPLKAGQFIIEYLGEVVSEQEFRNRM-IEQYHNHSDHYCLNLDSGMVID
       . ..:::.:::  .: :.:. ::.::...:.: : :.   : :. .. : :.::.  .::
CCDS44 TLQRGWGLRTKTDIKKGEFVNEYVGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIID
    1680      1690      1700      1710      1720      1730         

        2210      2220      2230      2240      2250      2260     
pF1KE3 SYRMGNEARFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQ
       .   :: :::.:: :.:::: :::::::  :.::.::.:. ::::::..::.. ..  : 
CCDS44 AGPKGNYARFMNHCCQPNCETQKWSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKT
    1740      1750      1760      1770      1780      1790         

        2270      2280      2290      2300      2310      2320     
pF1KE3 QLCKCGFEKCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLS
        .::::  .: :..: .          :: ::.::..:: . :.:...:   .. .:...
CCDS44 -VCKCGAPNCSGFLGVRP---------KN-QPIATEEKSKKFKKKQQGK---RRTQGEIT
     1800      1810                1820      1830         1840     

        2330      2340      2350      2360      2370      2380     
pF1KE3 EEPSENINTPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHS
       .:                                                          
CCDS44 KEREDECFSCGDAGQLVSCKKPGCPKVYHADCLNLTKRPAGKWECPWHQCDICGKEAASF
        1850      1860      1870      1880      1890      1900     

>>CCDS4412.1 NSD1 gene_id:64324|Hs108|chr5                (2696 aa)
 initn: 388 init1: 347 opt: 672  Z-score: 436.3  bits: 95.2 E(32554): 5.5e-18
Smith-Waterman score: 698; 41.5% identity (68.8% similar) in 272 aa overlap (2062-2327:1865-2116)

            2040      2050      2060      2070           2080      
pF1KE3 IHVGKYLRQKRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSN-----VYVDVKPLSGY
                                     :::  : ::.:. :     : . .  ::  
CCDS44 KKALQEAAARFEELKAQKELRQLQEDRKNDKKP--PPYKHIKVNRPIGRVQIFTADLS--
         1840      1850      1860        1870      1880      1890  

       2090      2100      2110      2120      2130      2140      
pF1KE3 EATTCNCKKPDDDTRKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFR
       :   ::::  :..   :  ..:.:::.. :: :..:: : .: :: ...... . .: ::
CCDS44 EIPRCNCKATDENP-CGIDSECINRMLLYECHPTVCPAGGRCQNQCFSKRQYPE-VEIFR
             1900       1910      1920      1930      1940         

       2150      2160      2170      2180       2190      2200     
pF1KE3 AEEKGWGIRTKEPLKAGQFIIEYLGEVVSEQEFRNRM-IEQYHNHSDHYCLNLDSGMVID
       . ..:::.:::  .: :.:. ::.::...:.: : :.   : :. .. : :.::.  .::
CCDS44 TLQRGWGLRTKTDIKKGEFVNEYVGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIID
     1950      1960      1970      1980      1990      2000        

        2210      2220      2230      2240      2250      2260     
pF1KE3 SYRMGNEARFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQ
       .   :: :::.:: :.:::: :::::::  :.::.::.:. ::::::..::.. ..  : 
CCDS44 AGPKGNYARFMNHCCQPNCETQKWSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKT
     2010      2020      2030      2040      2050      2060        

        2270      2280      2290      2300      2310      2320     
pF1KE3 QLCKCGFEKCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLS
        .::::  .: :..: .          :: ::.::..:: . :.:...:   .. .:...
CCDS44 -VCKCGAPNCSGFLGVRP---------KN-QPIATEEKSKKFKKKQQGK---RRTQGEIT
      2070      2080                2090      2100         2110    

        2330      2340      2350      2360      2370      2380     
pF1KE3 EEPSENINTPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHS
       .:                                                          
CCDS44 KEREDECFSCGDAGQLVSCKKPGCPKVYHADCLNLTKRPAGKWECPWHQCDICGKEAASF
         2120      2130      2140      2150      2160      2170    

>>CCDS43729.1 WHSC1L1 gene_id:54904|Hs108|chr8            (1437 aa)
 initn: 500 init1: 332 opt: 658  Z-score: 431.4  bits: 93.4 E(32554): 1e-17
Smith-Waterman score: 658; 38.3% identity (69.0% similar) in 261 aa overlap (2062-2316:1068-1321)

            2040      2050      2060      2070           2080      
pF1KE3 IHVGKYLRQKRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSN-----VYVDVKPLSGY
                                     .::  : ::.:..:     : ..:  ::  
CCDS43 KKALEEAAKRFQELKAQRESKEALEIEKNSRKP--PPYKHIKANKVIGKVQIQVADLS--
      1040      1050      1060      1070        1080      1090     

       2090      2100      2110      2120      2130      2140      
pF1KE3 EATTCNCKKPDDDTRKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFR
       :   :::: : :..  :  ..:::::.  :: :..:: :..: :: . .. . .  : ..
CCDS43 EIPRCNCK-PADENPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDA-EIIK
          1100       1110      1120      1130      1140       1150 

       2150      2160      2170      2180      2190       2200     
pF1KE3 AEEKGWGIRTKEPLKAGQFIIEYLGEVVSEQEFRNRMIEQYHNH-SDHYCLNLDSGMVID
       .:..:::.:::. .: :.:. ::.::...:.: : :. . ..:  .. : :.. .  .::
CCDS43 TERRGWGLRTKRSIKKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIID
            1160      1170      1180      1190      1200      1210 

        2210      2220      2230      2240      2250      2260     
pF1KE3 SYRMGNEARFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQ
       .   :: .::.::::.:::: :::.:::  :.::.:: :.::: :::..::.  ..  . 
CCDS43 AGPKGNYSRFMNHSCNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRT
            1220      1230      1240      1250      1260      1270 

        2270      2280      2290      2300      2310      2320     
pF1KE3 QLCKCGFEKCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLS
       . :.:: ..: :..: . . . . :. ....    ..:  . : . :. :.         
CCDS43 E-CHCGADNCSGFLGVRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDG
             1280      1290      1300      1310      1320      1330

        2330      2340      2350      2360      2370      2380     
pF1KE3 EEPSENINTPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHS
                                                                   
CCDS43 GELVMCDKKDCPKAYHLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEFCPHSFCKDHE
             1340      1350      1360      1370      1380      1390

>>CCDS33940.1 WHSC1 gene_id:7468|Hs108|chr4               (1365 aa)
 initn: 407 init1: 358 opt: 648  Z-score: 425.3  bits: 92.2 E(32554): 2.3e-17
Smith-Waterman score: 648; 38.6% identity (69.1% similar) in 259 aa overlap (2062-2316:986-1237)

            2040      2050      2060      2070       2080          
pF1KE3 IHVGKYLRQKRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSNV-YVDVKPLSG--YEA
                                     .::  : ::.:. :  :  :.  ..   : 
CCDS33 RVFKNALQEAEARFREIKLQREARETQESERKP--PPYKHIKVNKPYGKVQIYTADISEI
         960       970       980         990      1000      1010   

     2090      2100      2110      2120      2130      2140        
pF1KE3 TTCNCKKPDDDTRKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFRAE
         :::: : :..  :  ..:::::.. :: :..:: :: : :: . .... .  . ....
CCDS33 PKCNCK-PTDENPCGFDSECLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPET-KIIKTD
           1020      1030      1040      1050      1060       1070 

     2150      2160      2170      2180      2190       2200       
pF1KE3 EKGWGIRTKEPLKAGQFIIEYLGEVVSEQEFRNRMIEQYHNHSDH-YCLNLDSGMVIDSY
        ::::. .:. .. :.:. ::.::...:.:   :. . ..:   : : :..:.  .::. 
CCDS33 GKGWGLVAKRDIRKGEFVNEYVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAG
            1080      1090      1100      1110      1120      1130 

      2210      2220      2230      2240      2250      2260       
pF1KE3 RMGNEARFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQQL
         :: .::.::::.::::  ::.:::  :.::.:. :.:::::::..::.  .. ::  .
CCDS33 PKGNYSRFMNHSCQPNCETLKWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKT-V
            1140      1150      1160      1170      1180       1190

      2270      2280      2290      2300      2310      2320       
pF1KE3 CKCGFEKCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLSEE
       :.::  .: :..: . .  . :.: ....   :.::. : . : ..:..           
CCDS33 CRCGASNCSGFLGDRPKTSTTLSSEEKGK--KTKKKTRRRRAKGEGKRQSEDECFRCGDG
             1200      1210        1220      1230      1240        

      2330      2340      2350      2360      2370      2380       
pF1KE3 PSENINTPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHSAS
                                                                   
CCDS33 GQLVLCDRKFCTKAYHLSCLGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQ
     1250      1260      1270      1280      1290      1300        

>>CCDS2749.2 SETD2 gene_id:29072|Hs108|chr3               (2564 aa)
 initn: 463 init1: 281 opt: 649  Z-score: 421.8  bits: 92.5 E(32554): 3.6e-17
Smith-Waterman score: 657; 26.8% identity (51.9% similar) in 786 aa overlap (1570-2309:1014-1718)

    1540      1550      1560      1570      1580            1590   
pF1KE3 CPHLSPSKSLINREEQWVHREPSESSPLALGLQTPLQIDCSESSPSL------SLGGFTP
                                     :.   :. : :  .: .      . .: . 
CCDS27 RGEGGHVHTSDDSEVVFSSCDLNLTMEDSDGVTYALKCDSSGHAPEIVSTVHEDYSGSSE
           990      1000      1010      1020      1030      1040   

          1600      1610          1620      1630       1640        
pF1KE3 NSEPASSDEHTNLFTSAIGSCRVSN----PNSSGRKKLTDSP-GLFSAQDTSLNRLH-RK
       .:.  :..: :.   :.:   :...    :..:       :: .  :.:.      : . 
CCDS27 SSNDESDSEDTDSDDSSIPRNRLQSVVVVPKNSTLPMEETSPCSSRSSQSYRHYSDHWED
          1050      1060      1070      1080      1090      1100   

      1650          1660       1670      1680      1690      1700  
pF1KE3 ESLPSN----ERAVQTLAGSQ-PTSDKPSQRPSESTNCSPTRKRSSSESTSSTVNGVPSR
       : : :     :.  ...:..  : .::   . .       :.:      :.:. . . .:
CCDS27 ERLESRRHLYEEKFESIASKACPQTDKFFLHKG-------TEKNPEISFTQSSRKQIDNR
          1110      1120      1130             1140      1150      

           1710      1720       1730       1740              1750  
pF1KE3 SPRLVASGDDSVDSLLQRMVQNEDQ-EPM-EKSIDAVIATASA---PPSSS-----PGRS
        :.:    .:.:::  .  :...   .:  :... : : . .    :  ::     :..:
CCDS27 LPELSHPQSDGVDSTSHTDVKSDPLGHPNSEETVKAKIPSRQQEELPIYSSDFEDVPNKS
       1160      1170      1180      1190      1200      1210      

           1760      1770      1780      1790      1800      1810  
pF1KE3 HSKDRTLGKPDSLLVPAVTSDSCNNSISLLSEKLTSSCSPHHIKRSVVEAMQRQARKMCN
        ..    ..::: :           . . ::  ..:::   :.         :.     .
CCDS27 WQQTTFQNRPDSRL-----------GKTELS--FSSSCEIPHVDGLHSSEELRNLGWDFS
       1220      1230                   1240      1250      1260   

           1820      1830      1840               1850      1860   
pF1KE3 YDKILATKKNLDHVNKILKAKKLQRQART---------GNNFVKRRPGRPRKCPLQAVVS
        .:  .: .. :       ..: :..:.          ::..   : :::   :  .:: 
CCDS27 QEKPSTTYQQPDSSYGACGGHKYQQNAEQYGGTRDYWQGNGYWDPRSGRP---PGTGVV-
          1270      1280      1290      1300      1310             

          1870      1880      1890      1900      1910      1920   
pF1KE3 MQAFQAAQFVNPELNRDEEGAALHLSPDTVTDVIEAVVQSVNLNPEHKKGLKRKGWLLEE
          .. .:           : .    ::..::  :          :...  .. :  . .
CCDS27 ---YDRTQ-----------GQV----PDSLTDDRE----------EEENWDQQDGSHFSD
       1320                     1330                1340      1350 

          1930      1940      1950      1960      1970      1980   
pF1KE3 QTRKKQKPLPEEEEQENNKSFNEAPVEIPSPSETPAKPSEPESTLQPVLSLIPREKKPPR
       :. :    :      ...:.  .:: :: : :    : .   .  .   . . ..    :
CCDS27 QSDKFLLSL------QKDKGSVQAP-EISSNS---IKDTLAVNEKKDFSKNLEKNDIKDR
            1360            1370          1380      1390      1400 

          1990      2000      2010      2020      2030      2040   
pF1KE3 PPKKKYQKAGLYSDVYKTTDPKSRLIQLKKEKLEYTPGEHEYGLFPAPIHVGKYLRQKRI
        : :: ..     .. . ..  ..: . :: ..:   ::   .. :.   ::    .   
CCDS27 GPLKKRRQ-----EIESDSESDGELQDRKKVRVEVEQGET--SVPPGSALVGPSCVMD--
                 1410      1420      1430        1440      1450    

          2050      2060       2070      2080          2090        
pF1KE3 DFQLPYDILWQWKHNQLYKKPDVPLY-KKIRSNVYVDV----KPLSGYEATTCNCKKPDD
       ::. :     .::  .  :.  .: :   :. :::.      :     .   :.:   . 
CCDS27 DFRDPQ----RWK--ECAKQGKMPCYFDLIEENVYLTERKKNKSHRDIKRMQCECTPLSK
               1460        1470      1480      1490      1500      

     2100          2110      2120      2130      2140      2150    
pF1KE3 DTR-KG---CVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFRAEEKGWGI
       : : .:   : .:::::... ::: . :: :. : :.:.::.. .. .: . .:.::::.
CCDS27 DERAQGEIACGEDCLNRLLMIECS-SRCPNGDYCSNRRFQRKQHAD-VEVILTEKKGWGL
       1510      1520      1530       1540      1550       1560    

         2160      2170      2180      2190       2200      2210   
pF1KE3 RTKEPLKAGQFIIEYLGEVVSEQEFRNRMIEQYHNHSDHY-CLNLDSGMVIDSYRMGNEA
       :. . : .. :..:: :::....::. :. :  .:.. ::  . : .  .::. . :: .
CCDS27 RAAKDLPSNTFVLEYCGEVLDHKEFKARVKEYARNKNIHYYFMALKNDEIIDATQKGNCS
         1570      1580      1590      1600      1610      1620    

          2220      2230      2240      2250      2260      2270   
pF1KE3 RFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQQLCKCGFE
       ::.::::.:::: :::.:::  :.:... : .:.:.:::.::.:. .. : :. : ::  
CCDS27 RFMNHSCEPNCETQKWTVNGQLRVGFFTTKLVPSGSELTFDYQFQRYGKEAQK-CFCGSA
         1630      1640      1650      1660      1670       1680   

          2280      2290      2300      2310      2320      2330   
pF1KE3 KCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLSEEPSENIN
       .::: .::.. ::.  ... . .   ..::.. . :                        
CCDS27 NCRGYLGGEN-RVSIRAAGGKMKKERSRKKDSVDGELEALMENGEGLSDKNQVLSLSRLM
          1690       1700      1710      1720      1730      1740  

          2340      2350      2360      2370      2380      2390   
pF1KE3 TPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHSASLYTRWN
                                                                   
CCDS27 VRIETLEQKLTCLELIQNTHSQSCLKSFLERHGLSLLWIWMAELGDGRESNQKLQEEIIK
           1750      1760      1770      1780      1790      1800  




2964 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Sun Nov  6 06:57:11 2016 done: Sun Nov  6 06:57:12 2016
 Total Scan time:  7.400 Total Display time:  0.840

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com