Result of FASTA (ccds) for pF1KA1090
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KA1090, 1365 aa
  1>>>pF1KA1090 1365 - 1365 aa - 1365 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 7.4937+/-0.00099; mu= 14.7143+/- 0.060
 mean_var=173.6466+/-34.979, 0's: 0 Z-trim(110.8): 104  B-trim: 0 in 0/51
 Lambda= 0.097329
 statistics sampled from 11802 (11906) to 11802 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.703), E-opt: 0.2 (0.366), width:  16
 Scan time:  4.250

The best scores are:                                      opt bits E(32554)
CCDS33940.1 WHSC1 gene_id:7468|Hs108|chr4          (1365) 9510 1348.8       0
CCDS46999.1 WHSC1 gene_id:7468|Hs108|chr4          ( 629) 4107 589.8 7.7e-168
CCDS3356.1 WHSC1 gene_id:7468|Hs108|chr4           ( 647) 4104 589.4 1.1e-167
CCDS4413.1 NSD1 gene_id:64324|Hs108|chr5           (2427) 3606 520.0 3.1e-146
CCDS4412.1 NSD1 gene_id:64324|Hs108|chr5           (2696) 3606 520.1 3.4e-146
CCDS43729.1 WHSC1L1 gene_id:54904|Hs108|chr8       (1437) 2691 391.3  1e-107
CCDS2749.2 SETD2 gene_id:29072|Hs108|chr3          (2564)  706 112.8 1.2e-23
CCDS1113.2 ASH1L gene_id:55870|Hs108|chr1          (2964)  648 104.7 3.9e-21
CCDS6105.1 WHSC1L1 gene_id:54904|Hs108|chr8        ( 645)  545 89.7 2.9e-17


>>CCDS33940.1 WHSC1 gene_id:7468|Hs108|chr4               (1365 aa)
 initn: 9510 init1: 9510 opt: 9510  Z-score: 7222.5  bits: 1348.8 E(32554):    0
Smith-Waterman score: 9510; 100.0% identity (100.0% similar) in 1365 aa overlap (1-1365:1-1365)

               10        20        30        40        50        60
pF1KA1 MEFSIKQSPLSVQSVVKCIKMKQAPEILGSANGKTPSCEVNRECSVFLSKAQLSSSLQEG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MEFSIKQSPLSVQSVVKCIKMKQAPEILGSANGKTPSCEVNRECSVFLSKAQLSSSLQEG
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KA1 VMQKFNGHDALPFIPADKLKDLTSRVFNGEPGAHDAKLRFESQEMKGIGTPPNTTPIKNG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VMQKFNGHDALPFIPADKLKDLTSRVFNGEPGAHDAKLRFESQEMKGIGTPPNTTPIKNG
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KA1 SPEIKLKITKTYMNGKPLFESSICGDSAADVSQSEENGQKPENKARRNRKRSIKYDSLLE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SPEIKLKITKTYMNGKPLFESSICGDSAADVSQSEENGQKPENKARRNRKRSIKYDSLLE
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KA1 QGLVEAALVSKISSPSDKKIPAKKESCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QGLVEAALVSKISSPSDKKIPAKKESCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMV
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KA1 SADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQ
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KA1 APTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 APTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVA
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KA1 KEAGIAAESLGEMAESSGVSEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KEAGIAAESLGEMAESSGVSEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGK
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KA1 STPQKTAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHRDEVVAEHPDASG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 STPQKTAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHRDEVVAEHPDASG
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KA1 EEIEELLRSQWSLLSEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTEDAE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 EEIEELLRSQWSLLSEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTEDAE
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KA1 AEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 AEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKR
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KA1 NRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEVSVSSKKSER
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 NRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEVSVSSKKSER
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KA1 GVTAKKEYVCQLCEKPGSLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIHSCFVC
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GVTAKKEYVCQLCEKPGSLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIHSCFVC
              670       680       690       700       710       720

              730       740       750       760       770       780
pF1KA1 KESKTDVKRCVVTQCGKFYHEACVKKYPLTVFESRGFRCPLHSCVSCHASNPSNPRPSKG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KESKTDVKRCVVTQCGKFYHEACVKKYPLTVFESRGFRCPLHSCVSCHASNPSNPRPSKG
              730       740       750       760       770       780

              790       800       810       820       830       840
pF1KA1 KMMRCVRCPVAYHSGDACLAAGCSVIASNSIICTAHFTARKGKRHHAHVNVSWCFVCSKG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KMMRCVRCPVAYHSGDACLAAGCSVIASNSIICTAHFTARKGKRHHAHVNVSWCFVCSKG
              790       800       810       820       830       840

              850       860       870       880       890       900
pF1KA1 GSLLCCESCPAAFHPDCLNIEMPDGSWFCNDCRAGKKLHFQDIIWVKLGNYRWWPAEVCH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GSLLCCESCPAAFHPDCLNIEMPDGSWFCNDCRAGKKLHFQDIIWVKLGNYRWWPAEVCH
              850       860       870       880       890       900

              910       920       930       940       950       960
pF1KA1 PKNVPPNIQKMKHEIGEFPVFFFGSKDYYWTHQARVFPYMEGDRGSRYQGVRGIGRVFKN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PKNVPPNIQKMKHEIGEFPVFFFGSKDYYWTHQARVFPYMEGDRGSRYQGVRGIGRVFKN
              910       920       930       940       950       960

              970       980       990      1000      1010      1020
pF1KA1 ALQEAEARFREIKLQREARETQESERKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ALQEAEARFREIKLQREARETQESERKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKP
              970       980       990      1000      1010      1020

             1030      1040      1050      1060      1070      1080
pF1KA1 TDENPCGFDSECLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TDENPCGFDSECLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAK
             1030      1040      1050      1060      1070      1080

             1090      1100      1110      1120      1130      1140
pF1KA1 RDIRKGEFVNEYVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RDIRKGEFVNEYVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFM
             1090      1100      1110      1120      1130      1140

             1150      1160      1170      1180      1190      1200
pF1KA1 NHSCQPNCETLKWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 NHSCQPNCETLKWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSG
             1150      1160      1170      1180      1190      1200

             1210      1220      1230      1240      1250      1260
pF1KA1 FLGDRPKTSTTLSSEEKGKKTKKKTRRRRAKGEGKRQSEDECFRCGDGGQLVLCDRKFCT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 FLGDRPKTSTTLSSEEKGKKTKKKTRRRRAKGEGKRQSEDECFRCGDGGQLVLCDRKFCT
             1210      1220      1230      1240      1250      1260

             1270      1280      1290      1300      1310      1320
pF1KA1 KAYHLSCLGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KAYHLSCLGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGR
             1270      1280      1290      1300      1310      1320

             1330      1340      1350      1360     
pF1KA1 SYCCEHDLGAASVRSTKTEKPPPEPGKPKGKRRRRRGWRRVTEGK
       :::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SYCCEHDLGAASVRSTKTEKPPPEPGKPKGKRRRRRGWRRVTEGK
             1330      1340      1350      1360     

>>CCDS46999.1 WHSC1 gene_id:7468|Hs108|chr4               (629 aa)
 initn: 4107 init1: 4107 opt: 4107  Z-score: 3126.7  bits: 589.8 E(32554): 7.7e-168
Smith-Waterman score: 4107; 100.0% identity (100.0% similar) in 628 aa overlap (1-628:1-628)

               10        20        30        40        50        60
pF1KA1 MEFSIKQSPLSVQSVVKCIKMKQAPEILGSANGKTPSCEVNRECSVFLSKAQLSSSLQEG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 MEFSIKQSPLSVQSVVKCIKMKQAPEILGSANGKTPSCEVNRECSVFLSKAQLSSSLQEG
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KA1 VMQKFNGHDALPFIPADKLKDLTSRVFNGEPGAHDAKLRFESQEMKGIGTPPNTTPIKNG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 VMQKFNGHDALPFIPADKLKDLTSRVFNGEPGAHDAKLRFESQEMKGIGTPPNTTPIKNG
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KA1 SPEIKLKITKTYMNGKPLFESSICGDSAADVSQSEENGQKPENKARRNRKRSIKYDSLLE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 SPEIKLKITKTYMNGKPLFESSICGDSAADVSQSEENGQKPENKARRNRKRSIKYDSLLE
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KA1 QGLVEAALVSKISSPSDKKIPAKKESCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 QGLVEAALVSKISSPSDKKIPAKKESCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMV
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KA1 SADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 SADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQ
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KA1 APTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 APTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVA
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KA1 KEAGIAAESLGEMAESSGVSEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 KEAGIAAESLGEMAESSGVSEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGK
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KA1 STPQKTAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHRDEVVAEHPDASG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 STPQKTAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHRDEVVAEHPDASG
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KA1 EEIEELLRSQWSLLSEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTEDAE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 EEIEELLRSQWSLLSEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTEDAE
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KA1 AEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 AEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKR
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KA1 NRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEVSVSSKKSER
       ::::::::::::::::::::::::::::                                
CCDS46 NRASTAASSALGFSKSSSPSASLTENEVK                               
              610       620                                        

>>CCDS3356.1 WHSC1 gene_id:7468|Hs108|chr4                (647 aa)
 initn: 4103 init1: 4103 opt: 4104  Z-score: 3124.3  bits: 589.4 E(32554): 1.1e-167
Smith-Waterman score: 4104; 99.4% identity (99.5% similar) in 632 aa overlap (1-632:1-632)

               10        20        30        40        50        60
pF1KA1 MEFSIKQSPLSVQSVVKCIKMKQAPEILGSANGKTPSCEVNRECSVFLSKAQLSSSLQEG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MEFSIKQSPLSVQSVVKCIKMKQAPEILGSANGKTPSCEVNRECSVFLSKAQLSSSLQEG
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KA1 VMQKFNGHDALPFIPADKLKDLTSRVFNGEPGAHDAKLRFESQEMKGIGTPPNTTPIKNG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VMQKFNGHDALPFIPADKLKDLTSRVFNGEPGAHDAKLRFESQEMKGIGTPPNTTPIKNG
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KA1 SPEIKLKITKTYMNGKPLFESSICGDSAADVSQSEENGQKPENKARRNRKRSIKYDSLLE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SPEIKLKITKTYMNGKPLFESSICGDSAADVSQSEENGQKPENKARRNRKRSIKYDSLLE
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KA1 QGLVEAALVSKISSPSDKKIPAKKESCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QGLVEAALVSKISSPSDKKIPAKKESCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMV
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KA1 SADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQ
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KA1 APTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 APTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVA
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KA1 KEAGIAAESLGEMAESSGVSEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KEAGIAAESLGEMAESSGVSEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGK
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KA1 STPQKTAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHRDEVVAEHPDASG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 STPQKTAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHRDEVVAEHPDASG
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KA1 EEIEELLRSQWSLLSEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTEDAE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 EEIEELLRSQWSLLSEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTEDAE
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KA1 AEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 AEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKR
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KA1 NRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEVSVSSKKSER
       :::::::::::::::::::::::::::.   :                            
CCDS33 NRASTAASSALGFSKSSSPSASLTENELLWEPTPVKLDLNPAALYCT             
              610       620       630       640                    

              670       680       690       700       710       720
pF1KA1 GVTAKKEYVCQLCEKPGSLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIHSCFVC

>>CCDS4413.1 NSD1 gene_id:64324|Hs108|chr5                (2427 aa)
 initn: 2268 init1: 1856 opt: 3606  Z-score: 2738.8  bits: 520.0 E(32554): 3.1e-146
Smith-Waterman score: 3606; 62.9% identity (82.3% similar) in 770 aa overlap (595-1348:1198-1961)

          570       580       590       600       610       620    
pF1KA1 KTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKRNRASTAASSALGFSKSSSPSASLT
                                     :: .::.:   ::.. .  .: .. ..:  
CCDS44 EAGHLENGITESCATSYSKDFGGGTTKIFDKP-RKRKRQRHAAAK-MQCKKVKNDDSS--
      1170      1180      1190       1200      1210       1220     

          630           640        650          660        670     
pF1KA1 ENEVSDSPGD----EPSESPYESADE-TQTEVSV-SSKK--SERGVTAK-KEYVCQLCEK
        .:.  : :.    . . :: :...: .. . .. .:::  .:::  :  :: ::: :::
CCDS44 -KEIPGSEGELMPHRTATSPKETVEEGVEHDPGMPASKKMQGERGGGAALKENVCQNCEK
           1230      1240      1250      1260      1270      1280  

         680       690       700       710       720       730     
pF1KA1 PGSLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIHSCFVCKESKTDVKRCVVTQC
        : :::::. ::::::: ::::.. :.:.: :.:: .:::.:::::.:  :::::..  :
CCDS44 LGELLLCEAQCCGAFHLECLGLTEMPRGKFICNECRTGIHTCFVCKQSGEDVKRCLLPLC
           1290      1300      1310      1320      1330      1340  

         740       750       760       770       780       790     
pF1KA1 GKFYHEACVKKYPLTVFESRGFRCPLHSCVSCHASNPSNPRPSKGKMMRCVRCPVAYHSG
       :::::: ::.::: ::....:::: :: :..:::.::.:   :::..:::::::::::..
CCDS44 GKFYHEECVQKYPPTVMQNKGFRCSLHICITCHAANPANVSASKGRLMRCVRCPVAYHAN
           1350      1360      1370      1380      1390      1400  

         800       810       820       830       840       850     
pF1KA1 DACLAAGCSVIASNSIICTAHFTARKGKRHHAHVNVSWCFVCSKGGSLLCCESCPAAFHP
       : ::::: ...:::::::  ::: :.: :.: :::::::::::.:::::::.::::::: 
CCDS44 DFCLAAGSKILASNSIICPNHFTPRRGCRNHEHVNVSWCFVCSEGGSLLCCDSCPAAFHR
           1410      1420      1430      1440      1450      1460  

         860       870       880       890       900       910     
pF1KA1 DCLNIEMPDGSWFCNDCRAGKKLHFQDIIWVKLGNYRWWPAEVCHPKNVPPNIQKMKHEI
       .::::..:.:.:.::::.:::: :...:.:::.: :::::::.:::. :: ::.::.:..
CCDS44 ECLNIDIPEGNWYCNDCKAGKKPHYREIVWVKVGRYRWWPAEICHPRAVPSNIDKMRHDV
           1470      1480      1490      1500      1510      1520  

         920       930       940       950       960       970     
pF1KA1 GEFPVFFFGSKDYYWTHQARVFPYMEGDRGSRYQGVRGIGRVFKNALQEAEARFREIKLQ
       :::::.::::.:: :::::::::::::: .:. .  .:.  ..:.::::: :::.:.: :
CCDS44 GEFPVLFFGSNDYLWTHQARVFPYMEGDVSSKDKMGKGVDGTYKKALQEAAARFEELKAQ
           1530      1540      1550      1560      1570      1580  

         980          990      1000      1010      1020      1030  
pF1KA1 REARETQE---SERKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKPTDENPCGFDSEC
       .: :. ::   ...:::::::::::.: :.:::.:::.::::.:::: :::::::.::::
CCDS44 KELRQLQEDRKNDKKPPPYKHIKVNRPIGRVQIFTADLSEIPRCNCKATDENPCGIDSEC
           1590      1600      1610      1620      1630      1640  

           1040      1050      1060      1070      1080      1090  
pF1KA1 LNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAKRDIRKGEFVNEY
       .::::..:::: :::::  ::::::.::::::..:..:  .:::: .: ::.::::::::
CCDS44 INRMLLYECHPTVCPAGGRCQNQCFSKRQYPEVEIFRTLQRGWGLRTKTDIKKGEFVNEY
           1650      1660      1670      1680      1690      1700  

           1100      1110      1120      1130      1140      1150  
pF1KA1 VGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFMNHSCQPNCETLK
       :::::::::: :::..:.:.:::.:::::.::::::::::::::.::::: ::::::: :
CCDS44 VGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIIDAGPKGNYARFMNHCCQPNCETQK
           1710      1720      1730      1740      1750      1760  

           1160      1170      1180      1190      1200      1210  
pF1KA1 WTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSGFLGDRPKTSTTL
       :.:::::::::::. :: :::::::::::.:::: ::::.::: ::::::: ::: .  .
CCDS44 WSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKTVCKCGAPNCSGFLGVRPK-NQPI
           1770      1780      1790      1800      1810       1820 

           1220       1230      1240      1250      1260      1270 
pF1KA1 SSEEKGKKTKKKTR-RRRAKGEGKRQSEDECFRCGDGGQLVLCDRKFCTKAYHLSCLGLG
       ..:::.:: ::: . .::..::  .. ::::: :::.:::: : .  : :.:: .::.: 
CCDS44 ATEEKSKKFKKKQQGKRRTQGEITKEREDECFSCGDAGQLVSCKKPGCPKVYHADCLNLT
            1830      1840      1850      1860      1870      1880 

            1280      1290      1300      1310      1320       1330
pF1KA1 KRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGRSYCCEHD-LGA
       ::: ::::::::.::.::: ..:::..::.::::.:..:  :    :::  : :::  : 
CCDS44 KRPAGKWECPWHQCDICGKEAASFCEMCPSSFCKQHREGMLFISKLDGRLSCTEHDPCGP
            1890      1900      1910      1920      1930      1940 

             1340        1350      1360                            
pF1KA1 ASVRSTKTEK--PPPEPGKPKGKRRRRRGWRRVTEGK                       
         ..  . ..  ::: :  :                                        
CCDS44 NPLEPGEIREYVPPPVPLPPGPSTHLAEQSTGMAAQAPKMSDKPPADTNQMLSLSKKALA
            1950      1960      1970      1980      1990      2000 

>>CCDS4412.1 NSD1 gene_id:64324|Hs108|chr5                (2696 aa)
 initn: 2340 init1: 1856 opt: 3606  Z-score: 2738.2  bits: 520.1 E(32554): 3.4e-146
Smith-Waterman score: 3606; 62.9% identity (82.3% similar) in 770 aa overlap (595-1348:1467-2230)

          570       580       590       600       610       620    
pF1KA1 KTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKRNRASTAASSALGFSKSSSPSASLT
                                     :: .::.:   ::.. .  .: .. ..:  
CCDS44 EAGHLENGITESCATSYSKDFGGGTTKIFDKP-RKRKRQRHAAAK-MQCKKVKNDDSS--
       1440      1450      1460       1470      1480       1490    

          630           640        650          660        670     
pF1KA1 ENEVSDSPGD----EPSESPYESADE-TQTEVSV-SSKK--SERGVTAK-KEYVCQLCEK
        .:.  : :.    . . :: :...: .. . .. .:::  .:::  :  :: ::: :::
CCDS44 -KEIPGSEGELMPHRTATSPKETVEEGVEHDPGMPASKKMQGERGGGAALKENVCQNCEK
            1500      1510      1520      1530      1540      1550 

         680       690       700       710       720       730     
pF1KA1 PGSLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIHSCFVCKESKTDVKRCVVTQC
        : :::::. ::::::: ::::.. :.:.: :.:: .:::.:::::.:  :::::..  :
CCDS44 LGELLLCEAQCCGAFHLECLGLTEMPRGKFICNECRTGIHTCFVCKQSGEDVKRCLLPLC
            1560      1570      1580      1590      1600      1610 

         740       750       760       770       780       790     
pF1KA1 GKFYHEACVKKYPLTVFESRGFRCPLHSCVSCHASNPSNPRPSKGKMMRCVRCPVAYHSG
       :::::: ::.::: ::....:::: :: :..:::.::.:   :::..:::::::::::..
CCDS44 GKFYHEECVQKYPPTVMQNKGFRCSLHICITCHAANPANVSASKGRLMRCVRCPVAYHAN
            1620      1630      1640      1650      1660      1670 

         800       810       820       830       840       850     
pF1KA1 DACLAAGCSVIASNSIICTAHFTARKGKRHHAHVNVSWCFVCSKGGSLLCCESCPAAFHP
       : ::::: ...:::::::  ::: :.: :.: :::::::::::.:::::::.::::::: 
CCDS44 DFCLAAGSKILASNSIICPNHFTPRRGCRNHEHVNVSWCFVCSEGGSLLCCDSCPAAFHR
            1680      1690      1700      1710      1720      1730 

         860       870       880       890       900       910     
pF1KA1 DCLNIEMPDGSWFCNDCRAGKKLHFQDIIWVKLGNYRWWPAEVCHPKNVPPNIQKMKHEI
       .::::..:.:.:.::::.:::: :...:.:::.: :::::::.:::. :: ::.::.:..
CCDS44 ECLNIDIPEGNWYCNDCKAGKKPHYREIVWVKVGRYRWWPAEICHPRAVPSNIDKMRHDV
            1740      1750      1760      1770      1780      1790 

         920       930       940       950       960       970     
pF1KA1 GEFPVFFFGSKDYYWTHQARVFPYMEGDRGSRYQGVRGIGRVFKNALQEAEARFREIKLQ
       :::::.::::.:: :::::::::::::: .:. .  .:.  ..:.::::: :::.:.: :
CCDS44 GEFPVLFFGSNDYLWTHQARVFPYMEGDVSSKDKMGKGVDGTYKKALQEAAARFEELKAQ
            1800      1810      1820      1830      1840      1850 

         980          990      1000      1010      1020      1030  
pF1KA1 REARETQE---SERKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKPTDENPCGFDSEC
       .: :. ::   ...:::::::::::.: :.:::.:::.::::.:::: :::::::.::::
CCDS44 KELRQLQEDRKNDKKPPPYKHIKVNRPIGRVQIFTADLSEIPRCNCKATDENPCGIDSEC
            1860      1870      1880      1890      1900      1910 

           1040      1050      1060      1070      1080      1090  
pF1KA1 LNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAKRDIRKGEFVNEY
       .::::..:::: :::::  ::::::.::::::..:..:  .:::: .: ::.::::::::
CCDS44 INRMLLYECHPTVCPAGGRCQNQCFSKRQYPEVEIFRTLQRGWGLRTKTDIKKGEFVNEY
            1920      1930      1940      1950      1960      1970 

           1100      1110      1120      1130      1140      1150  
pF1KA1 VGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFMNHSCQPNCETLK
       :::::::::: :::..:.:.:::.:::::.::::::::::::::.::::: ::::::: :
CCDS44 VGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIIDAGPKGNYARFMNHCCQPNCETQK
            1980      1990      2000      2010      2020      2030 

           1160      1170      1180      1190      1200      1210  
pF1KA1 WTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSGFLGDRPKTSTTL
       :.:::::::::::. :: :::::::::::.:::: ::::.::: ::::::: ::: .  .
CCDS44 WSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKTVCKCGAPNCSGFLGVRPK-NQPI
            2040      2050      2060      2070      2080       2090

           1220       1230      1240      1250      1260      1270 
pF1KA1 SSEEKGKKTKKKTR-RRRAKGEGKRQSEDECFRCGDGGQLVLCDRKFCTKAYHLSCLGLG
       ..:::.:: ::: . .::..::  .. ::::: :::.:::: : .  : :.:: .::.: 
CCDS44 ATEEKSKKFKKKQQGKRRTQGEITKEREDECFSCGDAGQLVSCKKPGCPKVYHADCLNLT
             2100      2110      2120      2130      2140      2150

            1280      1290      1300      1310      1320       1330
pF1KA1 KRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGRSYCCEHD-LGA
       ::: ::::::::.::.::: ..:::..::.::::.:..:  :    :::  : :::  : 
CCDS44 KRPAGKWECPWHQCDICGKEAASFCEMCPSSFCKQHREGMLFISKLDGRLSCTEHDPCGP
             2160      2170      2180      2190      2200      2210

             1340        1350      1360                            
pF1KA1 ASVRSTKTEK--PPPEPGKPKGKRRRRRGWRRVTEGK                       
         ..  . ..  ::: :  :                                        
CCDS44 NPLEPGEIREYVPPPVPLPPGPSTHLAEQSTGMAAQAPKMSDKPPADTNQMLSLSKKALA
             2220      2230      2240      2250      2260      2270

>>CCDS43729.1 WHSC1L1 gene_id:54904|Hs108|chr8            (1437 aa)
 initn: 3744 init1: 1867 opt: 2691  Z-score: 2047.4  bits: 391.3 E(32554): 1e-107
Smith-Waterman score: 4037; 46.5% identity (69.4% similar) in 1354 aa overlap (66-1327:98-1409)

          40        50        60        70         80        90    
pF1KA1 PSCEVNRECSVFLSKAQLSSSLQEGVMQKFNGHDAL-PFIPADKLKDLTSRVFNGEPGAH
                                     ::  :.  : :.:  .   :.. : .:  :
CCDS43 PLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYH---SEIPNTRP--H
        70        80        90       100       110          120    

           100       110       120       130       140       150   
pF1KA1 DAKLR-FESQEMKGIGTPPNTTPIKNGSPEIKLKITKTYMNGKPLFESSICGDSAADVSQ
       .   .    :     ..: .. : :.:::::::::::: .::. :::::.:::   .:. 
CCDS43 EILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEVQA
            130       140       150       160       170       180  

           160       170       180       190                    200
pF1KA1 SEENGQKPENKARRNRKRSIKYDSLLEQGLVEAALVS-----------KISSPSDK--KI
       ::.. .: :.. ...::.: :.::   .      . .           .... :.:  . 
CCDS43 SEHTKSKHESR-KEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPREE
            190        200       210       220       230       240 

              210              220       230       240       250   
pF1KA1 PAKKESCPNTG-------RDKDHLLKYNVGDLVWSKVSGYPWWPCMVSADPLLHSYTKLK
       :. ::  :           . .  .:..:::::::::. :::::::::.:: :. .::..
CCDS43 PVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKIN
             250       260       270       280       290       300 

           260       270       280       290       300       310   
pF1KA1 GQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQAPTKAEKIKLLKP
          ..::.::::::.. :::::. :: .  ..:. :.:.:  :..::: ...:: :. ::
CCDS43 --TRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKP
               310       320       330       340       350         

           320       330       340       350       360       370   
pF1KA1 ISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVAKEAGIAAESLGEM
          . ::::..::..::.: .:. :::  ..::.:.  : .   . ::..  .   . . 
CCDS43 RPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKT
     360       370       380       390       400       410         

                 380       390       400       410       420       
pF1KA1 AESSGV------SEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGKSTPQKTA
        .  .:      . .:.:  .:.    :   ::.  .  .:::  :  :    .   :::
CCDS43 RRPRSVLNTQPEQTNAGEVASSLSSTEI---RRHSQRRHTSAEEEEPPP---VKIAWKTA
     420       430       440          450       460          470   

       430       440       450       460              470       480
pF1KA1 EADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHR-------DEVVAEHPDASG
        :  :... .    .: .... .   . ...   ::  ..        :. :       :
CCDS43 AA--RKSLPASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGI-G
             480       490       500       510       520        530

              490         500       510       520       530        
pF1KA1 EEIEELLRSQWSLL--SEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTED
       .. :  .:.:  :.  . .:: .  :. .. .:  .  ..:.:. :.. .. : .. .: 
CCDS43 NKTEISVRGQDRLIISTPNQRNEKPTQ-SVSSPEATSGSTGSVEKKQQRRSIRTRSESEK
              540       550        560       570       580         

      540       550       560       570       580       590        
pF1KA1 AEAEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLK
       . .: .:.:... .     . .:. . :..:.             : .....::.:::::
CCDS43 S-TEVVPKKKIKKE-----QVETVPQATVKTGL------------QKGASEISDSCKPLK
     590        600            610                   620       630 

      600       610       620       630       640       650        
pF1KA1 KRNRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEV-SVSSKK
       ::.:::: .  . .  ...: : :   .... . : .  .::  .::   ..: :..:. 
CCDS43 KRSRASTDVEMTSSAYRDTSDSDSRGLSDLQVGFGKQ-VDSPSATADADVSDVQSMDSSL
             640       650       660        670       680       690

       660        670        680       690       700       710     
pF1KA1 SERGV-TAKKEYVCQLCEKPG-SLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIH
       :.::.  .::. :::.::. : ::. ::: ::  ::: ::::.  :...: : :: .: :
CCDS43 SRRGTGMSKKDTVCQICESSGDSLIPCEGECCKHFHLECLGLASLPDSKFICMECKTGQH
              700       710       720       730       740       750

         720       730       740       750       760       770     
pF1KA1 SCFVCKESKTDVKRCVVTQCGKFYHEACVKKYPLTVFESRGFRCPLHSCVSCHASNPSNP
        :: :: :  ::::: :  ::::::::::.:.: ..:::.::::: : : .:   .  . 
CCDS43 PCFSCKVSGKDVKRCSVGACGKFYHEACVRKFPTAIFESKGFRCPQHCCSACSMEKDIH-
              760       770       780       790       800          

         780       790       800       810       820       830     
pF1KA1 RPSKGKMMRCVRCPVAYHSGDACLAAGCSVIASNSIICTAHFTARKGKRHHAHVNVSWCF
       . :::.::::.::::::::::::.:::  ...:  .::. :    : . . . :::..::
CCDS43 KASKGRMMRCLRCPVAYHSGDACIAAGSMLVSSYILICSNH---SKRSSNSSAVNVGFCF
     810       820       830       840       850          860      

                                                          840      
pF1KA1 VCS-------------------------------------------------KGGSLLCC
       ::.                                                 ::: ::::
CCDS43 VCARGLIVQDHSDPMFSSYAYKSHYLLNESNRAELMKLPMIPSSSASKKKCEKGGRLLCC
        870       880       890       900       910       920      

        850       860       870       880       890       900      
pF1KA1 ESCPAAFHPDCLNIEMPDGSWFCNDCRAGKKLHFQDIIWVKLGNYRWWPAEVCHPKNVPP
       :::::.:::.::.::::.: : ::::.::::::...:.:::::::::::::.:.:..:: 
CCDS43 ESCPASFHPECLSIEMPEGCWNCNDCKAGKKLHYKQIVWVKLGNYRWWPAEICNPRSVPL
        930       940       950       960       970       980      

        910       920       930       940       950       960      
pF1KA1 NIQKMKHEIGEFPVFFFGSKDYYWTHQARVFPYMEGDRGSRYQGVRGIGRVFKNALQEAE
       ::: .::..:.::::::::.::::.::.:::::.:::. :  .:  .:...::.::.:: 
CCDS43 NIQGLKHDLGDFPVFFFGSHDYYWVHQGRVFPYVEGDK-SFAEGQTSINKTFKKALEEAA
        990      1000      1010      1020       1030      1040     

        970       980          990      1000      1010      1020   
pF1KA1 ARFREIKLQREARETQESE---RKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKPTDE
        ::.:.: :::..:. : :   ::::::::::.::  ::::: .::.::::.:::::.::
CCDS43 KRFQELKAQRESKEALEIEKNSRKPPPYKHIKANKVIGKVQIQVADLSEIPRCNCKPADE
        1050      1060      1070      1080      1090      1100     

          1030      1040      1050      1060      1070      1080   
pF1KA1 NPCGFDSECLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAKRDI
       ::::..::::::::..::::::::::. ::::::::: ::...::::. .:::: .::.:
CCDS43 NPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDAEIIKTERRGWGLRTKRSI
        1110      1120      1130      1140      1150      1160     

          1090      1100      1110      1120      1130      1140   
pF1KA1 RKGEFVNEYVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFMNHS
       .::::::::::::::::::  :::.::::..:.:::::. ::::::::::::::::::::
CCDS43 KKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIIDAGPKGNYSRFMNHS
        1170      1180      1190      1200      1210      1220     

          1150      1160      1170      1180      1190      1200   
pF1KA1 CQPNCETLKWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSGFLG
       :.::::: :::::::.::::::.:::::: ::::::::::::: .: :.:::.:::::::
CCDS43 CNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRTECHCGADNCSGFLG
        1230      1240      1250      1260      1270      1280     

          1210      1220      1230      1240      1250      1260   
pF1KA1 DRPKTSTTLSSEEKGKKTKKKTRRRRAKGEGKRQSEDECFRCGDGGQLVLCDRKFCTKAY
        :::.. . ..:::.:..: : .::. : : :.. :: ::.:::::.::.::.: : :::
CCDS43 VRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDGGELVMCDKKDCPKAY
        1290      1300      1310      1320      1330      1340     

          1270      1280      1290      1300      1310      1320   
pF1KA1 HLSCLGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGRSYC
       :: ::.: . :.::::::::.:: :.. ..:::..::.::::.:. :.    . .::  :
CCDS43 HLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEFCPHSFCKDHEKGALVPSALEGRLCC
        1350      1360      1370      1380      1390      1400     

          1330      1340      1350      1360     
pF1KA1 CEHDLGAASVRSTKTEKPPPEPGKPKGKRRRRRGWRRVTEGK
        :::                                      
CCDS43 SEHDPMAPVSPEYWSKIKCKWESQDHGEEVKE          
        1410      1420      1430                 

>>CCDS2749.2 SETD2 gene_id:29072|Hs108|chr3               (2564 aa)
 initn: 703 init1: 604 opt: 706  Z-score: 537.8  bits: 112.8 E(32554): 1.2e-23
Smith-Waterman score: 706; 40.3% identity (69.2% similar) in 273 aa overlap (1009-1270:1493-1757)

      980       990      1000      1010      1020             1030 
pF1KA1 RETQESERKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKPTDENP-------CGFDSE
                                     ::... .:.: : ...        :: :  
CCDS27 CAKQGKMPCYFDLIEENVYLTERKKNKSHRDIKRM-QCECTPLSKDERAQGEIACGED--
           1470      1480      1490       1500      1510           

            1040      1050      1060      1070      1080      1090 
pF1KA1 CLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAKRDIRKGEFVNE
       ::::.::.::  . :: :..:.:. : ..:. ....: :. ::::: : .:. .. :: :
CCDS27 CLNRLLMIECSSR-CPNGDYCSNRRFQRKQHADVEVILTEKKGWGLRAAKDLPSNTFVLE
    1520      1530       1540      1550      1560      1570        

            1100      1110      1120      1130      1140      1150 
pF1KA1 YVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFMNHSCQPNCETL
       : ::..:..:  ::.:.  .:   :.:.... .:.::::  ::: ::::::::.::::: 
CCDS27 YCGEVLDHKEFKARVKEYARNKNIHYYFMALKNDEIIDATQKGNCSRFMNHSCEPNCETQ
     1580      1590      1600      1610      1620      1630        

            1160      1170      1180      1190      1200      1210 
pF1KA1 KWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSGFLGDRPKTSTT
       ::::::. :::.:..  .:.:.::::.:...  :.:   : ::..:: :.:: . ..:  
CCDS27 KWTVNGQLRVGFFTTKLVPSGSELTFDYQFQRYGKEAQKCFCGSANCRGYLGGENRVSIR
     1640      1650      1660      1670      1680      1690        

            1220      1230      1240       1250         1260       
pF1KA1 LSSEEKGKKTKKKTRRRRAKGEGKRQSEDECFR-CGDGGQLVLCDR---KFCTKAYHLSC
        .    : : ::.  :.. . .:. ..  :  .  .: .:..  .:   .. :   .:.:
CCDS27 AA----GGKMKKERSRKKDSVDGELEALMENGEGLSDKNQVLSLSRLMVRIETLEQKLTC
     1700          1710      1720      1730      1740      1750    

      1270      1280      1290      1300      1310      1320       
pF1KA1 LGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGRSYCCEHD
       : :                                                         
CCDS27 LELIQNTHSQSCLKSFLERHGLSLLWIWMAELGDGRESNQKLQEEIIKTLEHLPIPTKNM
         1760      1770      1780      1790      1800      1810    

>>CCDS1113.2 ASH1L gene_id:55870|Hs108|chr1               (2964 aa)
 initn: 407 init1: 358 opt: 648  Z-score: 493.0  bits: 104.7 E(32554): 3.9e-21
Smith-Waterman score: 648; 38.6% identity (69.1% similar) in 259 aa overlap (986-1237:2062-2316)

         960       970       980         990      1000      1010   
pF1KA1 RVFKNALQEAEARFREIKLQREARETQESERKP--PPYKHIKVNKPYGKVQIYTADISEI
                                     .::  : ::.:. :  :  :.  ..   : 
CCDS11 IHVGKYLRQKRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSNV-YVDVKPLSG--YEA
            2040      2050      2060      2070       2080          

           1020      1030      1040      1050      1060       1070 
pF1KA1 PKCNCK-PTDENPCGFDSECLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPET-KIIKTD
         :::: : :..  :  ..:::::.. :: :..:: :: : :: . .... .  . ....
CCDS11 TTCNCKKPDDDTRKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFRAE
     2090      2100      2110      2120      2130      2140        

            1080      1090      1100      1110      1120      1130 
pF1KA1 GKGWGLVAKRDIRKGEFVNEYVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAG
        ::::. .:. .. :.:. ::.::...:.:   :. . ..:   : : :..:.  .::. 
CCDS11 EKGWGIRTKEPLKAGQFIIEYLGEVVSEQEFRNRMIEQYHNHSDH-YCLNLDSGMVIDSY
     2150      2160      2170      2180      2190       2200       

            1140      1150      1160      1170      1180       1190
pF1KA1 PKGNYSRFMNHSCQPNCETLKWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKT-V
         :: .::.::::.::::  ::.:::  :.::.:. :.:::::::..::.  .. ::  .
CCDS11 RMGNEARFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQQL
      2210      2220      2230      2240      2250      2260       

             1200      1210      1220        1230      1240        
pF1KA1 CRCGASNCSGFLGDRPKTSTTLSSEEKGKK--TKKKTRRRRAKGEGKRQSEDECFRCGDG
       :.::  .: :..: . .  . :.: ....   :.::. : . : ..:..           
CCDS11 CKCGFEKCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLSEE
      2270      2280      2290      2300      2310      2320       

     1250      1260      1270      1280      1290      1300        
pF1KA1 GQLVLCDRKFCTKAYHLSCLGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQ
                                                                   
CCDS11 PSENINTPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHSAS
      2330      2340      2350      2360      2370      2380       

>>CCDS6105.1 WHSC1L1 gene_id:54904|Hs108|chr8             (645 aa)
 initn: 692 init1: 323 opt: 545  Z-score: 423.5  bits: 89.7 E(32554): 2.9e-17
Smith-Waterman score: 710; 29.3% identity (58.9% similar) in 564 aa overlap (66-592:98-642)

          40        50        60        70         80        90    
pF1KA1 PSCEVNRECSVFLSKAQLSSSLQEGVMQKFNGHDAL-PFIPADKLKDLTSRVFNGEPGAH
                                     ::  :.  : :.:  .   :.. : .:  :
CCDS61 PLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYH---SEIPNTRP--H
        70        80        90       100       110          120    

           100       110       120       130       140       150   
pF1KA1 DAKLR-FESQEMKGIGTPPNTTPIKNGSPEIKLKITKTYMNGKPLFESSICGDSAADVSQ
       .   .    :     ..: .. : :.:::::::::::: .::. :::::.:::   .:. 
CCDS61 EILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEVQA
            130       140       150       160       170       180  

           160       170       180       190                    200
pF1KA1 SEENGQKPENKARRNRKRSIKYDSLLEQGLVEAALVS-----------KISSPSDK--KI
       ::.. .: :.. ...::.: :.::   .      . .           .... :.:  . 
CCDS61 SEHTKSKHESR-KEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPREE
            190        200       210       220       230       240 

              210              220       230       240       250   
pF1KA1 PAKKESCPNTG-------RDKDHLLKYNVGDLVWSKVSGYPWWPCMVSADPLLHSYTKLK
       :. ::  :           . .  .:..:::::::::. :::::::::.:: :. .::..
CCDS61 PVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKIN
             250       260       270       280       290       300 

           260       270       280       290       300       310   
pF1KA1 GQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQAPTKAEKIKLLKP
          ..::.::::::.. :::::. :: .  ..:. :.:.:  :..::: ...:: :. ::
CCDS61 --TRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKP
               310       320       330       340       350         

           320       330       340       350       360       370   
pF1KA1 ISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVAKEAGIAAESLGEM
          . ::::..::..::.: .:. :::  ..::.:.  : .   . ::..  .   . . 
CCDS61 RPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKT
     360       370       380       390       400       410         

                 380       390       400       410       420       
pF1KA1 AESSGV------SEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGKSTPQKTA
        .  .:      . .:.:  .:.    :   ::.  .  .:::  :  :    .   :::
CCDS61 RRPRSVLNTQPEQTNAGEVASSLSSTEI---RRHSQRRHTSAEEEEPPP---VKIAWKTA
     420       430       440          450       460          470   

       430       440       450       460              470       480
pF1KA1 EADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHR-------DEVVAEHPDASG
        :  :... .    .: .... .   . ...   ::  ..        :. :     . :
CCDS61 AA--RKSLPASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYS-TKGIG
             480       490       500       510       520        530

              490         500       510       520       530        
pF1KA1 EEIEELLRSQWSLL--SEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTED
       .. :  .:.:  :.  . .:: .  :. .. .:  .  ..:.:. :.. .. : .. .: 
CCDS61 NKTEISVRGQDRLIISTPNQRNEKPTQ-SVSSPEATSGSTGSVEKKQQRRSIRTRSESEK
              540       550        560       570       580         

      540       550       560       570       580       590        
pF1KA1 AEAEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLK
       . .: .:.:... ..     . :.     . :. ......  .......  . .      
CCDS61 S-TEVVPKKKIKKEQVETVPQATVKTGLQKGSADRGVQGSVRFSDSSVSAAIEETVD   
     590        600       610       620       630       640        

      600       610       620       630       640       650        
pF1KA1 KRNRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEVSVSSKKS




1365 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Wed Nov  2 20:27:08 2016 done: Wed Nov  2 20:27:09 2016
 Total Scan time:  4.250 Total Display time:  0.340

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com