Result of FASTA (ccds) for pF1KB3497
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB3497, 1437 aa
  1>>>pF1KB3497 1437 - 1437 aa - 1437 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 9.7389+/-0.00106; mu= 4.8861+/- 0.065
 mean_var=256.7960+/-50.397, 0's: 0 Z-trim(112.2): 65  B-trim: 6 in 1/52
 Lambda= 0.080035
 statistics sampled from 12925 (12977) to 12925 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.719), E-opt: 0.2 (0.399), width:  16
 Scan time:  4.700

The best scores are:                                      opt bits E(32554)
CCDS43729.1 WHSC1L1 gene_id:54904|Hs108|chr8       (1437) 9958 1164.2       0
CCDS6105.1 WHSC1L1 gene_id:54904|Hs108|chr8        ( 645) 4086 485.9 1.6e-136
CCDS33940.1 WHSC1 gene_id:7468|Hs108|chr4          (1365) 2691 325.1 8.7e-88
CCDS4413.1 NSD1 gene_id:64324|Hs108|chr5           (2427) 2608 315.7   1e-84
CCDS4412.1 NSD1 gene_id:64324|Hs108|chr5           (2696) 2608 315.7 1.1e-84
CCDS2749.2 SETD2 gene_id:29072|Hs108|chr3          (2564)  672 92.2 2.1e-17
CCDS1113.2 ASH1L gene_id:55870|Hs108|chr1          (2964)  658 90.6 7.4e-17
CCDS46999.1 WHSC1 gene_id:7468|Hs108|chr4          ( 629)  560 78.8 5.6e-14
CCDS3356.1 WHSC1 gene_id:7468|Hs108|chr4           ( 647)  560 78.8 5.7e-14


>>CCDS43729.1 WHSC1L1 gene_id:54904|Hs108|chr8            (1437 aa)
 initn: 9958 init1: 9958 opt: 9958  Z-score: 6224.0  bits: 1164.2 E(32554):    0
Smith-Waterman score: 9958; 100.0% identity (100.0% similar) in 1437 aa overlap (1-1437:1-1437)

               10        20        30        40        50        60
pF1KB3 MDFSFSFMQGIMGNTIQQPPQLIDSANIRQEDAFDNNSDIAEDGGQTPYEATLQQGFQYP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MDFSFSFMQGIMGNTIQQPPQLIDSANIRQEDAFDNNSDIAEDGGQTPYEATLQQGFQYP
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB3 ATTEDLPPLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYHSEIPNTR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ATTEDLPPLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYHSEIPNTR
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB3 PHEILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PHEILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEV
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB3 QASEHTKSKHESRKEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPRE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QASEHTKSKHESRKEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPRE
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB3 EPVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EPVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKI
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB3 NTRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKPR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NTRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKPR
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB3 PQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKTR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKTR
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KB3 RPRSVLNTQPEQTNAGEVASSLSSTEIRRHSQRRHTSAEEEEPPPVKIAWKTAAARKSLP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 RPRSVLNTQPEQTNAGEVASSLSSTEIRRHSQRRHTSAEEEEPPPVKIAWKTAAARKSLP
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KB3 ASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGIGNKTEISVRGQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGIGNKTEISVRGQ
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KB3 DRLIISTPNQRNEKPTQSVSSPEATSGSTGSVEKKQQRRSIRTRSESEKSTEVVPKKKIK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 DRLIISTPNQRNEKPTQSVSSPEATSGSTGSVEKKQQRRSIRTRSESEKSTEVVPKKKIK
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KB3 KEQVETVPQATVKTGLQKGASEISDSCKPLKKRSRASTDVEMTSSAYRDTSDSDSRGLSD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KEQVETVPQATVKTGLQKGASEISDSCKPLKKRSRASTDVEMTSSAYRDTSDSDSRGLSD
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KB3 LQVGFGKQVDSPSATADADVSDVQSMDSSLSRRGTGMSKKDTVCQICESSGDSLIPCEGE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LQVGFGKQVDSPSATADADVSDVQSMDSSLSRRGTGMSKKDTVCQICESSGDSLIPCEGE
              670       680       690       700       710       720

              730       740       750       760       770       780
pF1KB3 CCKHFHLECLGLASLPDSKFICMECKTGQHPCFSCKVSGKDVKRCSVGACGKFYHEACVR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 CCKHFHLECLGLASLPDSKFICMECKTGQHPCFSCKVSGKDVKRCSVGACGKFYHEACVR
              730       740       750       760       770       780

              790       800       810       820       830       840
pF1KB3 KFPTAIFESKGFRCPQHCCSACSMEKDIHKASKGRMMRCLRCPVAYHSGDACIAAGSMLV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KFPTAIFESKGFRCPQHCCSACSMEKDIHKASKGRMMRCLRCPVAYHSGDACIAAGSMLV
              790       800       810       820       830       840

              850       860       870       880       890       900
pF1KB3 SSYILICSNHSKRSSNSSAVNVGFCFVCARGLIVQDHSDPMFSSYAYKSHYLLNESNRAE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SSYILICSNHSKRSSNSSAVNVGFCFVCARGLIVQDHSDPMFSSYAYKSHYLLNESNRAE
              850       860       870       880       890       900

              910       920       930       940       950       960
pF1KB3 LMKLPMIPSSSASKKKCEKGGRLLCCESCPASFHPECLSIEMPEGCWNCNDCKAGKKLHY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LMKLPMIPSSSASKKKCEKGGRLLCCESCPASFHPECLSIEMPEGCWNCNDCKAGKKLHY
              910       920       930       940       950       960

              970       980       990      1000      1010      1020
pF1KB3 KQIVWVKLGNYRWWPAEICNPRSVPLNIQGLKHDLGDFPVFFFGSHDYYWVHQGRVFPYV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KQIVWVKLGNYRWWPAEICNPRSVPLNIQGLKHDLGDFPVFFFGSHDYYWVHQGRVFPYV
              970       980       990      1000      1010      1020

             1030      1040      1050      1060      1070      1080
pF1KB3 EGDKSFAEGQTSINKTFKKALEEAAKRFQELKAQRESKEALEIEKNSRKPPPYKHIKANK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EGDKSFAEGQTSINKTFKKALEEAAKRFQELKAQRESKEALEIEKNSRKPPPYKHIKANK
             1030      1040      1050      1060      1070      1080

             1090      1100      1110      1120      1130      1140
pF1KB3 VIGKVQIQVADLSEIPRCNCKPADENPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VIGKVQIQVADLSEIPRCNCKPADENPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFT
             1090      1100      1110      1120      1130      1140

             1150      1160      1170      1180      1190      1200
pF1KB3 KRLYPDAEIIKTERRGWGLRTKRSIKKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KRLYPDAEIIKTERRGWGLRTKRSIKKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFY
             1150      1160      1170      1180      1190      1200

             1210      1220      1230      1240      1250      1260
pF1KB3 MLTVTKDRIIDAGPKGNYSRFMNHSCNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MLTVTKDRIIDAGPKGNYSRFMNHSCNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFN
             1210      1220      1230      1240      1250      1260

             1270      1280      1290      1300      1310      1320
pF1KB3 YNLDCLGNGRTECHCGADNCSGFLGVRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 YNLDCLGNGRTECHCGADNCSGFLGVRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMH
             1270      1280      1290      1300      1310      1320

             1330      1340      1350      1360      1370      1380
pF1KB3 EDYCFQCGDGGELVMCDKKDCPKAYHLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EDYCFQCGDGGELVMCDKKDCPKAYHLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEF
             1330      1340      1350      1360      1370      1380

             1390      1400      1410      1420      1430       
pF1KB3 CPHSFCKDHEKGALVPSALEGRLCCSEHDPMAPVSPEYWSKIKCKWESQDHGEEVKE
       :::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 CPHSFCKDHEKGALVPSALEGRLCCSEHDPMAPVSPEYWSKIKCKWESQDHGEEVKE
             1390      1400      1410      1420      1430       

>>CCDS6105.1 WHSC1L1 gene_id:54904|Hs108|chr8             (645 aa)
 initn: 4188 init1: 4086 opt: 4086  Z-score: 2564.6  bits: 485.9 E(32554): 1.6e-136
Smith-Waterman score: 4086; 99.5% identity (100.0% similar) in 622 aa overlap (1-622:1-622)

               10        20        30        40        50        60
pF1KB3 MDFSFSFMQGIMGNTIQQPPQLIDSANIRQEDAFDNNSDIAEDGGQTPYEATLQQGFQYP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 MDFSFSFMQGIMGNTIQQPPQLIDSANIRQEDAFDNNSDIAEDGGQTPYEATLQQGFQYP
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB3 ATTEDLPPLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYHSEIPNTR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 ATTEDLPPLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYHSEIPNTR
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB3 PHEILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 PHEILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEV
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB3 QASEHTKSKHESRKEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPRE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 QASEHTKSKHESRKEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPRE
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB3 EPVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 EPVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKI
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB3 NTRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKPR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 NTRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKPR
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB3 PQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKTR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 PQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKTR
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KB3 RPRSVLNTQPEQTNAGEVASSLSSTEIRRHSQRRHTSAEEEEPPPVKIAWKTAAARKSLP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 RPRSVLNTQPEQTNAGEVASSLSSTEIRRHSQRRHTSAEEEEPPPVKIAWKTAAARKSLP
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KB3 ASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGIGNKTEISVRGQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 ASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGIGNKTEISVRGQ
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KB3 DRLIISTPNQRNEKPTQSVSSPEATSGSTGSVEKKQQRRSIRTRSESEKSTEVVPKKKIK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 DRLIISTPNQRNEKPTQSVSSPEATSGSTGSVEKKQQRRSIRTRSESEKSTEVVPKKKIK
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KB3 KEQVETVPQATVKTGLQKGASEISDSCKPLKKRSRASTDVEMTSSAYRDTSDSDSRGLSD
       :::::::::::::::::::...                                      
CCDS61 KEQVETVPQATVKTGLQKGSADRGVQGSVRFSDSSVSAAIEETVD               
              610       620       630       640                    

>>CCDS33940.1 WHSC1 gene_id:7468|Hs108|chr4               (1365 aa)
 initn: 3744 init1: 1867 opt: 2691  Z-score: 1689.5  bits: 325.1 E(32554): 8.7e-88
Smith-Waterman score: 4037; 46.6% identity (69.3% similar) in 1354 aa overlap (98-1409:66-1327)

        70        80        90       100       110          120    
pF1KB3 PLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYH---SEIPNTRP--H
                                     ::  :.  : :.:  .   :.. : .:  :
CCDS33 PSCEVNRECSVFLSKAQLSSSLQEGVMQKFNGHDAL-PFIPADKLKDLTSRVFNGEPGAH
          40        50        60        70         80        90    

            130       140       150       160       170       180  
pF1KB3 EILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEVQA
       .   .    :     ..: .. : :.:::::::::::: .::. :::::.:::   .:. 
CCDS33 DAKLR-FESQEMKGIGTPPNTTPIKNGSPEIKLKITKTYMNGKPLFESSICGDSAADVSQ
           100       110       120       130       140       150   

            190        200       210       220       230       240 
pF1KB3 SEHTKSKHESR-KEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPREE
       ::.. .: :.. ...::.: :.::   .      . .           .... :.:  . 
CCDS33 SEENGQKPENKARRNRKRSIKYDSLLEQGLVEAALVS-----------KISSPSDK--KI
           160       170       180       190                    200

             250       260       270       280       290       300 
pF1KB3 PVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKIN
       :. ::  :           . .  .:..:::::::::. :::::::::.:: :. .::..
CCDS33 PAKKESCPNTG-------RDKDHLLKYNVGDLVWSKVSGYPWWPCMVSADPLLHSYTKLK
              210              220       230       240       250   

               310       320       330       340       350         
pF1KB3 --TRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKP
          ..::.::::::.. :::::. :: .  ..:. :.:.:  :..::: ...:: :. ::
CCDS33 GQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQAPTKAEKIKLLKP
           260       270       280       290       300       310   

     360       370       380       390       400       410         
pF1KB3 RPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKT
          . ::::..::..::.: .:. :::  ..::.:.  : .   . ::..  .   . . 
CCDS33 ISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVAKEAGIAAESLGEM
           320       330       340       350       360       370   

     420       430       440          450       460          470   
pF1KB3 RRPRSVLNTQPEQTNAGEVASSLSSTEI---RRHSQRRHTSAEEEEPPP---VKIAWKTA
        .  .:      . .:.:  .:.    :   ::.  .  .:::  :  :    .   :::
CCDS33 AESSGV------SEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGKSTPQKTA
                 380       390       400       410       420       

             480       490       500       510       520        530
pF1KB3 AA--RKSLPASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGI-G
        :  :... .    .: .... .   . ...   ::         :  :. :       :
CCDS33 EADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQ-------KHRDEVVAEHPDASG
       430       440       450       460              470       480

              540       550        560       570       580         
pF1KB3 NKTEISVRGQDRLIISTPNQRNEKPTQ-SVSSPEATSGSTGSVEKKQQRRSIRTRSESEK
       .. :  .:.:  :.  . .:: .  :. .. .:  .  ..:.:. :.. .. : .. .: 
CCDS33 EEIEELLRSQWSLL--SEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTED
              490         500       510       520       530        

     590        600            610                   620       630 
pF1KB3 S-TEVVPKKKIKKEQ-----VETVPQATVKTGL------------QKGASEISDSCKPLK
       . .: .:.:... ..      .:. . :..:.             : .....::.:::::
CCDS33 AEAEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLK
      540       550       560       570       580       590        

             640       650       660        670       680       690
pF1KB3 KRSRASTDVEMTSSAYRDTSDSDSRGLSDLQVGFGKQ-VDSPSATADADVSDVQSMDSSL
       ::.:::: .  . .  ...: : :   .... . : .  .::  .::   ..: :..:. 
CCDS33 KRNRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEV-SVSSKK
      600       610       620       630       640       650        

              700       710       720       730       740       750
pF1KB3 SRRGTGMSKKDTVCQICESSGDSLIPCEGECCKHFHLECLGLASLPDSKFICMECKTGQH
       :.::.  .::. :::.::. : ::. ::: ::  ::: ::::.  :...: : :: .: :
CCDS33 SERGV-TAKKEYVCQLCEKPG-SLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIH
       660        670        680       690       700       710     

              760       770       780       790       800          
pF1KB3 PCFSCKVSGKDVKRCSVGACGKFYHEACVRKFPTAIFESKGFRCPQHCCSACSMEKDIH-
        :: :: :  ::::: :  ::::::::::.:.: ..:::.::::: : : .:   .  . 
CCDS33 SCFVCKESKTDVKRCVVTQCGKFYHEACVKKYPLTVFESRGFRCPLHSCVSCHASNPSNP
         720       730       740       750       760       770     

     810       820       830       840       850          860      
pF1KB3 KASKGRMMRCLRCPVAYHSGDACIAAGSMLVSSYILICSNH---SKRSSNSSAVNVGFCF
       . :::.::::.::::::::::::.:::  ...:  .::. :    : . . . :::..::
CCDS33 RPSKGKMMRCVRCPVAYHSGDACLAAGCSVIASNSIICTAHFTARKGKRHHAHVNVSWCF
         780       790       800       810       820       830     

        870       880       890       900       910       920      
pF1KB3 VCARGLIVQDHSDPMFSSYAYKSHYLLNESNRAELMKLPMIPSSSASKKKCEKGGRLLCC
       ::.                                                 ::: ::::
CCDS33 VCS-------------------------------------------------KGGSLLCC
                                                          840      

        930       940       950       960       970       980      
pF1KB3 ESCPASFHPECLSIEMPEGCWNCNDCKAGKKLHYKQIVWVKLGNYRWWPAEICNPRSVPL
       :::::.:::.::.::::.: : ::::.::::::...:.:::::::::::::.:.:..:: 
CCDS33 ESCPAAFHPDCLNIEMPDGSWFCNDCRAGKKLHFQDIIWVKLGNYRWWPAEVCHPKNVPP
        850       860       870       880       890       900      

        990      1000      1010      1020       1030      1040     
pF1KB3 NIQGLKHDLGDFPVFFFGSHDYYWVHQGRVFPYVEGDK-SFAEGQTSINKTFKKALEEAA
       ::: .::..:.::::::::.::::.::.:::::.:::. :  .:  .:...::.::.:: 
CCDS33 NIQKMKHEIGEFPVFFFGSKDYYWTHQARVFPYMEGDRGSRYQGVRGIGRVFKNALQEAE
        910       920       930       940       950       960      

        1050      1060      1070      1080      1090      1100     
pF1KB3 KRFQELKAQRESKEALEIEKNSRKPPPYKHIKANKVIGKVQIQVADLSEIPRCNCKPADE
        ::.:.: :::..:. : :   ::::::::::.::  ::::: .::.::::.:::::.::
CCDS33 ARFREIKLQREARETQESE---RKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKPTDE
        970       980          990      1000      1010      1020   

        1110      1120      1130      1140      1150      1160     
pF1KB3 NPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDAEIIKTERRGWGLRTKRSI
       ::::..::::::::..::::::::::. ::::::::: ::...::::. .:::: .::.:
CCDS33 NPCGFDSECLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAKRDI
          1030      1040      1050      1060      1070      1080   

        1170      1180      1190      1200      1210      1220     
pF1KB3 KKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIIDAGPKGNYSRFMNHS
       .::::::::::::::::::  :::.::::..:.:::::. ::::::::::::::::::::
CCDS33 RKGEFVNEYVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFMNHS
          1090      1100      1110      1120      1130      1140   

        1230      1240      1250      1260      1270      1280     
pF1KB3 CNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRTECHCGADNCSGFLG
       :.::::: :::::::.::::::.:::::: ::::::::::::: .: :.:::.:::::::
CCDS33 CQPNCETLKWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSGFLG
          1150      1160      1170      1180      1190      1200   

        1290      1300      1310      1320      1330      1340     
pF1KB3 VRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDGGELVMCDKKDCPKAY
        :::.. . ..:::.:..: : .::. : : :.. :: ::.:::::.::.::.: : :::
CCDS33 DRPKTSTTLSSEEKGKKTKKKTRRRRAKGEGKRQSEDECFRCGDGGQLVLCDRKFCTKAY
          1210      1220      1230      1240      1250      1260   

        1350      1360      1370      1380      1390      1400     
pF1KB3 HLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEFCPHSFCKDHEKGALVPSALEGRLCC
       :: ::.: . :.::::::::.:: :.. ..:::..::.::::.:. :.    . .::  :
CCDS33 HLSCLGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGRSYC
          1270      1280      1290      1300      1310      1320   

        1410      1420      1430                 
pF1KB3 SEHDPMAPVSPEYWSKIKCKWESQDHGEEVKE          
        :::                                      
CCDS33 CEHDLGAASVRSTKTEKPPPEPGKPKGKRRRRRGWRRVTEGK
          1330      1340      1350      1360     

>>CCDS4413.1 NSD1 gene_id:64324|Hs108|chr5                (2427 aa)
 initn: 3361 init1: 1938 opt: 2608  Z-score: 1634.2  bits: 315.7 E(32554): 1e-84
Smith-Waterman score: 3268; 39.3% identity (63.3% similar) in 1427 aa overlap (39-1413:606-1941)

       10        20        30        40        50        60        
pF1KB3 QGIMGNTIQQPPQLIDSANIRQEDAFDNNSDIAEDGGQTPYEATLQQGFQYPATTEDLPP
                                     :....: . : .  :   :.  :....  :
CCDS44 KTRDSSDIETAVVKHVLSELKELSYRSLGEDVSDSGTSKPSKPLL---FS-SASSQNHIP
         580       590       600       610       620           630 

       70              80        90          100       110         
pF1KB3 LTNGYPSSI------SVYETQTKYQSYNQYPN---GSANGFGAVRNFSPTDYYHSEIPNT
       .   :  :       ......:: :      :     . : :   . ::.   .  . . 
CCDS44 IEPDYKFSTLLMMLKDMHDSKTKEQRLMTAQNLVSYRSPGRGDCSTNSPVGVSKVLVSGG
             640       650       660       670       680       690 

     120       130         140       150       160       170       
pF1KB3 RPHEILEKPSPPQPP--PPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFES----SLC
         :.  .: .  :    : ::  ....     : :.. ..   ... :.:  :    : :
CCDS44 STHNSEKKGDGTQNSANPSPSGGDSAL-----SGELSASLPGLLSDKRDLPASGKSRSDC
             700       710            720       730       740      

           180       190       200        210       220       230  
pF1KB3 GDLLNEVQASEHTKSKHESRKEKRKKSNKHDSSRSE-ERKSHKIPKLEPEEQNRPNERVD
           :  ...  .: .     .  :.. .. . ..: .:: ...:..  .   . ...  
CCDS44 VTRRNCGRSKPSSKLRDAFSAQMVKNTVNRKALKTERKRKLNQLPSVTLDAVLQGDRERG
        750       760       770       780       790       800      

            240       250       260         270       280       290
pF1KB3 TVSEKPREEPVLKEEAPVQPILSSVPTTEVS--TGVKFQVGDLVWSKVGTYPWWPCMVSS
          .   :.:  ..: :.: :.. . . . .  . :.:. . .  :  :          .
CCDS44 GSLRGGAEDP--SKEDPLQ-IMGHLTSEDGDHFSDVHFD-SKVKQSDPGKISEKGLSFEN
        810         820        830       840        850       860  

              300       310         320         330       340      
pF1KB3 DPQLEVHTKINTRGAREYHVQFFSNQ--PERAW--VHEKRVREYKGHKQYEELLAEATKQ
           :. . .:... .   :    ::  :.. :  ....:..  :  ....:      :.
CCDS44 GKGPELDSVMNSENDELNGV----NQVVPKKRWQRLNQRRTKPRKRMNRFKE------KE
            870       880           890       900       910        

        350       360       370       380       390       400      
pF1KB3 ASNHSEKQKIRKPRPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQA
        :. . .  . .   :. : ..     :   . .. .:   ::     .:.   . :.  
CCDS44 NSECAFRVLLPSDPVQEGRDEFP---EHRTPSASILEEPLTEQNHADCLDSAGPR-LNVC
            920       930          940       950       960         

        410       420       430       440       450       460      
pF1KB3 KKSVASKTEVKKTRRPRSVLNTQPEQTNAGEVASSLSSTEIRRHSQRRHTSAEEEEP--P
        :: ::  ...:  .: .. .  : :..  : :    . ..:. :.     .:: .    
CCDS44 DKSSASIGDMEK--EP-GIPSLTP-QAELPEPAVRSEKKRLRKPSKWLLEYTEEYDQIFA
      970       980           990      1000      1010      1020    

          470             480       490       500        510       
pF1KB3 PVKIAWKT------AAARKSLPASITMHKGSLDLQKCNMSPVVKI-EQVFALQNATGDGK
       : :   :.      ...:    . ..  ..: . .. . . ...  :.  .:.    .. 
CCDS44 PKKKQKKVQEQVHKVSSRCEEESLLARGRSSAQNKQVDENSLISTKEEPPVLER---EAP
         1030      1040      1050      1060      1070         1080 

       520       530       540       550       560       570       
pF1KB3 FIDQFVYSTKGIGNKTEISVRGQDRLIISTPNQRNEKPTQSVSSPEATSGSTGSVEKKQQ
       :..  . ...  :...:.      .: .:.:   . .:  .. : :    . :. :.:.:
CCDS44 FLEGPLAQSELGGGHAELP-----QLTLSVPVAPEVSPRPALESEELLVKTPGNYESKRQ
            1090      1100           1110      1120      1130      

       580        590          600            610           620    
pF1KB3 RRSIRTRSESEK-STEVVPKKK---IKKE-----QVETVPQATVKTGLQK----GASEIS
       :.  .   ::.  .   .:::    ..:.     ..:.    .  :. .:    :...: 
CCDS44 RKPTKKLLESNDLDPGFMPKKGDLGLSKKCYEAGHLENGITESCATSYSKDFGGGTTKIF
       1140      1150      1160      1170      1180      1190      

          630       640       650       660       670       680    
pF1KB3 DSCKPLKKRSRASTDVEMTSSAYRDTSDSDSRGLSDLQVGFGKQVDSPSATADADVSDVQ
       :  :: :.. .  . ..:  .  .. ..:     :. ..   . . ::. :..  :    
CCDS44 D--KPRKRKRQRHAAAKMQCKKVKNDDSSKEIPGSEGELMPHRTATSPKETVEEGVEHDP
         1200      1210      1220      1230      1240      1250    

             690       700       710       720       730       740 
pF1KB3 SMDSS---LSRRGTGMSKKDTVCQICESSGDSLIPCEGECCKHFHLECLGLASLPDSKFI
       .: .:    ..:: : . :..::: ::. :. :. ::..::  ::::::::. .: .:::
CCDS44 GMPASKKMQGERGGGAALKENVCQNCEKLGELLL-CEAQCCGAFHLECLGLTEMPRGKFI
         1260      1270      1280       1290      1300      1310   

             750       760       770       780       790       800 
pF1KB3 CMECKTGQHPCFSCKVSGKDVKRCSVGACGKFYHEACVRKFPTAIFESKGFRCPQHCCSA
       : ::.:: : :: :: ::.::::: .  ::::::: ::.:.: .....:::::  : : .
CCDS44 CNECRTGIHTCFVCKQSGEDVKRCLLPLCGKFYHEECVQKYPPTVMQNKGFRCSLHICIT
          1320      1330      1340      1350      1360      1370   

              810       820       830       840       850          
pF1KB3 CSMEKDIH-KASKGRMMRCLRCPVAYHSGDACIAAGSMLVSSYILICSNH--SKRSS-NS
       :   .  . .:::::.:::.:::::::..: :.:::: ...:  .:: ::   .:.  : 
CCDS44 CHAANPANVSASKGRLMRCVRCPVAYHANDFCLAAGSKILASNSIICPNHFTPRRGCRNH
          1380      1390      1400      1410      1420      1430   

       860       870       880       890       900       910       
pF1KB3 SAVNVGFCFVCARGLIVQDHSDPMFSSYAYKSHYLLNESNRAELMKLPMIPSSSASKKKC
         :::..::::.                                                
CCDS44 EHVNVSWCFVCS------------------------------------------------
          1440                                                     

       920       930       940       950       960       970       
pF1KB3 EKGGRLLCCESCPASFHPECLSIEMPEGCWNCNDCKAGKKLHYKQIVWVKLGNYRWWPAE
        .:: ::::.::::.:: :::.:..::: : ::::::::: ::..:::::.: :::::::
CCDS44 -EGGSLLCCDSCPAAFHRECLNIDIPEGNWYCNDCKAGKKPHYREIVWVKVGRYRWWPAE
         1450      1460      1470      1480      1490      1500    

       980       990      1000      1010      1020      1030       
pF1KB3 ICNPRSVPLNIQGLKHDLGDFPVFFFGSHDYYWVHQGRVFPYVEGDKSFAEGQ-TSINKT
       ::.::.:: ::. ..::.:.:::.::::.:: :.::.:::::.::: :  . .  ... :
CCDS44 ICHPRAVPSNIDKMRHDVGEFPVLFFGSNDYLWTHQARVFPYMEGDVSSKDKMGKGVDGT
         1510      1520      1530      1540      1550      1560    

       1040      1050      1060      1070      1080      1090      
pF1KB3 FKKALEEAAKRFQELKAQRESKEALEIEKNSRKPPPYKHIKANKVIGKVQIQVADLSEIP
       .::::.::: ::.:::::.: ..  : .::..:::::::::.:. ::.::: .:::::::
CCDS44 YKKALQEAAARFEELKAQKELRQLQEDRKNDKKPPPYKHIKVNRPIGRVQIFTADLSEIP
         1570      1580      1590      1600      1610      1620    

       1100      1110      1120      1130      1140      1150      
pF1KB3 RCNCKPADENPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDAEIIKTERRG
       ::::: .::::::..:::.:::: ::::: ::::: :::::::.:: ::..::..: .::
CCDS44 RCNCKATDENPCGIDSECINRMLLYECHPTVCPAGGRCQNQCFSKRQYPEVEIFRTLQRG
         1630      1640      1650      1660      1670      1680    

       1160      1170      1180      1190      1200      1210      
pF1KB3 WGLRTKRSIKKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIIDAGPKG
       :::::: .::::::::::::::::::::: ::. :.:...:::::::. :::::::::::
CCDS44 WGLRTKTDIKKGEFVNEYVGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIIDAGPKG
         1690      1700      1710      1720      1730      1740    

       1220      1230      1240      1250      1260      1270      
pF1KB3 NYSRFMNHSCNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRTECHCG
       ::.::::: :.::::::::.::::.::::::: :: :: ::::::::.:::::.: :.::
CCDS44 NYARFMNHCCQPNCETQKWSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKTVCKCG
         1750      1760      1770      1780      1790      1800    

       1280      1290      1300      1310      1320      1330      
pF1KB3 ADNCSGFLGVRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDGGELVMC
       : :::::::::::.   .:.:.. :  : .: .:. . :  . .:: ::.:::.:.:: :
CCDS44 APNCSGFLGVRPKNQPIATEEKSKKFKKKQQGKRRTQGEITKEREDECFSCGDAGQLVSC
         1810      1820      1830      1840      1850      1860    

       1340      1350      1360      1370      1380      1390      
pF1KB3 DKKDCPKAYHLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEFCPHSFCKDHEKGALVP
        :  :::.::  :::::. : ::::::::::: :.. :.::::.:: ::::.:..: :  
CCDS44 KKPGCPKVYHADCLNLTKRPAGKWECPWHQCDICGKEAASFCEMCPSSFCKQHREGMLFI
         1870      1880      1890      1900      1910      1920    

       1400      1410      1420      1430                          
pF1KB3 SALEGRLCCSEHDPMAPVSPEYWSKIKCKWESQDHGEEVKE                   
       : :.::: :.:::: .:                                           
CCDS44 SKLDGRLSCTEHDPCGPNPLEPGEIREYVPPPVPLPPGPSTHLAEQSTGMAAQAPKMSDK
         1930      1940      1950      1960      1970      1980    

>>CCDS4412.1 NSD1 gene_id:64324|Hs108|chr5                (2696 aa)
 initn: 3440 init1: 1938 opt: 2608  Z-score: 1633.6  bits: 315.7 E(32554): 1.1e-84
Smith-Waterman score: 3268; 39.3% identity (63.3% similar) in 1427 aa overlap (39-1413:875-2210)

       10        20        30        40        50        60        
pF1KB3 QGIMGNTIQQPPQLIDSANIRQEDAFDNNSDIAEDGGQTPYEATLQQGFQYPATTEDLPP
                                     :....: . : .  :   :.  :....  :
CCDS44 KTRDSSDIETAVVKHVLSELKELSYRSLGEDVSDSGTSKPSKPLL---FS-SASSQNHIP
          850       860       870       880          890        900

       70              80        90          100       110         
pF1KB3 LTNGYPSSI------SVYETQTKYQSYNQYPN---GSANGFGAVRNFSPTDYYHSEIPNT
       .   :  :       ......:: :      :     . : :   . ::.   .  . . 
CCDS44 IEPDYKFSTLLMMLKDMHDSKTKEQRLMTAQNLVSYRSPGRGDCSTNSPVGVSKVLVSGG
              910       920       930       940       950       960

     120       130         140       150       160       170       
pF1KB3 RPHEILEKPSPPQPP--PPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFES----SLC
         :.  .: .  :    : ::  ....     : :.. ..   ... :.:  :    : :
CCDS44 STHNSEKKGDGTQNSANPSPSGGDSAL-----SGELSASLPGLLSDKRDLPASGKSRSDC
              970       980            990      1000      1010     

           180       190       200        210       220       230  
pF1KB3 GDLLNEVQASEHTKSKHESRKEKRKKSNKHDSSRSE-ERKSHKIPKLEPEEQNRPNERVD
           :  ...  .: .     .  :.. .. . ..: .:: ...:..  .   . ...  
CCDS44 VTRRNCGRSKPSSKLRDAFSAQMVKNTVNRKALKTERKRKLNQLPSVTLDAVLQGDRERG
        1020      1030      1040      1050      1060      1070     

            240       250       260         270       280       290
pF1KB3 TVSEKPREEPVLKEEAPVQPILSSVPTTEVS--TGVKFQVGDLVWSKVGTYPWWPCMVSS
          .   :.:  ..: :.: :.. . . . .  . :.:. . .  :  :          .
CCDS44 GSLRGGAEDP--SKEDPLQ-IMGHLTSEDGDHFSDVHFD-SKVKQSDPGKISEKGLSFEN
        1080        1090       1100      1110       1120      1130 

              300       310         320         330       340      
pF1KB3 DPQLEVHTKINTRGAREYHVQFFSNQ--PERAW--VHEKRVREYKGHKQYEELLAEATKQ
           :. . .:... .   :    ::  :.. :  ....:..  :  ....:      :.
CCDS44 GKGPELDSVMNSENDELNGV----NQVVPKKRWQRLNQRRTKPRKRMNRFKE------KE
            1140      1150          1160      1170            1180 

        350       360       370       380       390       400      
pF1KB3 ASNHSEKQKIRKPRPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQA
        :. . .  . .   :. : ..     :   . .. .:   ::     .:.   . :.  
CCDS44 NSECAFRVLLPSDPVQEGRDEFP---EHRTPSASILEEPLTEQNHADCLDSAGPR-LNVC
            1190      1200         1210      1220      1230        

        410       420       430       440       450       460      
pF1KB3 KKSVASKTEVKKTRRPRSVLNTQPEQTNAGEVASSLSSTEIRRHSQRRHTSAEEEEP--P
        :: ::  ...:  .: .. .  : :..  : :    . ..:. :.     .:: .    
CCDS44 DKSSASIGDMEK--EP-GIPSLTP-QAELPEPAVRSEKKRLRKPSKWLLEYTEEYDQIFA
      1240        1250        1260      1270      1280      1290   

          470             480       490       500        510       
pF1KB3 PVKIAWKT------AAARKSLPASITMHKGSLDLQKCNMSPVVKI-EQVFALQNATGDGK
       : :   :.      ...:    . ..  ..: . .. . . ...  :.  .:.    .. 
CCDS44 PKKKQKKVQEQVHKVSSRCEEESLLARGRSSAQNKQVDENSLISTKEEPPVLER---EAP
          1300      1310      1320      1330      1340         1350

       520       530       540       550       560       570       
pF1KB3 FIDQFVYSTKGIGNKTEISVRGQDRLIISTPNQRNEKPTQSVSSPEATSGSTGSVEKKQQ
       :..  . ...  :...:.      .: .:.:   . .:  .. : :    . :. :.:.:
CCDS44 FLEGPLAQSELGGGHAELP-----QLTLSVPVAPEVSPRPALESEELLVKTPGNYESKRQ
             1360           1370      1380      1390      1400     

       580        590          600            610           620    
pF1KB3 RRSIRTRSESEK-STEVVPKKK---IKKE-----QVETVPQATVKTGLQK----GASEIS
       :.  .   ::.  .   .:::    ..:.     ..:.    .  :. .:    :...: 
CCDS44 RKPTKKLLESNDLDPGFMPKKGDLGLSKKCYEAGHLENGITESCATSYSKDFGGGTTKIF
        1410      1420      1430      1440      1450      1460     

          630       640       650       660       670       680    
pF1KB3 DSCKPLKKRSRASTDVEMTSSAYRDTSDSDSRGLSDLQVGFGKQVDSPSATADADVSDVQ
       :  :: :.. .  . ..:  .  .. ..:     :. ..   . . ::. :..  :    
CCDS44 D--KPRKRKRQRHAAAKMQCKKVKNDDSSKEIPGSEGELMPHRTATSPKETVEEGVEHDP
          1470      1480      1490      1500      1510      1520   

             690       700       710       720       730       740 
pF1KB3 SMDSS---LSRRGTGMSKKDTVCQICESSGDSLIPCEGECCKHFHLECLGLASLPDSKFI
       .: .:    ..:: : . :..::: ::. :. :. ::..::  ::::::::. .: .:::
CCDS44 GMPASKKMQGERGGGAALKENVCQNCEKLGELLL-CEAQCCGAFHLECLGLTEMPRGKFI
          1530      1540      1550       1560      1570      1580  

             750       760       770       780       790       800 
pF1KB3 CMECKTGQHPCFSCKVSGKDVKRCSVGACGKFYHEACVRKFPTAIFESKGFRCPQHCCSA
       : ::.:: : :: :: ::.::::: .  ::::::: ::.:.: .....:::::  : : .
CCDS44 CNECRTGIHTCFVCKQSGEDVKRCLLPLCGKFYHEECVQKYPPTVMQNKGFRCSLHICIT
           1590      1600      1610      1620      1630      1640  

              810       820       830       840       850          
pF1KB3 CSMEKDIH-KASKGRMMRCLRCPVAYHSGDACIAAGSMLVSSYILICSNH--SKRSS-NS
       :   .  . .:::::.:::.:::::::..: :.:::: ...:  .:: ::   .:.  : 
CCDS44 CHAANPANVSASKGRLMRCVRCPVAYHANDFCLAAGSKILASNSIICPNHFTPRRGCRNH
           1650      1660      1670      1680      1690      1700  

       860       870       880       890       900       910       
pF1KB3 SAVNVGFCFVCARGLIVQDHSDPMFSSYAYKSHYLLNESNRAELMKLPMIPSSSASKKKC
         :::..::::.                                                
CCDS44 EHVNVSWCFVCS------------------------------------------------
           1710                                                    

       920       930       940       950       960       970       
pF1KB3 EKGGRLLCCESCPASFHPECLSIEMPEGCWNCNDCKAGKKLHYKQIVWVKLGNYRWWPAE
        .:: ::::.::::.:: :::.:..::: : ::::::::: ::..:::::.: :::::::
CCDS44 -EGGSLLCCDSCPAAFHRECLNIDIPEGNWYCNDCKAGKKPHYREIVWVKVGRYRWWPAE
          1720      1730      1740      1750      1760      1770   

       980       990      1000      1010      1020      1030       
pF1KB3 ICNPRSVPLNIQGLKHDLGDFPVFFFGSHDYYWVHQGRVFPYVEGDKSFAEGQ-TSINKT
       ::.::.:: ::. ..::.:.:::.::::.:: :.::.:::::.::: :  . .  ... :
CCDS44 ICHPRAVPSNIDKMRHDVGEFPVLFFGSNDYLWTHQARVFPYMEGDVSSKDKMGKGVDGT
          1780      1790      1800      1810      1820      1830   

       1040      1050      1060      1070      1080      1090      
pF1KB3 FKKALEEAAKRFQELKAQRESKEALEIEKNSRKPPPYKHIKANKVIGKVQIQVADLSEIP
       .::::.::: ::.:::::.: ..  : .::..:::::::::.:. ::.::: .:::::::
CCDS44 YKKALQEAAARFEELKAQKELRQLQEDRKNDKKPPPYKHIKVNRPIGRVQIFTADLSEIP
          1840      1850      1860      1870      1880      1890   

       1100      1110      1120      1130      1140      1150      
pF1KB3 RCNCKPADENPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDAEIIKTERRG
       ::::: .::::::..:::.:::: ::::: ::::: :::::::.:: ::..::..: .::
CCDS44 RCNCKATDENPCGIDSECINRMLLYECHPTVCPAGGRCQNQCFSKRQYPEVEIFRTLQRG
          1900      1910      1920      1930      1940      1950   

       1160      1170      1180      1190      1200      1210      
pF1KB3 WGLRTKRSIKKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIIDAGPKG
       :::::: .::::::::::::::::::::: ::. :.:...:::::::. :::::::::::
CCDS44 WGLRTKTDIKKGEFVNEYVGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIIDAGPKG
          1960      1970      1980      1990      2000      2010   

       1220      1230      1240      1250      1260      1270      
pF1KB3 NYSRFMNHSCNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRTECHCG
       ::.::::: :.::::::::.::::.::::::: :: :: ::::::::.:::::.: :.::
CCDS44 NYARFMNHCCQPNCETQKWSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKTVCKCG
          2020      2030      2040      2050      2060      2070   

       1280      1290      1300      1310      1320      1330      
pF1KB3 ADNCSGFLGVRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDGGELVMC
       : :::::::::::.   .:.:.. :  : .: .:. . :  . .:: ::.:::.:.:: :
CCDS44 APNCSGFLGVRPKNQPIATEEKSKKFKKKQQGKRRTQGEITKEREDECFSCGDAGQLVSC
          2080      2090      2100      2110      2120      2130   

       1340      1350      1360      1370      1380      1390      
pF1KB3 DKKDCPKAYHLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEFCPHSFCKDHEKGALVP
        :  :::.::  :::::. : ::::::::::: :.. :.::::.:: ::::.:..: :  
CCDS44 KKPGCPKVYHADCLNLTKRPAGKWECPWHQCDICGKEAASFCEMCPSSFCKQHREGMLFI
          2140      2150      2160      2170      2180      2190   

       1400      1410      1420      1430                          
pF1KB3 SALEGRLCCSEHDPMAPVSPEYWSKIKCKWESQDHGEEVKE                   
       : :.::: :.:::: .:                                           
CCDS44 SKLDGRLSCTEHDPCGPNPLEPGEIREYVPPPVPLPPGPSTHLAEQSTGMAAQAPKMSDK
          2200      2210      2220      2230      2240      2250   

>>CCDS2749.2 SETD2 gene_id:29072|Hs108|chr3               (2564 aa)
 initn: 843 init1: 587 opt: 672  Z-score: 425.8  bits: 92.2 E(32554): 2.1e-17
Smith-Waterman score: 672; 35.8% identity (66.2% similar) in 293 aa overlap (1021-1313:1433-1712)

             1000      1010      1020      1030      1040      1050
pF1KB3 LKHDLGDFPVFFFGSHDYYWVHQGRVFPYVEGDKSFAEGQTSINKTFKKALEEAAKRFQE
                                     .:. :   :.. .. .      .  .:..:
CCDS27 PLKKRRQEIESDSESDGELQDRKKVRVEVEQGETSVPPGSALVGPSCVMDDFRDPQRWKE
           1410      1420      1430      1440      1450      1460  

             1060      1070      1080      1090      1100      1110
pF1KB3 LKAQRESKEALEIEKNSRKPPPYKHIKANKVIGKVQIQVADLSEIPRCNCKPADENPCGL
          : .    ... ...      :. :... : ..: . . ::.  : .     :  :: 
CCDS27 CAKQGKMPCYFDLIEENVYLTERKKNKSHRDIKRMQCECTPLSKDERAQ----GEIACG-
           1470      1480      1490      1500      1510            

             1120      1130      1140      1150      1160      1170
pF1KB3 ESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDAEIIKTERRGWGLRTKRSIKKGEF
         .::::.:. ::  . :: :: :.:. : .. . :.:.: ::..:::::. ... .. :
CCDS27 -EDCLNRLLMIECSSR-CPNGDYCSNRRFQRKQHADVEVILTEKKGWGLRAAKDLPSNTF
       1520      1530       1540      1550      1560      1570     

             1180      1190      1200      1210      1220      1230
pF1KB3 VNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIIDAGPKGNYSRFMNHSCNPNC
       : :: ::..:..: . :.:.  .:.  ..:.... .:.::::  ::: ::::::::.:::
CCDS27 VLEYCGEVLDHKEFKARVKEYARNKNIHYYFMALKNDEIIDATQKGNCSRFMNHSCEPNC
        1580      1590      1600      1610      1620      1630     

             1240      1250      1260      1270      1280      1290
pF1KB3 ETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRTECHCGADNCSGFLGVRPKS
       :::::::::..:::.:.   .:.: ::::.:...  :.   .: ::. :: :.:: . . 
CCDS27 ETQKWTVNGQLRVGFFTTKLVPSGSELTFDYQFQRYGKEAQKCFCGSANCRGYLGGENRV
        1640      1650      1660      1670      1680      1690     

             1300      1310      1320      1330      1340      1350
pF1KB3 ACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDGGELVMCDKKDCPKAYHLLCL
       .       .: ..:.:..: . :                                     
CCDS27 SI------RAAGGKMKKERSRKKDSVDGELEALMENGEGLSDKNQVLSLSRLMVRIETLE
              1700      1710      1720      1730      1740         

>>CCDS1113.2 ASH1L gene_id:55870|Hs108|chr1               (2964 aa)
 initn: 500 init1: 332 opt: 658  Z-score: 416.1  bits: 90.6 E(32554): 7.4e-17
Smith-Waterman score: 658; 38.3% identity (69.0% similar) in 261 aa overlap (1068-1321:2062-2316)

      1040      1050      1060      1070        1080      1090     
pF1KB3 KKALEEAAKRFQELKAQRESKEALEIEKNSRKP--PPYKHIKANKVIGKVQIQVADLS--
                                     .::  : ::.:..:     : ..:  ::  
CCDS11 IHVGKYLRQKRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSN-----VYVDVKPLSGY
            2040      2050      2060      2070           2080      

          1100       1110      1120      1130      1140       1150 
pF1KB3 EIPRCNCK-PADENPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDA-EIIK
       :   :::: : :..  :  ..:::::.  :: :..:: :..: :: . .. . .  : ..
CCDS11 EATTCNCKKPDDDTRKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFR
       2090      2100      2110      2120      2130      2140      

            1160      1170      1180      1190      1200      1210 
pF1KB3 TERRGWGLRTKRSIKKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIID
       .:..:::.:::. .: :.:. ::.::...:.: : :. . ..:  .. : :.. .  .::
CCDS11 AEEKGWGIRTKEPLKAGQFIIEYLGEVVSEQEFRNRMIEQYHNH-SDHYCLNLDSGMVID
       2150      2160      2170      2180      2190       2200     

            1220      1230      1240      1250      1260      1270 
pF1KB3 AGPKGNYSRFMNHSCNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRT
       .   :: .::.::::.:::: :::.:::  :.::.:: :.::: :::..::.  ..  . 
CCDS11 SYRMGNEARFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQ
        2210      2220      2230      2240      2250      2260     

             1280      1290      1300      1310      1320      1330
pF1KB3 E-CHCGADNCSGFLGVRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDG
       . :.:: ..: :..: . . . . :. ....    ..:  . : . :. :.         
CCDS11 QLCKCGFEKCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLS
        2270      2280      2290      2300      2310      2320     

             1340      1350      1360      1370      1380      1390
pF1KB3 GELVMCDKKDCPKAYHLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEFCPHSFCKDHE
                                                                   
CCDS11 EEPSENINTPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHS
        2330      2340      2350      2360      2370      2380     

>>CCDS46999.1 WHSC1 gene_id:7468|Hs108|chr4               (629 aa)
 initn: 776 init1: 323 opt: 560  Z-score: 364.4  bits: 78.8 E(32554): 5.6e-14
Smith-Waterman score: 772; 31.1% identity (59.3% similar) in 604 aa overlap (98-663:66-628)

        70        80        90       100       110          120    
pF1KB3 PLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYH---SEIPNTRP--H
                                     ::  :.  : :.:  .   :.. : .:  :
CCDS46 PSCEVNRECSVFLSKAQLSSSLQEGVMQKFNGHDAL-PFIPADKLKDLTSRVFNGEPGAH
          40        50        60        70         80        90    

            130       140       150       160       170       180  
pF1KB3 EILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEVQA
       .   .    :     ..: .. : :.:::::::::::: .::. :::::.:::   .:. 
CCDS46 DAKLR-FESQEMKGIGTPPNTTPIKNGSPEIKLKITKTYMNGKPLFESSICGDSAADVSQ
           100       110       120       130       140       150   

            190        200       210       220       230       240 
pF1KB3 SEHTKSKHESR-KEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPREE
       ::.. .: :.. ...::.: :.::   .      . .           .... :.:  . 
CCDS46 SEENGQKPENKARRNRKRSIKYDSLLEQGLVEAALVS-----------KISSPSDK--KI
           160       170       180       190                    200

             250       260         270       280       290         
pF1KB3 PVLKEEAPVQPILSSVPTT--EVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTK
       :. ::         : :.:  . .  .:..:::::::::. :::::::::.:: :. .::
CCDS46 PAKKE---------SCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMVSADPLLHSYTK
                       210       220       230       240       250 

     300         310       320       330       340       350       
pF1KB3 IN--TRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIR
       ..   ..::.::::::.. :::::. :: .  ..:. :.:.:  :..::: ...:: :. 
CCDS46 LKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQAPTKAEKIKLL
             260       270       280       290       300       310 

       360       370       380       390       400       410       
pF1KB3 KPRPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVK
       ::   . ::::..::..::.: .:. :::  ..::.:.  : .   . ::..  .   . 
CCDS46 KPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVAKEAGIAAESLG
             320       330       340       350       360       370 

       420       430       440          450       460          470 
pF1KB3 KTRRPRSVLNTQPEQTNAGEVASSLSSTEI---RRHSQRRHTSAEEEEPPP---VKIAWK
       .  .  .:      . .:.:  .:.    :   ::.  .  .:::  :  :    .   :
CCDS46 EMAESSGV------SEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGKSTPQK
                   380       390       400       410       420     

               480       490       500       510       520         
pF1KB3 TAAA--RKSLPASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGI
       :: :  :... .    .: .... .   . ...   ::  ..        :. :      
CCDS46 TAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHR-------DEVVAEHPDA
         430       440       450       460              470        

      530       540       550        560       570       580       
pF1KB3 -GNKTEISVRGQDRLIISTPNQRNEKPTQ-SVSSPEATSGSTGSVEKKQQRRSIRTRSES
        :.. :  .:.:  :.  . .:: .  :. .. .:  .  ..:.:. :.. .. : .. .
CCDS46 SGEEIEELLRSQWSLL--SEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPT
      480       490         500       510       520       530      

       590        600            610                   620         
pF1KB3 EKS-TEVVPKKKIKKEQ-----VETVPQATVKTGL------------QKGASEISDSCKP
       : . .: .:.:... ..      .:. . :..:.             : .....::.:::
CCDS46 EDAEAEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKP
        540       550       560       570       580       590      

     630       640       650       660       670       680         
pF1KB3 LKKRSRASTDVEMTSSAYRDTSDSDSRGLSDLQVGFGKQVDSPSATADADVSDVQSMDSS
       ::::.:::: .  .:.   . :.: : .:.. .:                          
CCDS46 LKKRNRASTAA--SSALGFSKSSSPSASLTENEVK                         
        600         610       620                                  

     690       700       710       720       730       740         
pF1KB3 LSRRGTGMSKKDTVCQICESSGDSLIPCEGECCKHFHLECLGLASLPDSKFICMECKTGQ

>>CCDS3356.1 WHSC1 gene_id:7468|Hs108|chr4                (647 aa)
 initn: 776 init1: 323 opt: 560  Z-score: 364.2  bits: 78.8 E(32554): 5.7e-14
Smith-Waterman score: 769; 31.0% identity (58.6% similar) in 594 aa overlap (98-655:66-622)

        70        80        90       100       110          120    
pF1KB3 PLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYH---SEIPNTRP--H
                                     ::  :.  : :.:  .   :.. : .:  :
CCDS33 PSCEVNRECSVFLSKAQLSSSLQEGVMQKFNGHDAL-PFIPADKLKDLTSRVFNGEPGAH
          40        50        60        70         80        90    

            130       140       150       160       170       180  
pF1KB3 EILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEVQA
       .   .    :     ..: .. : :.:::::::::::: .::. :::::.:::   .:. 
CCDS33 DAKLR-FESQEMKGIGTPPNTTPIKNGSPEIKLKITKTYMNGKPLFESSICGDSAADVSQ
           100       110       120       130       140       150   

            190        200       210       220       230       240 
pF1KB3 SEHTKSKHESR-KEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPREE
       ::.. .: :.. ...::.: :.::   .      . .           .... :.:  . 
CCDS33 SEENGQKPENKARRNRKRSIKYDSLLEQGLVEAALVS-----------KISSPSDK--KI
           160       170       180       190                    200

             250       260       270       280       290       300 
pF1KB3 PVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKIN
       :. ::  :           . .  .:..:::::::::. :::::::::.:: :. .::..
CCDS33 PAKKESCPNTG-------RDKDHLLKYNVGDLVWSKVSGYPWWPCMVSADPLLHSYTKLK
              210              220       230       240       250   

               310       320       330       340       350         
pF1KB3 --TRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKP
          ..::.::::::.. :::::. :: .  ..:. :.:.:  :..::: ...:: :. ::
CCDS33 GQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQAPTKAEKIKLLKP
           260       270       280       290       300       310   

     360       370       380       390       400       410         
pF1KB3 RPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKT
          . ::::..::..::.: .:. :::  ..::.:.  : .   . ::..  .   . . 
CCDS33 ISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVAKEAGIAAESLGEM
           320       330       340       350       360       370   

     420       430       440          450       460          470   
pF1KB3 RRPRSVLNTQPEQTNAGEVASSLSSTEI---RRHSQRRHTSAEEEEPPP---VKIAWKTA
        .  .:      . .:.:  .:.    :   ::.  .  .:::  :  :    .   :::
CCDS33 AESSGV------SEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGKSTPQKTA
                 380       390       400       410       420       

             480       490       500       510       520        530
pF1KB3 AA--RKSLPASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGI-G
        :  :... .    .: .... .   . ...   ::         :  :. :       :
CCDS33 EADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFC-------QKHRDEVVAEHPDASG
       430       440       450       460              470       480

              540       550        560       570       580         
pF1KB3 NKTEISVRGQDRLIISTPNQRNEKPTQ-SVSSPEATSGSTGSVEKKQQRRSIRTRSESEK
       .. :  .:.:  :.  . .:: .  :. .. .:  .  ..:.:. :.. .. : .. .: 
CCDS33 EEIEELLRSQWSLL--SEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTED
              490         500       510       520       530        

     590        600            610                   620       630 
pF1KB3 S-TEVVPKKKIKKEQ-----VETVPQATVKTGL------------QKGASEISDSCKPLK
       . .: .:.:... ..      .:. . :..:.             : .....::.:::::
CCDS33 AEAEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLK
      540       550       560       570       580       590        

             640       650       660       670       680       690 
pF1KB3 KRSRASTDVEMTSSAYRDTSDSDSRGLSDLQVGFGKQVDSPSATADADVSDVQSMDSSLS
       ::.:::: .  . .  ...: : :                                    
CCDS33 KRNRASTAASSALGFSKSSSPSASLTENELLWEPTPVKLDLNPAALYCT           
      600       610       620       630       640                  




1437 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Wed Nov  2 22:46:59 2016 done: Wed Nov  2 22:47:00 2016
 Total Scan time:  4.700 Total Display time:  0.370

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com