Result of FASTA (ccds) for pF1KB6219
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB6219, 669 aa
  1>>>pF1KB6219 669 - 669 aa - 669 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 8.0624+/-0.000867; mu= 7.9331+/- 0.052
 mean_var=159.1131+/-31.356, 0's: 0 Z-trim(112.6): 50  B-trim: 7 in 1/50
 Lambda= 0.101677
 statistics sampled from 13304 (13349) to 13304 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.743), E-opt: 0.2 (0.41), width:  16
 Scan time:  3.630

The best scores are:                                      opt bits E(32554)
CCDS12681.2 HIF3A gene_id:64344|Hs108|chr19        ( 669) 4499 672.0 7.5e-193
CCDS12682.1 HIF3A gene_id:64344|Hs108|chr19        ( 667) 4453 665.2 8.1e-191
CCDS42580.2 HIF3A gene_id:64344|Hs108|chr19        ( 600) 3728 558.9 7.6e-159
CCDS58324.1 HIF1A gene_id:3091|Hs108|chr14         ( 850) 1350 210.1   1e-53
CCDS9754.1 HIF1A gene_id:3091|Hs108|chr14          ( 735) 1345 209.4 1.5e-53
CCDS9753.1 HIF1A gene_id:3091|Hs108|chr14          ( 826) 1345 209.4 1.7e-53
CCDS1825.1 EPAS1 gene_id:2034|Hs108|chr2           ( 870) 1293 201.8 3.5e-51
CCDS13646.1 SIM2 gene_id:6493|Hs108|chr21          ( 667)  807 130.4   8e-30
CCDS5045.1 SIM1 gene_id:6492|Hs108|chr6            ( 766)  782 126.8 1.1e-28
CCDS9645.1 NPAS3 gene_id:64067|Hs108|chr14         ( 901)  397 70.3 1.3e-11
CCDS55912.1 NPAS3 gene_id:64067|Hs108|chr14        ( 903)  397 70.3 1.3e-11
CCDS53892.1 NPAS3 gene_id:64067|Hs108|chr14        ( 920)  397 70.4 1.3e-11
CCDS53891.1 NPAS3 gene_id:64067|Hs108|chr14        ( 933)  397 70.4 1.3e-11


>>CCDS12681.2 HIF3A gene_id:64344|Hs108|chr19             (669 aa)
 initn: 4499 init1: 4499 opt: 4499  Z-score: 3575.7  bits: 672.0 E(32554): 7.5e-193
Smith-Waterman score: 4499; 100.0% identity (100.0% similar) in 669 aa overlap (1-669:1-669)

               10        20        30        40        50        60
pF1KB6 MALGLQRARSTTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIMRLT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MALGLQRARSTTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIMRLT
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB6 ISYLRMHRLCAAGEWNQVGAGGEPLDACYLKALEGFVMVLTAEGDMAYLSENVSKHLGLS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 ISYLRMHRLCAAGEWNQVGAGGEPLDACYLKALEGFVMVLTAEGDMAYLSENVSKHLGLS
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB6 QLELIGHSIFDFIHPCDQEELQDALTPQQTLSRRKVEAPTERCFSLRMKSTLTSRGRTLN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 QLELIGHSIFDFIHPCDQEELQDALTPQQTLSRRKVEAPTERCFSLRMKSTLTSRGRTLN
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB6 LKAATWKVLNCSGHMRAYKPPAQTSPAGSPDSEPPLQCLVLICEAIPHPGSLEPPLGRGA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LKAATWKVLNCSGHMRAYKPPAQTSPAGSPDSEPPLQCLVLICEAIPHPGSLEPPLGRGA
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB6 FLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSAYEYIHALDSDAVSKSIHTLLSKGQAV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 FLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSAYEYIHALDSDAVSKSIHTLLSKGQAV
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB6 TGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIVCVHFLISQVEETGVVLSLEQTEQHS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 TGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIVCVHFLISQVEETGVVLSLEQTEQHS
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB6 RRPIQRGAPSQKDTPNPGDSLDTPGPRILAFLHPPSLSEAALAADPRRFCSPDLRRLLGP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 RRPIQRGAPSQKDTPNPGDSLDTPGPRILAFLHPPSLSEAALAADPRRFCSPDLRRLLGP
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KB6 ILDGASVAATPSTPLATRHPQSPLSADLPDELPVGTENVHRLFTSGKDTEAVETDLDIAQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 ILDGASVAATPSTPLATRHPQSPLSADLPDELPVGTENVHRLFTSGKDTEAVETDLDIAQ
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KB6 DADALDLEMLAPYISMDDDFQLNASEQLPRAYHRPLGAVPRPRARSFHGLSPPALEPSLL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DADALDLEMLAPYISMDDDFQLNASEQLPRAYHRPLGAVPRPRARSFHGLSPPALEPSLL
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KB6 PRWGSDPRLSCSSPSRGDPSASSPMAGARKRTLAQSSEDEDEGVELLGVRPPKRSPSPEH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 PRWGSDPRLSCSSPSRGDPSASSPMAGARKRTLAQSSEDEDEGVELLGVRPPKRSPSPEH
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KB6 ENFLLFPLSLSFLLTGGPAPGSLQDPSTPLLNLNEPLGLGPSLLSPYSDEDTTQPGGPFQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 ENFLLFPLSLSFLLTGGPAPGSLQDPSTPLLNLNEPLGLGPSLLSPYSDEDTTQPGGPFQ
              610       620       630       640       650       660

                
pF1KB6 PRAGSAQAD
       :::::::::
CCDS12 PRAGSAQAD
                

>>CCDS12682.1 HIF3A gene_id:64344|Hs108|chr19             (667 aa)
 initn: 4453 init1: 4453 opt: 4453  Z-score: 3539.3  bits: 665.2 E(32554): 8.1e-191
Smith-Waterman score: 4453; 99.7% identity (99.7% similar) in 664 aa overlap (6-669:4-667)

               10        20        30        40        50        60
pF1KB6 MALGLQRARSTTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIMRLT
            :  ::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12   MDWQDHRSTTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIMRLT
                 10        20        30        40        50        

               70        80        90       100       110       120
pF1KB6 ISYLRMHRLCAAGEWNQVGAGGEPLDACYLKALEGFVMVLTAEGDMAYLSENVSKHLGLS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 ISYLRMHRLCAAGEWNQVGAGGEPLDACYLKALEGFVMVLTAEGDMAYLSENVSKHLGLS
       60        70        80        90       100       110        

              130       140       150       160       170       180
pF1KB6 QLELIGHSIFDFIHPCDQEELQDALTPQQTLSRRKVEAPTERCFSLRMKSTLTSRGRTLN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 QLELIGHSIFDFIHPCDQEELQDALTPQQTLSRRKVEAPTERCFSLRMKSTLTSRGRTLN
      120       130       140       150       160       170        

              190       200       210       220       230       240
pF1KB6 LKAATWKVLNCSGHMRAYKPPAQTSPAGSPDSEPPLQCLVLICEAIPHPGSLEPPLGRGA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LKAATWKVLNCSGHMRAYKPPAQTSPAGSPDSEPPLQCLVLICEAIPHPGSLEPPLGRGA
      180       190       200       210       220       230        

              250       260       270       280       290       300
pF1KB6 FLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSAYEYIHALDSDAVSKSIHTLLSKGQAV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 FLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSAYEYIHALDSDAVSKSIHTLLSKGQAV
      240       250       260       270       280       290        

              310       320       330       340       350       360
pF1KB6 TGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIVCVHFLISQVEETGVVLSLEQTEQHS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 TGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIVCVHFLISQVEETGVVLSLEQTEQHS
      300       310       320       330       340       350        

              370       380       390       400       410       420
pF1KB6 RRPIQRGAPSQKDTPNPGDSLDTPGPRILAFLHPPSLSEAALAADPRRFCSPDLRRLLGP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 RRPIQRGAPSQKDTPNPGDSLDTPGPRILAFLHPPSLSEAALAADPRRFCSPDLRRLLGP
      360       370       380       390       400       410        

              430       440       450       460       470       480
pF1KB6 ILDGASVAATPSTPLATRHPQSPLSADLPDELPVGTENVHRLFTSGKDTEAVETDLDIAQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 ILDGASVAATPSTPLATRHPQSPLSADLPDELPVGTENVHRLFTSGKDTEAVETDLDIAQ
      420       430       440       450       460       470        

              490       500       510       520       530       540
pF1KB6 DADALDLEMLAPYISMDDDFQLNASEQLPRAYHRPLGAVPRPRARSFHGLSPPALEPSLL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DADALDLEMLAPYISMDDDFQLNASEQLPRAYHRPLGAVPRPRARSFHGLSPPALEPSLL
      480       490       500       510       520       530        

              550       560       570       580       590       600
pF1KB6 PRWGSDPRLSCSSPSRGDPSASSPMAGARKRTLAQSSEDEDEGVELLGVRPPKRSPSPEH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 PRWGSDPRLSCSSPSRGDPSASSPMAGARKRTLAQSSEDEDEGVELLGVRPPKRSPSPEH
      540       550       560       570       580       590        

              610       620       630       640       650       660
pF1KB6 ENFLLFPLSLSFLLTGGPAPGSLQDPSTPLLNLNEPLGLGPSLLSPYSDEDTTQPGGPFQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 ENFLLFPLSLSFLLTGGPAPGSLQDPSTPLLNLNEPLGLGPSLLSPYSDEDTTQPGGPFQ
      600       610       620       630       640       650        

                
pF1KB6 PRAGSAQAD
       :::::::::
CCDS12 PRAGSAQAD
      660       

>>CCDS42580.2 HIF3A gene_id:64344|Hs108|chr19             (600 aa)
 initn: 3728 init1: 3728 opt: 3728  Z-score: 2965.2  bits: 558.9 E(32554): 7.6e-159
Smith-Waterman score: 3728; 100.0% identity (100.0% similar) in 549 aa overlap (121-669:52-600)

              100       110       120       130       140       150
pF1KB6 KALEGFVMVLTAEGDMAYLSENVSKHLGLSQLELIGHSIFDFIHPCDQEELQDALTPQQT
                                     ::::::::::::::::::::::::::::::
CCDS42 PSPAASAPTWTRPLSCASPSATCACTASAPQLELIGHSIFDFIHPCDQEELQDALTPQQT
              30        40        50        60        70        80 

              160       170       180       190       200       210
pF1KB6 LSRRKVEAPTERCFSLRMKSTLTSRGRTLNLKAATWKVLNCSGHMRAYKPPAQTSPAGSP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 LSRRKVEAPTERCFSLRMKSTLTSRGRTLNLKAATWKVLNCSGHMRAYKPPAQTSPAGSP
              90       100       110       120       130       140 

              220       230       240       250       260       270
pF1KB6 DSEPPLQCLVLICEAIPHPGSLEPPLGRGAFLSRHSLDMKFTYCDDRIAEVAGYSPDDLI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 DSEPPLQCLVLICEAIPHPGSLEPPLGRGAFLSRHSLDMKFTYCDDRIAEVAGYSPDDLI
             150       160       170       180       190       200 

              280       290       300       310       320       330
pF1KB6 GCSAYEYIHALDSDAVSKSIHTLLSKGQAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GCSAYEYIHALDSDAVSKSIHTLLSKGQAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQ
             210       220       230       240       250       260 

              340       350       360       370       380       390
pF1KB6 SESIVCVHFLISQVEETGVVLSLEQTEQHSRRPIQRGAPSQKDTPNPGDSLDTPGPRILA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 SESIVCVHFLISQVEETGVVLSLEQTEQHSRRPIQRGAPSQKDTPNPGDSLDTPGPRILA
             270       280       290       300       310       320 

              400       410       420       430       440       450
pF1KB6 FLHPPSLSEAALAADPRRFCSPDLRRLLGPILDGASVAATPSTPLATRHPQSPLSADLPD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 FLHPPSLSEAALAADPRRFCSPDLRRLLGPILDGASVAATPSTPLATRHPQSPLSADLPD
             330       340       350       360       370       380 

              460       470       480       490       500       510
pF1KB6 ELPVGTENVHRLFTSGKDTEAVETDLDIAQDADALDLEMLAPYISMDDDFQLNASEQLPR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 ELPVGTENVHRLFTSGKDTEAVETDLDIAQDADALDLEMLAPYISMDDDFQLNASEQLPR
             390       400       410       420       430       440 

              520       530       540       550       560       570
pF1KB6 AYHRPLGAVPRPRARSFHGLSPPALEPSLLPRWGSDPRLSCSSPSRGDPSASSPMAGARK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 AYHRPLGAVPRPRARSFHGLSPPALEPSLLPRWGSDPRLSCSSPSRGDPSASSPMAGARK
             450       460       470       480       490       500 

              580       590       600       610       620       630
pF1KB6 RTLAQSSEDEDEGVELLGVRPPKRSPSPEHENFLLFPLSLSFLLTGGPAPGSLQDPSTPL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 RTLAQSSEDEDEGVELLGVRPPKRSPSPEHENFLLFPLSLSFLLTGGPAPGSLQDPSTPL
             510       520       530       540       550       560 

              640       650       660         
pF1KB6 LNLNEPLGLGPSLLSPYSDEDTTQPGGPFQPRAGSAQAD
       :::::::::::::::::::::::::::::::::::::::
CCDS42 LNLNEPLGLGPSLLSPYSDEDTTQPGGPFQPRAGSAQAD
             570       580       590       600

>>CCDS58324.1 HIF1A gene_id:3091|Hs108|chr14              (850 aa)
 initn: 1463 init1: 767 opt: 1350  Z-score: 1077.8  bits: 210.1 E(32554): 1e-53
Smith-Waterman score: 1414; 40.1% identity (62.6% similar) in 679 aa overlap (5-600:32-670)

                                         10        20        30    
pF1KB6                           MALGLQRARSTTELRKEKSRDAARSRRSQETEVL
                                     .. .: ..: ::::::::::::::.:.::.
CCDS58 SSQCRSLENKFVFLKEGLGNSKPEELEEIRIENGRISSERRKEKSRDAARSRRSKESEVF
              10        20        30        40        50        60 

           40        50        60        70        80        90    
pF1KB6 YQLAHTLPFARGVSAHLDKASIMRLTISYLRMHRLCAAGEWNQVGAGGEPLDACYLKALE
       :.::: ::. ..::.::::::.:::::::::...:  ::. .        ..  :::::.
CCDS58 YELAHQLPLPHNVSSHLDKASVMRLTISYLRVRKLLDAGDLDIEDDMKAQMNCFYLKALD
              70        80        90       100       110       120 

          100       110       120       130       140       150    
pF1KB6 GFVMVLTAEGDMAYLSENVSKHLGLSQLELIGHSIFDFIHPCDQEELQDALTPQQTLSRR
       ::::::: .::: :.:.::.:..::.:.:: :::.::: ::::.::... :: .. : ..
CCDS58 GFVMVLTDDGDMIYISDNVNKYMGLTQFELTGHSVFDFTHPCDHEEMREMLTHRNGLVKK
             130       140       150       160       170       180 

          160       170       180       190       200       210    
pF1KB6 KVEAPTERCFSLRMKSTLTSRGRTLNLKAATWKVLNCSGHMRAYKPPAQTSPAGSPDSEP
         :  :.: : :::: ::::::::.:.:.::::::.:.::...:   ..    :   ..:
CCDS58 GKEQNTQRSFFLRMKCTLTSRGRTMNIKSATWKVLHCTGHIHVYDTNSNQPQCGY--KKP
             190       200       210       220       230           

          220       230       240       250       260       270    
pF1KB6 PLQCLVLICEAIPHPGSLEPPLGRGAFLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSA
       :. ::::::: ::::...: ::   .:::::::::::.:::.::.:. :: :..:.: : 
CCDS58 PMTCLVLICEPIPHPSNIEIPLDSKTFLSRHSLDMKFSYCDERITELMGYEPEELLGRSI
     240       250       260       270       280       290         

          280       290       300       310       320       330    
pF1KB6 YEYIHALDSDAVSKSIHTLLSKGQAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQSESI
       ::: :::::: ..:. : ...:::..:::::.::. :::.:..:::::. . .. : . :
CCDS58 YEYYHALDSDHLTKTHHDMFTKGQVTTGQYRMLAKRGGYVWVETQATVIYNTKNSQPQCI
     300       310       320       330       340       350         

          340       350       360                                  
pF1KB6 VCVHFLISQVEETGVVLSLEQTEQHSRRPIQRG---------------------------
       :::....: . .  ...::.:::    .:.. .                           
CCDS58 VCVNYVVSGIIQHDLIFSLQQTEC-VLKPVESSDMKMTQLFTKVESEDTSSLFDKLKKEP
     360       370       380        390       400       410        

             370                                    380            
pF1KB6 ------APSQKDT-----------------------------PNPGDSLD------TP--
             ::.  ::                             :.:...:.      .:  
CCDS58 DALTLLAPAAGDTIISLDFGSNDTETDDQQLEEVPLYNDVMLPSPNEKLQNINLAMSPLP
      420       430       440       450       460       470        

             390        400       410       420       430       440
pF1KB6 ---GPRILAFLHPPSLS-EAALAADPRRFCSPDLRRLLGPILDGASVAATPSTPLATRHP
           :. :     :.:. :.::  .:    : .:   .  : : .   .  ::  .. .:
CCDS58 TAETPKPLRSSADPALNQEVALKLEPNPE-SLELSFTMPQIQDQTPSPSDGSTRQSSPEP
      480       490       500        510       520       530       

                    450       460       470       480       490    
pF1KB6 QSP------LSADLPDELPVGTENVHRLFTSGKDTEAVETDLDIAQDADALDLEMLAPYI
       .::      ...:. .:. .  : :..::.  .:::: .. .. .::.: ::::::::::
CCDS58 NSPSEYCFYVDSDMVNEFKL--ELVEKLFA--EDTEA-KNPFS-TQDTD-LDLEMLAPYI
       540       550         560         570         580        590

          500       510       520       530       540       550    
pF1KB6 SMDDDFQLNASEQLPRAYHRPLGAVPRPRARSFHGLSPPALEPSLLPRWGSDPRLSCSSP
        :::::::                      :::  :::  :: :     ...:. . .  
CCDS58 PMDDDFQL----------------------RSFDQLSP--LESSSASPESASPQSTVTVF
                                    600         610       620      

             560       570       580       590       600       610 
pF1KB6 SRG---DPSASSPMAGARKRTLAQSSEDEDEGVELLGVRPPKRSPSPEHENFLLFPLSLS
       ..    .:.:..  . :    :   ..:. : ...: .     :::: :           
CCDS58 QQTQIQEPTANATTTTATTDELKTVTKDRMEDIKILIA-----SPSPTHIHKETTSATSS
        630       640       650       660            670       680 

             620       630       640       650       660           
pF1KB6 FLLTGGPAPGSLQDPSTPLLNLNEPLGLGPSLLSPYSDEDTTQPGGPFQPRAGSAQAD  
                                                                   
CCDS58 PYRDTQSRTASPNRAGKGVIEQTEKSHPRSPNVLSVALSQRTTVPEEELNPKILALQNAQ
             690       700       710       720       730       740 

>>CCDS9754.1 HIF1A gene_id:3091|Hs108|chr14               (735 aa)
 initn: 1458 init1: 762 opt: 1345  Z-score: 1074.8  bits: 209.4 E(32554): 1.5e-53
Smith-Waterman score: 1409; 40.0% identity (62.5% similar) in 677 aa overlap (7-600:10-646)

                  10        20        30        40        50       
pF1KB6    MALGLQRARSTTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIM
                . . ..: ::::::::::::::.:.::.:.::: ::. ..::.::::::.:
CCDS97 MEGAGGANDKKKISSERRKEKSRDAARSRRSKESEVFYELAHQLPLPHNVSSHLDKASVM
               10        20        30        40        50        60

        60        70        80        90       100       110       
pF1KB6 RLTISYLRMHRLCAAGEWNQVGAGGEPLDACYLKALEGFVMVLTAEGDMAYLSENVSKHL
       ::::::::...:  ::. .        ..  :::::.::::::: .::: :.:.::.:..
CCDS97 RLTISYLRVRKLLDAGDLDIEDDMKAQMNCFYLKALDGFVMVLTDDGDMIYISDNVNKYM
               70        80        90       100       110       120

       120       130       140       150       160       170       
pF1KB6 GLSQLELIGHSIFDFIHPCDQEELQDALTPQQTLSRRKVEAPTERCFSLRMKSTLTSRGR
       ::.:.:: :::.::: ::::.::... :: .. : ..  :  :.: : :::: :::::::
CCDS97 GLTQFELTGHSVFDFTHPCDHEEMREMLTHRNGLVKKGKEQNTQRSFFLRMKCTLTSRGR
              130       140       150       160       170       180

       180       190       200       210       220       230       
pF1KB6 TLNLKAATWKVLNCSGHMRAYKPPAQTSPAGSPDSEPPLQCLVLICEAIPHPGSLEPPLG
       :.:.:.::::::.:.::...:   ..    :   ..::. ::::::: ::::...: :: 
CCDS97 TMNIKSATWKVLHCTGHIHVYDTNSNQPQCGY--KKPPMTCLVLICEPIPHPSNIEIPLD
              190       200       210         220       230        

       240       250       260       270       280       290       
pF1KB6 RGAFLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSAYEYIHALDSDAVSKSIHTLLSKG
         .:::::::::::.:::.::.:. :: :..:.: : ::: :::::: ..:. : ...::
CCDS97 SKTFLSRHSLDMKFSYCDERITELMGYEPEELLGRSIYEYYHALDSDHLTKTHHDMFTKG
      240       250       260       270       280       290        

       300       310       320       330       340       350       
pF1KB6 QAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIVCVHFLISQVEETGVVLSLEQTE
       :..:::::.::. :::.:..:::::. . .. : . ::::....: . .  ...::.:::
CCDS97 QVTTGQYRMLAKRGGYVWVETQATVIYNTKNSQPQCIVCVNYVVSGIIQHDLIFSLQQTE
      300       310       320       330       340       350        

       360                                        370              
pF1KB6 QHSRRPIQRG---------------------------------APSQKDT----------
           .:.. .                                 ::.  ::          
CCDS97 C-VLKPVESSDMKMTQLFTKVESEDTSSLFDKLKKEPDALTLLAPAAGDTIISLDFGSND
       360       370       380       390       400       410       

                             380                  390        400   
pF1KB6 -------------------PNPGDSLD------TP-----GPRILAFLHPPSLS-EAALA
                          :.:...:.      .:      :. :     :.:. :.:: 
CCDS97 TETDDQQLEEVPLYNDVMLPSPNEKLQNINLAMSPLPTAETPKPLRSSADPALNQEVALK
       420       430       440       450       460       470       

           410       420       430       440             450       
pF1KB6 ADPRRFCSPDLRRLLGPILDGASVAATPSTPLATRHPQSP------LSADLPDELPVGTE
        .:    : .:   .  : : .   .  ::  .. .:.::      ...:. .:. .  :
CCDS97 LEPNPE-SLELSFTMPQIQDQTPSPSDGSTRQSSPEPNSPSEYCFYVDSDMVNEFKL--E
       480        490       500       510       520       530      

       460       470       480       490       500       510       
pF1KB6 NVHRLFTSGKDTEAVETDLDIAQDADALDLEMLAPYISMDDDFQLNASEQLPRAYHRPLG
        :..::.  .:::: .. .. .::.: :::::::::: :::::::               
CCDS97 LVEKLFA--EDTEA-KNPFS-TQDTD-LDLEMLAPYIPMDDDFQL---------------
          540          550         560       570                   

       520       530       540       550          560       570    
pF1KB6 AVPRPRARSFHGLSPPALEPSLLPRWGSDPRLSCSSPSRG---DPSASSPMAGARKRTLA
              :::  :::  :: :     ...:. . .  ..    .:.:..  . :    : 
CCDS97 -------RSFDQLSP--LESSSASPESASPQSTVTVFQQTQIQEPTANATTTTATTDELK
                 580         590       600       610       620     

          580       590       600       610       620       630    
pF1KB6 QSSEDEDEGVELLGVRPPKRSPSPEHENFLLFPLSLSFLLTGGPAPGSLQDPSTPLLNLN
         ..:. : ...: .     :::: :                                  
CCDS97 TVTKDRMEDIKILIA-----SPSPTHIHKETTSATSSPYRDTQSRTASPNRAGKGVIEQT
         630       640            650       660       670       680

>>CCDS9753.1 HIF1A gene_id:3091|Hs108|chr14               (826 aa)
 initn: 1458 init1: 762 opt: 1345  Z-score: 1074.0  bits: 209.4 E(32554): 1.7e-53
Smith-Waterman score: 1409; 40.0% identity (62.5% similar) in 677 aa overlap (7-600:10-646)

                  10        20        30        40        50       
pF1KB6    MALGLQRARSTTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIM
                . . ..: ::::::::::::::.:.::.:.::: ::. ..::.::::::.:
CCDS97 MEGAGGANDKKKISSERRKEKSRDAARSRRSKESEVFYELAHQLPLPHNVSSHLDKASVM
               10        20        30        40        50        60

        60        70        80        90       100       110       
pF1KB6 RLTISYLRMHRLCAAGEWNQVGAGGEPLDACYLKALEGFVMVLTAEGDMAYLSENVSKHL
       ::::::::...:  ::. .        ..  :::::.::::::: .::: :.:.::.:..
CCDS97 RLTISYLRVRKLLDAGDLDIEDDMKAQMNCFYLKALDGFVMVLTDDGDMIYISDNVNKYM
               70        80        90       100       110       120

       120       130       140       150       160       170       
pF1KB6 GLSQLELIGHSIFDFIHPCDQEELQDALTPQQTLSRRKVEAPTERCFSLRMKSTLTSRGR
       ::.:.:: :::.::: ::::.::... :: .. : ..  :  :.: : :::: :::::::
CCDS97 GLTQFELTGHSVFDFTHPCDHEEMREMLTHRNGLVKKGKEQNTQRSFFLRMKCTLTSRGR
              130       140       150       160       170       180

       180       190       200       210       220       230       
pF1KB6 TLNLKAATWKVLNCSGHMRAYKPPAQTSPAGSPDSEPPLQCLVLICEAIPHPGSLEPPLG
       :.:.:.::::::.:.::...:   ..    :   ..::. ::::::: ::::...: :: 
CCDS97 TMNIKSATWKVLHCTGHIHVYDTNSNQPQCGY--KKPPMTCLVLICEPIPHPSNIEIPLD
              190       200       210         220       230        

       240       250       260       270       280       290       
pF1KB6 RGAFLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSAYEYIHALDSDAVSKSIHTLLSKG
         .:::::::::::.:::.::.:. :: :..:.: : ::: :::::: ..:. : ...::
CCDS97 SKTFLSRHSLDMKFSYCDERITELMGYEPEELLGRSIYEYYHALDSDHLTKTHHDMFTKG
      240       250       260       270       280       290        

       300       310       320       330       340       350       
pF1KB6 QAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIVCVHFLISQVEETGVVLSLEQTE
       :..:::::.::. :::.:..:::::. . .. : . ::::....: . .  ...::.:::
CCDS97 QVTTGQYRMLAKRGGYVWVETQATVIYNTKNSQPQCIVCVNYVVSGIIQHDLIFSLQQTE
      300       310       320       330       340       350        

       360                                        370              
pF1KB6 QHSRRPIQRG---------------------------------APSQKDT----------
           .:.. .                                 ::.  ::          
CCDS97 C-VLKPVESSDMKMTQLFTKVESEDTSSLFDKLKKEPDALTLLAPAAGDTIISLDFGSND
       360       370       380       390       400       410       

                             380                  390        400   
pF1KB6 -------------------PNPGDSLD------TP-----GPRILAFLHPPSLS-EAALA
                          :.:...:.      .:      :. :     :.:. :.:: 
CCDS97 TETDDQQLEEVPLYNDVMLPSPNEKLQNINLAMSPLPTAETPKPLRSSADPALNQEVALK
       420       430       440       450       460       470       

           410       420       430       440             450       
pF1KB6 ADPRRFCSPDLRRLLGPILDGASVAATPSTPLATRHPQSP------LSADLPDELPVGTE
        .:    : .:   .  : : .   .  ::  .. .:.::      ...:. .:. .  :
CCDS97 LEPNPE-SLELSFTMPQIQDQTPSPSDGSTRQSSPEPNSPSEYCFYVDSDMVNEFKL--E
       480        490       500       510       520       530      

       460       470       480       490       500       510       
pF1KB6 NVHRLFTSGKDTEAVETDLDIAQDADALDLEMLAPYISMDDDFQLNASEQLPRAYHRPLG
        :..::.  .:::: .. .. .::.: :::::::::: :::::::               
CCDS97 LVEKLFA--EDTEA-KNPFS-TQDTD-LDLEMLAPYIPMDDDFQL---------------
          540          550         560       570                   

       520       530       540       550          560       570    
pF1KB6 AVPRPRARSFHGLSPPALEPSLLPRWGSDPRLSCSSPSRG---DPSASSPMAGARKRTLA
              :::  :::  :: :     ...:. . .  ..    .:.:..  . :    : 
CCDS97 -------RSFDQLSP--LESSSASPESASPQSTVTVFQQTQIQEPTANATTTTATTDELK
                 580         590       600       610       620     

          580       590       600       610       620       630    
pF1KB6 QSSEDEDEGVELLGVRPPKRSPSPEHENFLLFPLSLSFLLTGGPAPGSLQDPSTPLLNLN
         ..:. : ...: .     :::: :                                  
CCDS97 TVTKDRMEDIKILIA-----SPSPTHIHKETTSATSSPYRDTQSRTASPNRAGKGVIEQT
         630       640            650       660       670       680

>>CCDS1825.1 EPAS1 gene_id:2034|Hs108|chr2                (870 aa)
 initn: 1351 init1: 577 opt: 1293  Z-score: 1032.5  bits: 201.8 E(32554): 3.5e-51
Smith-Waterman score: 1383; 38.2% identity (64.1% similar) in 714 aa overlap (1-662:1-690)

               10        20        30        40        50        60
pF1KB6 MALGLQRARSTTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIMRLT
       :.   .. ::..: :::::::::: :::.::::.:.::: ::. ..::.::::::::::.
CCDS18 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA
               10        20        30        40        50        60

               70          80        90       100       110        
pF1KB6 ISYLRMHRLCAA--GEWNQVGAGGEPLDACYLKALEGFVMVLTAEGDMAYLSENVSKHLG
       ::.:: :.: ..  .: .. . . . .:  ::::::::. :.: .::: .::::.:: .:
CCDS18 ISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISKFMG
               70        80        90       100       110       120

      120       130       140       150         160       170      
pF1KB6 LSQLELIGHSIFDFIHPCDQEELQDALTPQQT--LSRRKVEAPTERCFSLRMKSTLTSRG
       :.:.:: ::::::: ::::.::... :. ..   ..... .  ::: : .::: :.:.::
CCDS18 LTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVTNRG
              130       140       150       160       170       180

        180       190       200        210       220       230     
pF1KB6 RTLNLKAATWKVLNCSGHMRAYKP-PAQTSPAGSPDSEPPLQCLVLICEAIPHPGSLEPP
       ::.:::.::::::.:.:....:.  : ..:  :   .:: :.::...:: : ::. .. :
CCDS18 RTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGY--KEPLLSCLIIMCEPIQHPSHMDIP
              190       200       210         220       230        

         240       250       260       270       280       290     
pF1KB6 LGRGAFLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSAYEYIHALDSDAVSKSIHTLLS
       :   .::::::.:::::::::::.:. :: :..:.: ::::. :::::. ..:: ..: .
CCDS18 LDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQNLCT
      240       250       260       270       280       290        

         300       310       320       330       340       350     
pF1KB6 KGQAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIVCVHFLISQVEETGVVLSLEQ
       :::.:.::::.::. :::.: .::.::. . :. : . :.::....:..:.. ::.:..:
CCDS18 KGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFSMDQ
      300       310       320       330       340       350        

         360                 370                           380     
pF1KB6 TEQHSRRPIQ----------RGAPSQKDT-----------------PNPGD---SLDTPG
       ::.  .  ..          .:: :.:..                 :.:::   :::  .
CCDS18 TESLFKPHLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAIISLDFGN
      360       370       380       390       400       410        

            390          400        410       420         430      
pF1KB6 PRIL---AF---LHPPSLSEAA-LAADPRRFCSPDLRRLLGP--ILDGASVAATPSTPLA
         .    :.   . :::   :. : .   .  . .:  .  :     :... .. :.  .
CCDS18 QNFEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTTPSATSSSSS
      420       430       440       450       460       470        

        440         450       460       470       480       490    
pF1KB6 TRHPQSPLS--ADLPDELPVGTENVHRLFTSGKDTEAVETDLDIAQDADALDLEMLAPYI
          :.:: .  ..: ..: .  : ...::.   :::: . . .   : . :::: :::::
CCDS18 CSTPNSPEDYYTSLDNDLKI--EVIEKLFA--MDTEA-KDQCSTQTDFNELDLETLAPYI
      480       490         500         510        520       530   

           500       510       520           530        540        
pF1KB6 SMD-DDFQLNASEQLPRAYHRPLGAVPR----PRARSFHGLSPPALE-PSLLPRWGSDPR
        :: .::::.      :   .   ..:.      .  :. :.: : . : :: .. .. .
CCDS18 PMDGEDFQLSPICPEERLLAENPQSTPQHCFSAMTNIFQPLAPVAPHSPFLLDKFQQQLE
           540       550       560       570       580       590   

      550       560       570       580       590       600        
pF1KB6 LSCSSPSRGDPSASSPMAGARKRTLAQSSEDEDEGVELLGVRPPKRSPSPEHENFLLFPL
        . . : .  : .:  . .. : .:     . .  .  .: :   . : :.       ::
CCDS18 SKKTEPEH-RPMSSIFFDAGSKASLPPCCGQASTPLSSMGGRSNTQWP-PDP------PL
           600        610       620       630       640            

      610       620       630       640       650       660        
pF1KB6 SLSFLLTGGPAPGSLQDPSTPLLNLNEPLGLGPSLLSPYSDEDTTQPGGPFQPRAGSAQA
        .      ::.  .. :  : .:.   :::  : .  :. .   :. .  :  :      
CCDS18 HF------GPTKWAVGDQRTEFLG-AAPLG--PPVSPPHVSTFKTRSAKGFGARGPDVLS
               650       660          670       680       690      

                                                                   
pF1KB6 D                                                           
                                                                   
CCDS18 PAMVALSNKLKLKRQLEYEEQAFQDLSGGDPPGGSTSHLMWKRMKNLRGGSCPLMPDKPL
        700       710       720       730       740       750      

>>CCDS13646.1 SIM2 gene_id:6493|Hs108|chr21               (667 aa)
 initn: 730 init1: 332 opt: 807  Z-score: 648.9  bits: 130.4 E(32554): 8e-30
Smith-Waterman score: 809; 30.3% identity (55.9% similar) in 692 aa overlap (16-666:2-660)

               10        20        30        40        50        60
pF1KB6 MALGLQRARSTTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIMRLT
                      ::::..::..:: .:.  .:.::. ::.  .....::::::.:::
CCDS13               MKEKSKNAAKTRREKENGEFYELAKLLPLPSAITSQLDKASIIRLT
                             10        20        30        40      

               70           80               90       100       110
pF1KB6 ISYLRMHRLCAAG---EWNQVGAGGEPLDAC-------YLKALEGFVMVLTAEGDMAYLS
        :::.:. .   :    :.: . .: :::.         :..:.:::.:....: . :.:
CCDS13 TSYLKMRAVFPEGLGDAWGQPSRAG-PLDGVAKELGSHLLQTLDGFVFVVASDGKIMYIS
         50        60        70         80        90       100     

              120       130       140       150        160         
pF1KB6 ENVSKHLGLSQLELIGHSIFDFIHPCDQEELQDALTPQQTLSRRKV-EAPTERCFSLRMK
       :..: ::::::.:: :.::...::: :..:.  .:: .: : .. . :   :: : ::::
CCDS13 ETASVHLGLSQVELTGNSIYEYIHPSDHDEMTAVLTAHQPLHHHLLQEYEIERSFFLRMK
         110       120       130       140       150       160     

     170       180       190       200       210       220         
pF1KB6 STLTSRGRTLNLKAATWKVLNCSGHMRAYKPPAQTSPAGSPDSEPPLQCLVLICEAIPHP
        .:..:.   .:  . .::..:::...  .   . :     ::   .  :: . ...:  
CCDS13 CVLAKRNA--GLTCSGYKVIHCSGYLKIRQYMLDMSLY---DSCYQIVGLVAVGQSLPPS
         170         180       190       200          210       220

     230       240       250       260       270       280         
pF1KB6 GSLEPPLGRGAFLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSAYEYIHALDSDAVSKS
       .  :  :  . :. : :::.:. . :.:..::.:: :.:::  . :...:. :   .  .
CCDS13 AITEIKLYSNMFMFRASLDLKLIFLDSRVTEVTGYEPQDLIEKTLYHHVHGCDVFHLRYA
              230       240       250       260       270       280

     290       300       310       320       330       340         
pF1KB6 IHTLLSKGQAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIVCVHFLISQVEETGV
        : :: :::..:  ::.:.. ::..:.:. :::: ..:. . . :: :.......:   .
CCDS13 HHLLLVKGQVTTKYYRLLSKRGGWVWVQSYATVVHNSRSSRPHCIVSVNYVLTEIEYKEL
              290       300       310       320       330       340

     350           360       370       380       390       400     
pF1KB6 VLSLEQTE----QHSRRPIQRGAPSQKDTPNPGDSLDTPGPRILAFLHPPSLSEAALAAD
        :::::.     : : :     .   .   .: ..      :   .  ::. . ...  :
CCDS13 QLSLEQVSTAKSQDSWRTALSTSQETRKLVKPKNTKMKTKLRTNPY--PPQ-QYSSFQMD
              350       360       370       380          390       

         410       420       430       440          450        460 
pF1KB6 PRRFCSPDLRRLLGPILDGASVAATPSTPLATRHPQSPLSADL---PD-ELPVGTENVH-
        .  :.       .:    ::.:: :       .:.:  :.::   :.  :: . .  : 
CCDS13 -KLECGQLGNWRASP---PASAAAPPEL-----QPHSE-SSDLLYTPSYSLPFSYHYGHF
        400       410          420             430       440       

                  470       480       490       500       510      
pF1KB6 ----RLFTSGKDTEAVETDLDIAQDADALDLEMLAPYISMDDDFQLNASEQLPRAYHRPL
           ..:.: :    . . .   : .     ...   .  . . : . .. :  .   : 
CCDS13 PLDSHVFSSKKPM--LPAKFGQPQGSPCEVARFFLSTLPASGECQWHYANPLVPSSSSPA
       450       460         470       480       490       500     

        520        530        540          550       560       570 
pF1KB6 GAVPRPRARSF-HGLSPPALEPSL-LPRWGSD---PRLSCSSPSRGDPSASSPMAGARKR
          :.: : .  :.: :    :.  . :.: :   : .   .  : .: : .:  .::  
CCDS13 KNPPEPPANTARHSLVPSYEAPAAAVRRFGEDTAPPSFPSCGHYREEP-ALGPAKAAR--
         510       520       530       540       550        560    

             580       590          600       610               620
pF1KB6 TLAQSSEDEDEGVELLGVRP-PK--RSPSPEHENFLLFPLSLSFLLTG--------GPAP
          :...:   :..:  .:  :.    :.::  .    : .: :.: .        ::  
CCDS13 ---QAARD---GARLALARAAPECCAPPTPEAPGA---PAQLPFVLLNYHRVLARRGPLG
                  570       580       590          600       610   

              630        640       650       660             
pF1KB6 GSLQDPSTPLLNLNEP-LGLGPSLLSPYSDEDTTQPGGPFQPRAGSAQAD    
       :.    :      . :  . :   :   :   :. ::.:.    :..       
CCDS13 GAAPAASGLACAPGGPEAATGALRLRHPSPAATSPPGAPLPHYLGASVIITNGR
           620       630       640       650       660       

>>CCDS5045.1 SIM1 gene_id:6492|Hs108|chr6                 (766 aa)
 initn: 763 init1: 317 opt: 782  Z-score: 628.2  bits: 126.8 E(32554): 1.1e-28
Smith-Waterman score: 782; 38.6% identity (68.6% similar) in 350 aa overlap (16-355:2-346)

               10        20        30        40        50        60
pF1KB6 MALGLQRARSTTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIMRLT
                      ::::..:::.:: .:.  .:.::. ::.  .....::::::.:::
CCDS50               MKEKSKNAARTRREKENSEFYELAKLLPLPSAITSQLDKASIIRLT
                             10        20        30        40      

               70                 80        90       100       110 
pF1KB6 ISYLRMHRLCAAG---EWNQ------VGAGGEPLDACYLKALEGFVMVLTAEGDMAYLSE
        :::.:. .   :    :..      .   :. : .  :..:.::..:.. .: . :.::
CCDS50 TSYLKMRVVFPEGLGEAWGHSSRTSPLDNVGRELGSHLLQTLDGFIFVVAPDGKIMYISE
         50        60        70        80        90       100      

             120       130       140       150        160       170
pF1KB6 NVSKHLGLSQLELIGHSIFDFIHPCDQEELQDALTPQQTLSRRKV-EAPTERCFSLRMKS
       ..: ::::::.:: :.::...::: :..:.  .:: .:    . : :   :: : :::: 
CCDS50 TASVHLGLSQVELTGNSIYEYIHPADHDEMTAVLTAHQPYHSHFVQEYEIERSFFLRMKC
        110       120       130       140       150       160      

              180       190       200       210       220       230
pF1KB6 TLTSRGRTLNLKAATWKVLNCSGHMRAYKPPAQTSPAGSPDSEPPLQCLVLICEAIPHPG
       .:..:.   .:  . .::..:::...  .   . ::    :.      :: . ...:  .
CCDS50 VLAKRNA--GLTCGGYKVIHCSGYLKIRQYSLDMSPF---DGCYQNVGLVAVGHSLPPSA
        170         180       190       200          210       220 

              240       250       260       270       280       290
pF1KB6 SLEPPLGRGAFLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSAYEYIHALDSDAVSKSI
         :  :  . :. : :::::. . :.:.::..:: :.:::  . :...:. :.  .  . 
CCDS50 VTEIKLHSNMFMFRASLDMKLIFLDSRVAELTGYEPQDLIEKTLYHHVHGCDTFHLRCAH
             230       240       250       260       270       280 

              300       310       320       330       340       350
pF1KB6 HTLLSKGQAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIVCVHFLISQVEETGVV
       : :: :::..:  :::::. ::..:.:. ::.: ..:. . . :: :.......:  :. 
CCDS50 HLLLVKGQVTTKYYRFLAKHGGWVWVQSYATIVHNSRSSRPHCIVSVNYVLTDTEYKGLQ
             290       300       310       320       330       340 

              360       370       380       390       400       410
pF1KB6 LSLEQTEQHSRRPIQRGAPSQKDTPNPGDSLDTPGPRILAFLHPPSLSEAALAADPRRFC
       :::.:                                                       
CCDS50 LSLDQISASKPAFSYTSSSTPTMTDNRKGAKSRLSSSKSKSRTSPYPQYSGFHTERSESD
             350       360       370       380       390       400 

>>CCDS9645.1 NPAS3 gene_id:64067|Hs108|chr14              (901 aa)
 initn: 801 init1: 286 opt: 397  Z-score: 321.9  bits: 70.3 E(32554): 1.3e-11
Smith-Waterman score: 655; 32.1% identity (59.9% similar) in 424 aa overlap (22-385:29-441)

                      10        20        30        40        50   
pF1KB6        MALGLQRARSTTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDK
                                   ::::::..:.  .:.::. ::.  .....:::
CCDS96 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK
               10        20        30        40        50        60

            60        70          80                               
pF1KB6 ASIMRLTISYLRMHRLCAAGE--WNQVGAGGEP------------------------LDA
       :::.:::::::.:. .   :.  ::    :  :                        : .
CCDS96 ASIIRLTISYLKMRDFANQGDPPWNLRMEGPPPNTSVKGAQRRRSPSALAIEVFEAHLGS
               70        80        90       100       110       120

        90       100       110       120       130       140       
pF1KB6 CYLKALEGFVMVLTAEGDMAYLSENVSKHLGLSQLELIGHSIFDFIHPCDQEELQDAL--
         :..:.:::..:. :: . :.::.:: .:::::.:: : :.::..:: :. :. . :  
CCDS96 HILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDYVHPGDHVEMAEQLGM
              130       140       150       160       170       180

           150                     160                       170   
pF1KB6 --TPQQTL--------------SRRKVEAPT----------------ERCFSLRMKSTLT
          : . :              :  . :.:                 :: : .:::::::
CCDS96 KLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTDNTLERSFFIRMKSTLT
              190       200       210       220       230       240

           180       190       200       210       220       230   
pF1KB6 SRGRTLNLKAATWKVLNCSGHMRAYKPPAQTSPAGSPDSEPPLQCLVLICEAIPHPGSLE
       .::  ...:.. .::.. .:..:     .. : . .  :.  .. ::.. .:.: :   :
CCDS96 KRG--VHIKSSGYKVIHITGRLRLR---VSLSHGRTVPSQ--IMGLVVVAHALPPPTINE
                250       260          270         280       290   

           240       250       260       270       280       290   
pF1KB6 PPLGRGAFLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSAYEYIHALDSDAVSKSIHTL
         .    :..: ..:... ::..::..    .: :..:   :..::: : ... .:   :
CCDS96 VRIDCHMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVEGIRHSHLDL
           300       310       320       330       340       350   

           300       310       320       330       340       350   
pF1KB6 LSKGQAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIVCVHFLISQVEETGVVLSL
       :.::: ::  ::.. ..:::.: :..::.. .... . ..:. :..:.:. :   . ...
CCDS96 LNKGQCVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNPEYKDTPMDI
           360       370       380       390       400       410   

           360       370       380       390       400       410   
pF1KB6 EQTEQHSRRPIQRGAPSQKDTPNPGDSLDTPGPRILAFLHPPSLSEAALAADPRRFCSPD
        :  .    : .. . :.. . . .:: :: :                            
CCDS96 AQLPHL---P-EKTSESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENSEDPEPDRK
              420        430       440       450       460         

           420       430       440       450       460       470   
pF1KB6 LRRLLGPILDGASVAATPSTPLATRHPQSPLSADLPDELPVGTENVHRLFTSGKDTEAVE
                                                                   
CCDS96 KSGNACDNDMNCNDDGHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAMQIKVERYV
     470       480       490       500       510       520         




669 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Sat Nov  5 14:15:18 2016 done: Sat Nov  5 14:15:19 2016
 Total Scan time:  3.630 Total Display time:  0.130

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com