Result of FASTA (ccds) for pF1KB4384
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB4384, 870 aa
  1>>>pF1KB4384 870 - 870 aa - 870 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 8.1555+/-0.000891; mu= 8.5853+/- 0.054
 mean_var=155.4507+/-30.970, 0's: 0 Z-trim(112.1): 47  B-trim: 0 in 0/53
 Lambda= 0.102867
 statistics sampled from 12839 (12884) to 12839 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.73), E-opt: 0.2 (0.396), width:  16
 Scan time:  4.920

The best scores are:                                      opt bits E(32554)
CCDS1825.1 EPAS1 gene_id:2034|Hs108|chr2           ( 870) 5916 890.2       0
CCDS9754.1 HIF1A gene_id:3091|Hs108|chr14          ( 735) 1854 287.3 6.6e-77
CCDS9753.1 HIF1A gene_id:3091|Hs108|chr14          ( 826) 1854 287.4 7.3e-77
CCDS58324.1 HIF1A gene_id:3091|Hs108|chr14         ( 850) 1848 286.5 1.4e-76
CCDS12682.1 HIF3A gene_id:64344|Hs108|chr19        ( 667) 1294 204.2 6.4e-52
CCDS12681.2 HIF3A gene_id:64344|Hs108|chr19        ( 669) 1293 204.1 7.1e-52
CCDS42580.2 HIF3A gene_id:64344|Hs108|chr19        ( 600)  864 140.4 9.4e-33
CCDS5045.1 SIM1 gene_id:6492|Hs108|chr6            ( 766)  835 136.1 2.3e-31
CCDS13646.1 SIM2 gene_id:6493|Hs108|chr21          ( 667)  818 133.6 1.2e-30
CCDS9645.1 NPAS3 gene_id:64067|Hs108|chr14         ( 901)  443 78.0 8.5e-14
CCDS55912.1 NPAS3 gene_id:64067|Hs108|chr14        ( 903)  443 78.0 8.5e-14
CCDS53892.1 NPAS3 gene_id:64067|Hs108|chr14        ( 920)  443 78.0 8.7e-14
CCDS53891.1 NPAS3 gene_id:64067|Hs108|chr14        ( 933)  443 78.0 8.8e-14


>>CCDS1825.1 EPAS1 gene_id:2034|Hs108|chr2                (870 aa)
 initn: 5916 init1: 5916 opt: 5916  Z-score: 4751.0  bits: 890.2 E(32554):    0
Smith-Waterman score: 5916; 100.0% identity (100.0% similar) in 870 aa overlap (1-870:1-870)

               10        20        30        40        50        60
pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB4 ISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISKFMG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 ISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISKFMG
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB4 LTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVTNRG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 LTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVTNRG
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB4 RTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGYKEPLLSCLIIMCEPIQHPSHMDIPLD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 RTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGYKEPLLSCLIIMCEPIQHPSHMDIPLD
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB4 SKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQNLCTKG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 SKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQNLCTKG
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB4 QVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFSMDQTE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 QVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFSMDQTE
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB4 SLFKPHLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAIISLDFGNQN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 SLFKPHLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAIISLDFGNQN
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KB4 FEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTTPSATSSSSSCS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 FEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTTPSATSSSSSCS
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KB4 TPNSPEDYYTSLDNDLKIEVIEKLFAMDTEAKDQCSTQTDFNELDLETLAPYIPMDGEDF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 TPNSPEDYYTSLDNDLKIEVIEKLFAMDTEAKDQCSTQTDFNELDLETLAPYIPMDGEDF
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KB4 QLSPICPEERLLAENPQSTPQHCFSAMTNIFQPLAPVAPHSPFLLDKFQQQLESKKTEPE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 QLSPICPEERLLAENPQSTPQHCFSAMTNIFQPLAPVAPHSPFLLDKFQQQLESKKTEPE
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KB4 HRPMSSIFFDAGSKASLPPCCGQASTPLSSMGGRSNTQWPPDPPLHFGPTKWAVGDQRTE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 HRPMSSIFFDAGSKASLPPCCGQASTPLSSMGGRSNTQWPPDPPLHFGPTKWAVGDQRTE
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KB4 FLGAAPLGPPVSPPHVSTFKTRSAKGFGARGPDVLSPAMVALSNKLKLKRQLEYEEQAFQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 FLGAAPLGPPVSPPHVSTFKTRSAKGFGARGPDVLSPAMVALSNKLKLKRQLEYEEQAFQ
              670       680       690       700       710       720

              730       740       750       760       770       780
pF1KB4 DLSGGDPPGGSTSHLMWKRMKNLRGGSCPLMPDKPLSANVPNDKFTQNPMRGLGHPLRHL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 DLSGGDPPGGSTSHLMWKRMKNLRGGSCPLMPDKPLSANVPNDKFTQNPMRGLGHPLRHL
              730       740       750       760       770       780

              790       800       810       820       830       840
pF1KB4 PLPQPPSAISPGENSKSRFPPQCYATQYQDYSLSSAHKVSGMASRLLGPSFESYLLPELT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 PLPQPPSAISPGENSKSRFPPQCYATQYQDYSLSSAHKVSGMASRLLGPSFESYLLPELT
              790       800       810       820       830       840

              850       860       870
pF1KB4 RYDCEVNVPVLGSSTLLQGGDLLRALDQAT
       ::::::::::::::::::::::::::::::
CCDS18 RYDCEVNVPVLGSSTLLQGGDLLRALDQAT
              850       860       870

>>CCDS9754.1 HIF1A gene_id:3091|Hs108|chr14               (735 aa)
 initn: 1411 init1: 811 opt: 1854  Z-score: 1494.2  bits: 287.3 E(32554): 6.6e-77
Smith-Waterman score: 2058; 48.7% identity (70.7% similar) in 764 aa overlap (6-720:9-730)

                  10        20        30        40        50       
pF1KB4    MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIM
               .::. :::::::::::::: :::::.::::::::.:::::.:::::::::.:
CCDS97 MEGAGGANDKKKISSERRKEKSRDAARSRRSKESEVFYELAHQLPLPHNVSSHLDKASVM
               10        20        30        40        50        60

        60        70        80        90       100       110       
pF1KB4 RLAISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISK
       ::.::.::..:::..   . :.. .:  ::. .:::::.::. :.:.:::::..:.:..:
CCDS97 RLTISYLRVRKLLDAGDLDIEDDMKA--QMNCFYLKALDGFVMVLTDDGDMIYISDNVNK
               70        80          90       100       110        

       120       130       140       150       160       170       
pF1KB4 FMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVT
       .::::: ::::::.:::::::::::.:: :. .::  . ::.:...:.:.::.:::::.:
CCDS97 YMGLTQFELTGHSVFDFTHPCDHEEMREMLTHRNG--LVKKGKEQNTQRSFFLRMKCTLT
      120       130       140       150         160       170      

       180       190       200         210       220       230     
pF1KB4 NRGRTVNLKSATWKVLHCTGQVKVY--NNCPPHNSLCGYKEPLLSCLIIMCEPIQHPSHM
       .::::.:.::::::::::::...::  :.  :.   ::::.: ..::...:::: :::..
CCDS97 SRGRTMNIKSATWKVLHCTGHIHVYDTNSNQPQ---CGYKKPPMTCLVLICEPIPHPSNI
        180       190       200          210       220       230   

         240       250       260       270       280       290     
pF1KB4 DIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQN
       .:::::::::::::.::::.:::.:::::.::.:::::::: ::.::::::...::.:..
CCDS97 EIPLDSKTFLSRHSLDMKFSYCDERITELMGYEPEELLGRSIYEYYHALDSDHLTKTHHD
           240       250       260       270       280       290   

         300       310       320       330       340       350     
pF1KB4 LCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFS
       . :::::..::::::::.:::::.:::.::::: .: :::::.:::::.: : ..:..::
CCDS97 MFTKGQVTTGQYRMLAKRGGYVWVETQATVIYNTKNSQPQCIVCVNYVVSGIIQHDLIFS
           300       310       320       330       340       350   

         360          370       380       390       400       410  
pF1KB4 MDQTESLFKP---HLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAII
       ..::: ..::     : :...: .    . :: .. :: :::.::. :. :::. ::.::
CCDS97 LQQTECVLKPVESSDMKMTQLFTK----VESEDTSSLFDKLKKEPDALTLLAPAAGDTII
           360       370           380       390       400         

                   420       430                  440              
pF1KB4 SLDFG-------NQNFEESSAYGKAILP-PSQ----------PWATE-----LRSHS---
       :::::       .:..::   :. ..:: :..          :  :      ::: .   
CCDS97 SLDFGSNDTETDDQQLEEVPLYNDVMLPSPNEKLQNINLAMSPLPTAETPKPLRSSADPA
     410       420       430       440       450       460         

         450               460       470       480       490       
pF1KB4 -TQSEAGSL-P-------AFTVPQAAAPGSTTPSATSSSSSCSTPNSPEDYYTSLDNDL-
        .:  : .: :       .::.::     . .::  :. .:   :::: .:   .:.:. 
CCDS97 LNQEVALKLEPNPESLELSFTMPQIQ-DQTPSPSDGSTRQSSPEPNSPSEYCFYVDSDMV
     470       480       490        500       510       520        

           500       510       520       530       540          550
pF1KB4 ---KIEVIEKLFAMDTEAKDQCSTQTDFNELDLETLAPYIPMDGEDFQL---SPICPEER
          :.:..::::: :::::.  :::   ..:::: :::::::: .::::   . . : : 
CCDS97 NEFKLELVEKLFAEDTEAKNPFSTQD--TDLDLEMLAPYIPMD-DDFQLRSFDQLSPLES
      530       540       550         560        570       580     

              560         570       580       590       600        
pF1KB4 LLAENPQSTPQHCFSAM--TNIFQPLAPVAPHSPFLLDKFQQQLESKKTEPEHRPMSSIF
         :   ...::   ...  :.: .: :  :  .    :..       ::  . : : .: 
CCDS97 SSASPESASPQSTVTVFQQTQIQEPTAN-ATTTTATTDEL-------KTVTKDR-MEDIK
         590       600       610        620              630       

      610       620       630       640       650       660        
pF1KB4 FDAGSKASLPPCCGQASTPLSSMGGRSNTQWPPDPPLHFGPTKWAVGDQRTEFLGAAPLG
       .  .: .  :    . .:  .:   : .::     : . :  : ..  ..::   . : .
CCDS97 ILIASPS--PTHIHKETTSATSSPYR-DTQSRTASPNRAG--KGVI--EQTE--KSHPRS
        640         650       660        670           680         

      670       680       690       700       710       720        
pF1KB4 PPVSPPHVSTFKTRSAKGFGARGPDVLSPAMVALSNKLKLKRQLEYEEQAFQDLSGGDPP
       : :    .:   :           . :.: ..::.:  . ::..:.. . ::        
CCDS97 PNVLSVALSQRTTVPE--------EELNPKILALQNAQR-KRKMEHDGSLFQAVGII   
       690       700               710        720       730        

      730       740       750       760       770       780        
pF1KB4 GGSTSHLMWKRMKNLRGGSCPLMPDKPLSANVPNDKFTQNPMRGLGHPLRHLPLPQPPSA

>>CCDS9753.1 HIF1A gene_id:3091|Hs108|chr14               (826 aa)
 initn: 1595 init1: 811 opt: 1854  Z-score: 1493.4  bits: 287.4 E(32554): 7.3e-77
Smith-Waterman score: 2163; 45.4% identity (66.0% similar) in 917 aa overlap (6-868:9-824)

                  10        20        30        40        50       
pF1KB4    MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIM
               .::. :::::::::::::: :::::.::::::::.:::::.:::::::::.:
CCDS97 MEGAGGANDKKKISSERRKEKSRDAARSRRSKESEVFYELAHQLPLPHNVSSHLDKASVM
               10        20        30        40        50        60

        60        70        80        90       100       110       
pF1KB4 RLAISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISK
       ::.::.::..:::..   . :.. .:  ::. .:::::.::. :.:.:::::..:.:..:
CCDS97 RLTISYLRVRKLLDAGDLDIEDDMKA--QMNCFYLKALDGFVMVLTDDGDMIYISDNVNK
               70        80          90       100       110        

       120       130       140       150       160       170       
pF1KB4 FMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVT
       .::::: ::::::.:::::::::::.:: :. .::  . ::.:...:.:.::.:::::.:
CCDS97 YMGLTQFELTGHSVFDFTHPCDHEEMREMLTHRNG--LVKKGKEQNTQRSFFLRMKCTLT
      120       130       140       150         160       170      

       180       190       200         210       220       230     
pF1KB4 NRGRTVNLKSATWKVLHCTGQVKVY--NNCPPHNSLCGYKEPLLSCLIIMCEPIQHPSHM
       .::::.:.::::::::::::...::  :.  :.   ::::.: ..::...:::: :::..
CCDS97 SRGRTMNIKSATWKVLHCTGHIHVYDTNSNQPQ---CGYKKPPMTCLVLICEPIPHPSNI
        180       190       200          210       220       230   

         240       250       260       270       280       290     
pF1KB4 DIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQN
       .:::::::::::::.::::.:::.:::::.::.:::::::: ::.::::::...::.:..
CCDS97 EIPLDSKTFLSRHSLDMKFSYCDERITELMGYEPEELLGRSIYEYYHALDSDHLTKTHHD
           240       250       260       270       280       290   

         300       310       320       330       340       350     
pF1KB4 LCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFS
       . :::::..::::::::.:::::.:::.::::: .: :::::.:::::.: : ..:..::
CCDS97 MFTKGQVTTGQYRMLAKRGGYVWVETQATVIYNTKNSQPQCIVCVNYVVSGIIQHDLIFS
           300       310       320       330       340       350   

         360          370       380       390       400       410  
pF1KB4 MDQTESLFKP---HLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAII
       ..::: ..::     : :...: .    . :: .. :: :::.::. :. :::. ::.::
CCDS97 LQQTECVLKPVESSDMKMTQLFTK----VESEDTSSLFDKLKKEPDALTLLAPAAGDTII
           360       370           380       390       400         

                   420       430                  440              
pF1KB4 SLDFG-------NQNFEESSAYGKAILP-PSQ----------PWATE-----LRSHS---
       :::::       .:..::   :. ..:: :..          :  :      ::: .   
CCDS97 SLDFGSNDTETDDQQLEEVPLYNDVMLPSPNEKLQNINLAMSPLPTAETPKPLRSSADPA
     410       420       430       440       450       460         

         450               460       470       480       490       
pF1KB4 -TQSEAGSL-P-------AFTVPQAAAPGSTTPSATSSSSSCSTPNSPEDYYTSLDNDL-
        .:  : .: :       .::.::     . .::  :. .:   :::: .:   .:.:. 
CCDS97 LNQEVALKLEPNPESLELSFTMPQIQ-DQTPSPSDGSTRQSSPEPNSPSEYCFYVDSDMV
     470       480       490        500       510       520        

           500       510       520       530       540          550
pF1KB4 ---KIEVIEKLFAMDTEAKDQCSTQTDFNELDLETLAPYIPMDGEDFQL---SPICPEER
          :.:..::::: :::::.  :::   ..:::: :::::::: .::::   . . : : 
CCDS97 NEFKLELVEKLFAEDTEAKNPFSTQD--TDLDLEMLAPYIPMD-DDFQLRSFDQLSPLES
      530       540       550         560        570       580     

              560         570       580       590       600        
pF1KB4 LLAENPQSTPQHCFSAM--TNIFQPLAPVAPHSPFLLDKFQQQLESKKTEPEHRPMSSIF
         :   ...::   ...  :.: .: :  :  .    :..       ::  . : : .: 
CCDS97 SSASPESASPQSTVTVFQQTQIQEPTAN-ATTTTATTDEL-------KTVTKDR-MEDIK
         590       600       610        620              630       

      610       620       630       640       650       660        
pF1KB4 FDAGSKASLPPCCGQASTPLSSMGGRSNTQWPPDPPLHFGPTKWAVGDQRTEFLGAAPLG
       .  .: .  :    . .:  .:   : .::     : . :  : ..  ..::   . : .
CCDS97 ILIASPS--PTHIHKETTSATSSPYR-DTQSRTASPNRAG--KGVI--EQTE--KSHPRS
        640         650       660        670           680         

      670       680       690       700       710       720        
pF1KB4 PPVSPPHVSTFKTRSAKGFGARGPDVLSPAMVALSNKLKLKRQLEYEEQAFQDLSGG---
       : :    .:   :           . :.: ..::.:  . ::..:.. . :: .. :   
CCDS97 PNVLSVALSQRTTVP--------EEELNPKILALQNAQR-KRKMEHDGSLFQAVGIGTLL
       690       700               710        720       730        

           730       740       750       760       770       780   
pF1KB4 DPPG--GSTSHLMWKRMKNLRGGSCPLMPDKPLSANVPNDKFTQNPMRGLGHPLRHLPLP
       . :   ..:. : :::.:. ...                    :: :.            
CCDS97 QQPDDHAATTSLSWKRVKGCKSSE-------------------QNGME------------
      740       750       760                                      

           790       800       810       820       830       840   
pF1KB4 QPPSAISPGENSKSRFPPQCYATQYQDYSLSSAHKVSGMASRLLGPSFESYLLPELTRYD
       :    . :                            : .: :::: :..   ::.:: ::
CCDS97 QKTIILIP----------------------------SDLACRLLGQSMDESGLPQLTSYD
       770                                   780       790         

           850       860       870
pF1KB4 CEVNVPVLGSSTLLQGGDLLRALDQAT
       ::::.:. :: .:::: .:::::::  
CCDS97 CEVNAPIQGSRNLLQGEELLRALDQVN
     800       810       820      

>>CCDS58324.1 HIF1A gene_id:3091|Hs108|chr14              (850 aa)
 initn: 1595 init1: 811 opt: 1848  Z-score: 1488.4  bits: 286.5 E(32554): 1.4e-76
Smith-Waterman score: 2157; 45.4% identity (65.9% similar) in 917 aa overlap (6-868:33-848)

                                        10        20        30     
pF1KB4                          MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFY
                                     :. : :::::::::::::: :::::.::::
CCDS58 SQCRSLENKFVFLKEGLGNSKPEELEEIRIENGRISSERRKEKSRDAARSRRSKESEVFY
             10        20        30        40        50        60  

          40        50        60        70        80        90     
pF1KB4 ELAHELPLPHSVSSHLDKASIMRLAISFLRTHKLLSSVCSENESEAEADQQMDNLYLKAL
       ::::.:::::.:::::::::.:::.::.::..:::..   . :.. .:  ::. .:::::
CCDS58 ELAHQLPLPHNVSSHLDKASVMRLTISYLRVRKLLDAGDLDIEDDMKA--QMNCFYLKAL
             70        80        90       100       110         120

         100       110       120       130       140       150     
pF1KB4 EGFIAVVTQDGDMIFLSENISKFMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGF
       .::. :.:.:::::..:.:..:.::::: ::::::.:::::::::::.:: :. .::  .
CCDS58 DGFVMVLTDDGDMIYISDNVNKYMGLTQFELTGHSVFDFTHPCDHEEMREMLTHRNG--L
              130       140       150       160       170          

         160       170       180       190       200         210   
pF1KB4 GKKSKDMSTERDFFMRMKCTVTNRGRTVNLKSATWKVLHCTGQVKVY--NNCPPHNSLCG
        ::.:...:.:.::.:::::.:.::::.:.::::::::::::...::  :.  :.   ::
CCDS58 VKKGKEQNTQRSFFLRMKCTLTSRGRTMNIKSATWKVLHCTGHIHVYDTNSNQPQ---CG
      180       190       200       210       220       230        

           220       230       240       250       260       270   
pF1KB4 YKEPLLSCLIIMCEPIQHPSHMDIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELL
       ::.: ..::...:::: :::...:::::::::::::.::::.:::.:::::.::.:::::
CCDS58 YKKPPMTCLVLICEPIPHPSNIEIPLDSKTFLSRHSLDMKFSYCDERITELMGYEPEELL
         240       250       260       270       280       290     

           280       290       300       310       320       330   
pF1KB4 GRSAYEFYHALDSENMTKSHQNLCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQ
       ::: ::.::::::...::.:... :::::..::::::::.:::::.:::.::::: .: :
CCDS58 GRSIYEYYHALDSDHLTKTHHDMFTKGQVTTGQYRMLAKRGGYVWVETQATVIYNTKNSQ
         300       310       320       330       340       350     

           340       350       360          370       380       390
pF1KB4 PQCIMCVNYVLSEIEKNDVVFSMDQTESLFKP---HLMAMNSIFDSSGKGAVSEKSNFLF
       ::::.:::::.: : ..:..::..::: ..::     : :...: .    . :: .. ::
CCDS58 PQCIVCVNYVVSGIIQHDLIFSLQQTECVLKPVESSDMKMTQLFTK----VESEDTSSLF
         360       370       380       390       400           410 

              400       410              420       430             
pF1KB4 TKLKEEPEELAQLAPTPGDAIISLDFG-------NQNFEESSAYGKAILP-PSQ------
        :::.::. :. :::. ::.:::::::       .:..::   :. ..:: :..      
CCDS58 DKLKKEPDALTLLAPAAGDTIISLDFGSNDTETDDQQLEEVPLYNDVMLPSPNEKLQNIN
             420       430       440       450       460       470 

            440                450               460       470     
pF1KB4 ----PWATE-----LRSHS----TQSEAGSL-P-------AFTVPQAAAPGSTTPSATSS
           :  :      ::: .    .:  : .: :       .::.::     . .::  :.
CCDS58 LAMSPLPTAETPKPLRSSADPALNQEVALKLEPNPESLELSFTMPQIQ-DQTPSPSDGST
             480       490       500       510        520       530

         480       490           500       510       520       530 
pF1KB4 SSSCSTPNSPEDYYTSLDNDL----KIEVIEKLFAMDTEAKDQCSTQTDFNELDLETLAP
        .:   :::: .:   .:.:.    :.:..::::: :::::.  :::   ..:::: :::
CCDS58 RQSSPEPNSPSEYCFYVDSDMVNEFKLELVEKLFAEDTEAKNPFSTQD--TDLDLEMLAP
              540       550       560       570         580        

             540          550       560         570       580      
pF1KB4 YIPMDGEDFQL---SPICPEERLLAENPQSTPQHCFSAM--TNIFQPLAPVAPHSPFLLD
       ::::: .::::   . . : :   :   ...::   ...  :.: .: :  :  .    :
CCDS58 YIPMD-DDFQLRSFDQLSPLESSSASPESASPQSTVTVFQQTQIQEPTAN-ATTTTATTD
      590        600       610       620       630        640      

        590       600       610       620       630       640      
pF1KB4 KFQQQLESKKTEPEHRPMSSIFFDAGSKASLPPCCGQASTPLSSMGGRSNTQWPPDPPLH
       ..       ::  . : : .: .  .: .  :    . .:  .:   : .::     : .
CCDS58 EL-------KTVTKDR-MEDIKILIASPS--PTHIHKETTSATSSPYR-DTQSRTASPNR
               650        660         670       680        690     

        650       660       670       680       690       700      
pF1KB4 FGPTKWAVGDQRTEFLGAAPLGPPVSPPHVSTFKTRSAKGFGARGPDVLSPAMVALSNKL
        :  : ..  ..::   . : .: :    .:   :           . :.: ..::.:  
CCDS58 AG--KGVI--EQTE--KSHPRSPNVLSVALSQRTTVP--------EEELNPKILALQNAQ
           700           710       720               730       740 

        710       720            730       740       750       760 
pF1KB4 KLKRQLEYEEQAFQDLSGG---DPPG--GSTSHLMWKRMKNLRGGSCPLMPDKPLSANVP
       . ::..:.. . :: .. :   . :   ..:. : :::.:. ...               
CCDS58 R-KRKMEHDGSLFQAVGIGTLLQQPDDHAATTSLSWKRVKGCKSSE--------------
              750       760       770       780                    

             770       780       790       800       810       820 
pF1KB4 NDKFTQNPMRGLGHPLRHLPLPQPPSAISPGENSKSRFPPQCYATQYQDYSLSSAHKVSG
            :: :.            :    . :                            : 
CCDS58 -----QNGME------------QKTIILIP----------------------------SD
             790                                               800 

             830       840       850       860       870
pF1KB4 MASRLLGPSFESYLLPELTRYDCEVNVPVLGSSTLLQGGDLLRALDQAT
       .: :::: :..   ::.:: ::::::.:. :: .:::: .:::::::  
CCDS58 LACRLLGQSMDESGLPQLTSYDCEVNAPIQGSRNLLQGEELLRALDQVN
             810       820       830       840       850

>>CCDS12682.1 HIF3A gene_id:64344|Hs108|chr19             (667 aa)
 initn: 1351 init1: 577 opt: 1294  Z-score: 1045.7  bits: 204.2 E(32554): 6.4e-52
Smith-Waterman score: 1384; 38.4% identity (64.1% similar) in 711 aa overlap (4-690:2-660)

               10        20        30        40        50        60
pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA
          : . .::..: :::::::::: :::.::::.:.::: ::. ..::.::::::::::.
CCDS12   MDWQDHRSTTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIMRLT
                 10        20        30        40        50        

               70        80        90       100       110       120
pF1KB4 ISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISKFMG
       ::.:: :.: ..  .: .. . . . .:  ::::::::. :.: .::: .::::.:: .:
CCDS12 ISYLRMHRLCAA--GEWNQVGAGGEPLDACYLKALEGFVMVLTAEGDMAYLSENVSKHLG
       60        70          80        90       100       110      

              130       140       150       160       170       180
pF1KB4 LTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVTNRG
       :.:.:: ::::::: ::::.::... :. ..   ..... .  ::: : .::: :.:.::
CCDS12 LSQLELIGHSIFDFIHPCDQEELQDALTPQQT--LSRRKVEAPTERCFSLRMKSTLTSRG
        120       130       140         150       160       170    

              190       200       210         220       230        
pF1KB4 RTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGY--KEPLLSCLIIMCEPIQHPSHMDIP
       ::.:::.::::::.:.:....:.  : ..:  :   .:: :.::...:: : ::. .. :
CCDS12 RTLNLKAATWKVLNCSGHMRAYKP-PAQTSPAGSPDSEPPLQCLVLICEAIPHPGSLEPP
          180       190        200       210       220       230   

      240       250       260       270       280       290        
pF1KB4 LDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQNLCT
       :   .::::::.:::::::::::.:. :: :..:.: ::::. :::::. ..:: ..: .
CCDS12 LGRGAFLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSAYEYIHALDSDAVSKSIHTLLS
           240       250       260       270       280       290   

      300       310       320       330       340       350        
pF1KB4 KGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFSMDQ
       :::.:.::::.::. :::.: .::.::. . :. : . :.::....:..:.. ::.:..:
CCDS12 KGQAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIVCVHFLISQVEETGVVLSLEQ
           300       310       320       330       340       350   

      360       370       380       390       400       410        
pF1KB4 TESLFKPHLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAIISLDFGN
       ::.  .  ..          .:: :.:..                 :.:::   :::  .
CCDS12 TEQHSRRPIQ----------RGAPSQKDT-----------------PNPGD---SLDTPG
           360                 370                           380   

      420       430       440       450       460       470        
pF1KB4 QNFEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTTPSATSSSSS
         .    :.   . :::   :. : .   .  . .:  .  :     :... .. :.  .
CCDS12 PRIL---AF---LHPPSLSEAA-LAADPRRFCSPDLRRLLGP--ILDGASVAATPSTPLA
                 390        400       410         420       430    

      480       490         500         510        520       530   
pF1KB4 CSTPNSPEDYYTSLDNDLKI--EVIEKLFAM--DTEA-KDQCSTQTDFNELDLETLAPYI
          :.:: .  ..: ..: .  : ...::.   :::: . . .   : . :::: :::::
CCDS12 TRHPQSPLS--ADLPDELPVGTENVHRLFTSGKDTEAVETDLDIAQDADALDLEMLAPYI
          440         450       460       470       480       490  

           540       550       560       570       580       590   
pF1KB4 PMDGEDFQLSPICPEERLLAENPQSTPQHCFSAMTNIFQPLAPVAPHSPFLLDKFQQQLE
        :: .::::.      :   .   ..:.      .  :. :.: :   : :: .. .. .
CCDS12 SMD-DDFQLNASEQLPRAYHRPLGAVPR----PRARSFHGLSPPA-LEPSLLPRWGSDPR
             500       510           520       530        540      

           600        610       620       630       640            
pF1KB4 SKKTEPEH-RPMSSIFFDAGSKASLPPCCGQASTPLSSMGGRSNTQWP-PDP------PL
        . . : .  : .:  . .. : .:     . .  .  .: :   . : :.       ::
CCDS12 LSCSSPSRGDPSASSPMAGARKRTLAQSSEDEDEGVELLGVRPPKRSPSPEHENFLLFPL
        550       560       570       580       590       600      

               650       660          670       680       690      
pF1KB4 HF------GPTKWAVGDQRTEFLG-AAPLG--PPVSPPHVSTFKTRSAKGFGARGPDVLS
        .      ::.  .. :  : .:.   :::  : .  :. .   :. .  :  :      
CCDS12 SLSFLLTGGPAPGSLQDPSTPLLNLNEPLGLGPSLLSPYSDEDTTQPGGPFQPRAGSAQA
        610       620       630       640       650       660      

        700       710       720       730       740       750      
pF1KB4 PAMVALSNKLKLKRQLEYEEQAFQDLSGGDPPGGSTSHLMWKRMKNLRGGSCPLMPDKPL
                                                                   
CCDS12 D                                                           
                                                                   

>>CCDS12681.2 HIF3A gene_id:64344|Hs108|chr19             (669 aa)
 initn: 1351 init1: 577 opt: 1293  Z-score: 1044.8  bits: 204.1 E(32554): 7.1e-52
Smith-Waterman score: 1383; 38.2% identity (64.0% similar) in 714 aa overlap (1-690:1-662)

               10        20        30        40        50        60
pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA
       :.   .. ::..: :::::::::: :::.::::.:.::: ::. ..::.::::::::::.
CCDS12 MALGLQRARSTTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIMRLT
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB4 ISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISKFMG
       ::.:: :.: ..  .: .. . . . .:  ::::::::. :.: .::: .::::.:: .:
CCDS12 ISYLRMHRLCAA--GEWNQVGAGGEPLDACYLKALEGFVMVLTAEGDMAYLSENVSKHLG
               70          80        90       100       110        

              130       140       150       160       170       180
pF1KB4 LTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVTNRG
       :.:.:: ::::::: ::::.::... :. ..   ..... .  ::: : .::: :.:.::
CCDS12 LSQLELIGHSIFDFIHPCDQEELQDALTPQQT--LSRRKVEAPTERCFSLRMKSTLTSRG
      120       130       140       150         160       170      

              190       200       210         220       230        
pF1KB4 RTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGY--KEPLLSCLIIMCEPIQHPSHMDIP
       ::.:::.::::::.:.:....:.  : ..:  :   .:: :.::...:: : ::. .. :
CCDS12 RTLNLKAATWKVLNCSGHMRAYKP-PAQTSPAGSPDSEPPLQCLVLICEAIPHPGSLEPP
        180       190       200        210       220       230     

      240       250       260       270       280       290        
pF1KB4 LDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQNLCT
       :   .::::::.:::::::::::.:. :: :..:.: ::::. :::::. ..:: ..: .
CCDS12 LGRGAFLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSAYEYIHALDSDAVSKSIHTLLS
         240       250       260       270       280       290     

      300       310       320       330       340       350        
pF1KB4 KGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFSMDQ
       :::.:.::::.::. :::.: .::.::. . :. : . :.::....:..:.. ::.:..:
CCDS12 KGQAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIVCVHFLISQVEETGVVLSLEQ
         300       310       320       330       340       350     

      360       370       380       390       400       410        
pF1KB4 TESLFKPHLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAIISLDFGN
       ::.  .  ..          .:: :.:..                 :.:::   :::  .
CCDS12 TEQHSRRPIQ----------RGAPSQKDT-----------------PNPGD---SLDTPG
         360                 370                           380     

      420       430       440       450       460       470        
pF1KB4 QNFEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTTPSATSSSSS
         .    :.   . :::   :. : .   .  . .:  .  :     :... .. :.  .
CCDS12 PRIL---AF---LHPPSLSEAA-LAADPRRFCSPDLRRLLGP--ILDGASVAATPSTPLA
            390          400        410       420         430      

      480       490         500         510        520       530   
pF1KB4 CSTPNSPEDYYTSLDNDLKI--EVIEKLFAM--DTEA-KDQCSTQTDFNELDLETLAPYI
          :.:: .  ..: ..: .  : ...::.   :::: . . .   : . :::: :::::
CCDS12 TRHPQSPLS--ADLPDELPVGTENVHRLFTSGKDTEAVETDLDIAQDADALDLEMLAPYI
        440         450       460       470       480       490    

           540       550       560       570       580       590   
pF1KB4 PMDGEDFQLSPICPEERLLAENPQSTPQHCFSAMTNIFQPLAPVAPHSPFLLDKFQQQLE
        :: .::::.      :   .   ..:.      .  :. :.: :   : :: .. .. .
CCDS12 SMD-DDFQLNASEQLPRAYHRPLGAVPR----PRARSFHGLSPPA-LEPSLLPRWGSDPR
           500       510       520           530        540        

           600        610       620       630       640            
pF1KB4 SKKTEPEH-RPMSSIFFDAGSKASLPPCCGQASTPLSSMGGRSNTQWP-PDP------PL
        . . : .  : .:  . .. : .:     . .  .  .: :   . : :.       ::
CCDS12 LSCSSPSRGDPSASSPMAGARKRTLAQSSEDEDEGVELLGVRPPKRSPSPEHENFLLFPL
      550       560       570       580       590       600        

               650       660          670       680       690      
pF1KB4 HF------GPTKWAVGDQRTEFLG-AAPLG--PPVSPPHVSTFKTRSAKGFGARGPDVLS
        .      ::.  .. :  : .:.   :::  : .  :. .   :. .  :  :      
CCDS12 SLSFLLTGGPAPGSLQDPSTPLLNLNEPLGLGPSLLSPYSDEDTTQPGGPFQPRAGSAQA
      610       620       630       640       650       660        

        700       710       720       730       740       750      
pF1KB4 PAMVALSNKLKLKRQLEYEEQAFQDLSGGDPPGGSTSHLMWKRMKNLRGGSCPLMPDKPL
                                                                   
CCDS12 D                                                           
                                                                   

>>CCDS42580.2 HIF3A gene_id:64344|Hs108|chr19             (600 aa)
 initn: 924 init1: 577 opt: 864  Z-score: 701.5  bits: 140.4 E(32554): 9.4e-33
Smith-Waterman score: 954; 34.6% identity (60.6% similar) in 592 aa overlap (123-690:52-593)

            100       110       120       130       140       150  
pF1KB4 KALEGFIAVVTQDGDMIFLSENISKFMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNG
                                     :.:: ::::::: ::::.::... :. .. 
CCDS42 PSPAASAPTWTRPLSCASPSATCACTASAPQLELIGHSIFDFIHPCDQEELQDALTPQQT
              30        40        50        60        70        80 

            160       170       180       190       200       210  
pF1KB4 SGFGKKSKDMSTERDFFMRMKCTVTNRGRTVNLKSATWKVLHCTGQVKVYNNCPPHNSLC
         ..... .  ::: : .::: :.:.::::.:::.::::::.:.:....:.  : ..:  
CCDS42 --LSRRKVEAPTERCFSLRMKSTLTSRGRTLNLKAATWKVLNCSGHMRAYKP-PAQTSPA
                90       100       110       120       130         

              220       230       240       250       260       270
pF1KB4 GY--KEPLLSCLIIMCEPIQHPSHMDIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPE
       :   .:: :.::...:: : ::. .. ::   .::::::.:::::::::::.:. :: :.
CCDS42 GSPDSEPPLQCLVLICEAIPHPGSLEPPLGRGAFLSRHSLDMKFTYCDDRIAEVAGYSPD
      140       150       160       170       180       190        

              280       290       300       310       320       330
pF1KB4 ELLGRSAYEFYHALDSENMTKSHQNLCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPR
       .:.: ::::. :::::. ..:: ..: .:::.:.::::.::. :::.: .::.::. . :
CCDS42 DLIGCSAYEYIHALDSDAVSKSIHTLLSKGQAVTGQYRFLARSGGYLWTQTQATVVSGGR
      200       210       220       230       240       250        

              340       350       360       370       380       390
pF1KB4 NLQPQCIMCVNYVLSEIEKNDVVFSMDQTESLFKPHLMAMNSIFDSSGKGAVSEKSNFLF
       . : . :.::....:..:.. ::.:..:::.  .  ..          .:: :.:..   
CCDS42 GPQSESIVCVHFLISQVEETGVVLSLEQTEQHSRRPIQ----------RGAPSQKDT---
      260       270       280       290                 300        

              400       410       420       430       440       450
pF1KB4 TKLKEEPEELAQLAPTPGDAIISLDFGNQNFEESSAYGKAILPPSQPWATELRSHSTQSE
                     :.:::   :::  .  .    :.   . :::   :. : .   .  
CCDS42 --------------PNPGD---SLDTPGPRIL---AF---LHPPSLSEAA-LAADPRRFC
                       310          320             330        340 

              460       470       480       490         500        
pF1KB4 AGSLPAFTVPQAAAPGSTTPSATSSSSSCSTPNSPEDYYTSLDNDLKI--EVIEKLFAM-
       . .:  .  :     :... .. :.  .   :.:: .  ..: ..: .  : ...::.  
CCDS42 SPDLRRLLGP--ILDGASVAATPSTPLATRHPQSPLS--ADLPDELPVGTENVHRLFTSG
             350         360       370         380       390       

        510        520       530       540       550       560     
pF1KB4 -DTEA-KDQCSTQTDFNELDLETLAPYIPMDGEDFQLSPICPEERLLAENPQSTPQHCFS
        :::: . . .   : . :::: ::::: :: .::::.      :   .   ..:.    
CCDS42 KDTEAVETDLDIAQDADALDLEMLAPYISMD-DDFQLNASEQLPRAYHRPLGAVPR----
       400       410       420        430       440       450      

         570       580       590       600        610       620    
pF1KB4 AMTNIFQPLAPVAPHSPFLLDKFQQQLESKKTEPEH-RPMSSIFFDAGSKASLPPCCGQA
         .  :. :.: : . : :: .. .. . . . : .  : .:  . .. : .:     . 
CCDS42 PRARSFHGLSPPALE-PSLLPRWGSDPRLSCSSPSRGDPSASSPMAGARKRTLAQSSEDE
            460        470       480       490       500       510 

          630       640                    650       660           
pF1KB4 STPLSSMGGRSNTQWP-PDP------PLHF------GPTKWAVGDQRTEFLG-AAPLG--
       .  .  .: :   . : :.       :: .      ::.  .. :  : .:.   :::  
CCDS42 DEGVELLGVRPPKRSPSPEHENFLLFPLSLSFLLTGGPAPGSLQDPSTPLLNLNEPLGLG
             520       530       540       550       560       570 

      670       680       690       700       710       720        
pF1KB4 PPVSPPHVSTFKTRSAKGFGARGPDVLSPAMVALSNKLKLKRQLEYEEQAFQDLSGGDPP
       : .  :. .   :. .  :  :                                      
CCDS42 PSLLSPYSDEDTTQPGGPFQPRAGSAQAD                               
             580       590       600                               

>>CCDS5045.1 SIM1 gene_id:6492|Hs108|chr6                 (766 aa)
 initn: 842 init1: 378 opt: 835  Z-score: 676.6  bits: 136.1 E(32554): 2.3e-31
Smith-Waterman score: 835; 36.6% identity (68.8% similar) in 382 aa overlap (16-387:2-377)

               10        20        30        40        50        60
pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA
                      ::::..::: :: ::.  :::::. :::: ...:.::::::.::.
CCDS50               MKEKSKNAARTRREKENSEFYELAKLLPLPSAITSQLDKASIIRLT
                             10        20        30        40      

               70        80        90              100       110   
pF1KB4 ISFLRTHKLLSSVCSENESEAEADQQMDNL-------YLKALEGFIAVVTQDGDMIFLSE
        :.:. . ..    .:  ...   . .::.        :..:.::: ::. :: ....::
CCDS50 TSYLKMRVVFPEGLGEAWGHSSRTSPLDNVGRELGSHLLQTLDGFIFVVAPDGKIMYISE
         50        60        70        80        90       100      

           120       130       140       150       160       170   
pF1KB4 NISKFMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMK
       . :  .::.::::::.::... :: ::.:.   :. ..    ..  ...  ::.::.:::
CCDS50 TASVHLGLSQVELTGNSIYEYIHPADHDEMTAVLTAHQ-PYHSHFVQEYEIERSFFLRMK
        110       120       130       140        150       160     

           180       190       200       210       220       230   
pF1KB4 CTVTNRGRTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGYKEPLLSCLIIMCEPIQHPS
       :....:.  ..:  . .::.::.: .:. .     . . :  . .   :. . . .   .
CCDS50 CVLAKRN--AGLTCGGYKVIHCSGYLKIRQYSLDMSPFDGCYQNV--GLVAVGHSLPPSA
         170         180       190       200         210       220 

           240       250       260       270       280       290   
pF1KB4 HMDIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSH
         .: : :. :. : :.:::. . :.:..:: ::.:..:. .. :.  :. :. ..  .:
CCDS50 VTEIKLHSNMFMFRASLDMKLIFLDSRVAELTGYEPQDLIEKTLYHHVHGCDTFHLRCAH
             230       240       250       260       270       280 

           300       310       320       330       340       350   
pF1KB4 QNLCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVV
       . : .::::..  ::.::::::.::... .:...: :. .:.::. :::::.. : . . 
CCDS50 HLLLVKGQVTTKYYRFLAKHGGWVWVQSYATIVHNSRSSRPHCIVSVNYVLTDTEYKGLQ
             290       300       310       320       330       340 

           360       370          380       390       400       410
pF1KB4 FSMDQTESLFKPHLMAMNS---IFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDA
       .:.::  :  :: .   .:    . .. ::: :. :.                       
CCDS50 LSLDQI-SASKPAFSYTSSSTPTMTDNRKGAKSRLSSSKSKSRTSPYPQYSGFHTERSES
              350       360       370       380       390       400

              420       430       440       450       460       470
pF1KB4 IISLDFGNQNFEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTTP
                                                                   
CCDS50 DHDSQWGGSPLTDTASPQLLDPADRPGSQHDASCAYRQFSDRSSLCYGFALDHSRLVEER
              410       420       430       440       450       460

>>CCDS13646.1 SIM2 gene_id:6493|Hs108|chr21               (667 aa)
 initn: 820 init1: 382 opt: 818  Z-score: 663.9  bits: 133.6 E(32554): 1.2e-30
Smith-Waterman score: 847; 29.4% identity (58.4% similar) in 632 aa overlap (16-627:2-586)

               10        20        30        40        50        60
pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA
                      ::::..::. :: ::.  :::::. :::: ...:.::::::.::.
CCDS13               MKEKSKNAAKTRREKENGEFYELAKLLPLPSAITSQLDKASIIRLT
                             10        20        30        40      

               70        80        90              100       110   
pF1KB4 ISFLRTHKLLSSVCSENESEAEADQQMDNL-------YLKALEGFIAVVTQDGDMIFLSE
        :.:. . ..    ..  ..      .:..        :..:.::. ::..:: ....::
CCDS13 TSYLKMRAVFPEGLGDAWGQPSRAGPLDGVAKELGSHLLQTLDGFVFVVASDGKIMYISE
         50        60        70        80        90       100      

           120       130       140       150       160       170   
pF1KB4 NISKFMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMK
       . :  .::.::::::.::... :: ::.:.   :. ..     .  ...  ::.::.:::
CCDS13 TASVHLGLSQVELTGNSIYEYIHPSDHDEMTAVLTAHQPLHH-HLLQEYEIERSFFLRMK
        110       120       130       140        150       160     

           180       190       200          210       220       230
pF1KB4 CTVTNRGRTVNLKSATWKVLHCTGQVKVYN---NCPPHNSLCGYKEPLLSCLIIMCEPIQ
       :....:.  ..:  . .::.::.: .:. .   .   ..: : :.   .  :. . . . 
CCDS13 CVLAKRN--AGLTCSGYKVIHCSGYLKIRQYMLDMSLYDS-C-YQ---IVGLVAVGQSLP
         170         180       190       200            210        

              240       250       260       270       280       290
pF1KB4 HPSHMDIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMT
         .  .: : :. :. : :.:.:. . :.:.::. ::.:..:. .. :.  :. :  .. 
CCDS13 PSAITEIKLYSNMFMFRASLDLKLIFLDSRVTEVTGYEPQDLIEKTLYHHVHGCDVFHLR
      220       230       240       250       260       270        

              300       310       320       330       340       350
pF1KB4 KSHQNLCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKN
        .:. : .::::..  ::.:.:.::.::... .::..: :. .:.::. :::::.::: .
CCDS13 YAHHLLLVKGQVTTKYYRLLSKRGGWVWVQSYATVVHNSRSSRPHCIVSVNYVLTEIEYK
      280       290       300       310       320       330        

              360       370        380       390       400         
pF1KB4 DVVFSMDQTESLFKPHLMAMNSIFDSS-GKGAVSEKSNFLFTKLKEEPEELAQLAPTPGD
       .. .:..:. :  : .    ...  :.  .  :. :.. . :::. .:    : .    :
CCDS13 ELQLSLEQV-STAKSQDSWRTALSTSQETRKLVKPKNTKMKTKLRTNPYPPQQYSSFQMD
      340        350       360       370       380       390       

     410       420       430       440       450       460         
pF1KB4 AIISLDFGNQNFEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTT
        .   ..::    ..:  ..:  ::      ::. :: .:.    :....: .   :   
CCDS13 KLECGQLGNW---RASPPASAAAPP------ELQPHSESSDLLYTPSYSLPFSYHYGHF-
       400          410             420       430       440        

     470       480       490       500       510       520         
pF1KB4 PSATSSSSSCSTPNSPEDYYTSLDNDLKIEVIEKLFAMDTEAKDQCSTQTDFNELDLETL
       :  .   :: . :  :  .     .  ..    ..:     :. .:  :  . .      
CCDS13 PLDSHVFSS-KKPMLPAKFGQPQGSPCEV---ARFFLSTLPASGEC--QWHYAN------
       450        460       470          480         490           

     530       540       550       560       570       580         
pF1KB4 APYIPMDGEDFQLSPICPEERLLAENPQSTPQHCFSAMTNIFQPLAPVAPHSPFLLDKFQ
        : .: ..   .  :         : : .: .:   ...  ..  ::.:    :  :   
CCDS13 -PLVPSSSSPAKNPP---------EPPANTARH---SLVPSYE--APAAAVRRFGEDTAP
          500                510          520         530       540

     590          600       610             620       630       640
pF1KB4 QQLES---KKTEPEHRPMSSIFFDA--GSKASL----PPCCGQASTPLSSMGGRSNTQWP
        .. :    . ::   : ..    :  :.. .:    : ::.   ::             
CCDS13 PSFPSCGHYREEPALGPAKAARQAARDGARLALARAAPECCAPP-TPEAPGAPAQLPFVL
              550       560       570       580        590         

              650       660       670       680       690       700
pF1KB4 PDPPLHFGPTKWAVGDQRTEFLGAAPLGPPVSPPHVSTFKTRSAKGFGARGPDVLSPAMV
                                                                   
CCDS13 LNYHRVLARRGPLGGAAPAASGLACAPGGPEAATGALRLRHPSPAATSPPGAPLPHYLGA
     600       610       620       630       640       650         

>>CCDS9645.1 NPAS3 gene_id:64067|Hs108|chr14              (901 aa)
 initn: 823 init1: 324 opt: 443  Z-score: 361.1  bits: 78.0 E(32554): 8.5e-14
Smith-Waterman score: 727; 33.3% identity (62.1% similar) in 406 aa overlap (19-367:26-419)

                      10        20        30        40        50   
pF1KB4        MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDK
                                :::::: ::.::.  :::::. :::: ...:.:::
CCDS96 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK
               10        20        30        40        50        60

            60        70                         80                
pF1KB4 ASIMRLAISFLRTHKLL-----------------SSVCSENESEAEA-------DQQMDN
       :::.::.::.:. . .                  .:: . .. .. .       . .. .
CCDS96 ASIIRLTISYLKMRDFANQGDPPWNLRMEGPPPNTSVKGAQRRRSPSALAIEVFEAHLGS
               70        80        90       100       110       120

      90       100       110       120       130       140         
pF1KB4 LYLKALEGFIAVVTQDGDMIFLSENISKFMGLTQVELTGHSIFDFTHPCDHEEIRENLSL
         :..:.::. ...:.: ....::..: ..::.:::::: :.::..:: :: :. :.:..
CCDS96 HILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDYVHPGDHVEMAEQLGM
              130       140       150       160       170       180

     150       160                                       170       
pF1KB4 KNGSGFGKKSK--------------------------------DMSTERDFFMRMKCTVT
       :   : :  :.                                : . ::.::.::: :.:
CCDS96 KLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTDNTLERSFFIRMKSTLT
              190       200       210       220       230       240

       180       190       200       210        220       230      
pF1KB4 NRGRTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGYKEP-LLSCLIIMCEPIQHPSHMD
       .::  :..::. .::.: ::....  .   :    :   :  .  :... . .  :.  .
CCDS96 KRG--VHIKSSGYKVIHITGRLRLRVSLS-H----GRTVPSQIMGLVVVAHALPPPTINE
                250       260            270       280       290   

        240       250       260       270       280       290      
pF1KB4 IPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQNL
       . .: . :..: .::... ::..::.. .   : ...:.  :.: :: : :.. .:: .:
CCDS96 VRIDCHMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVEGIRHSHLDL
           300       310       320       330       340       350   

        300       310       320       330       340       350      
pF1KB4 CTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFSM
        .::: :.  :: . :.:::.:.....:.  : .: . . :. :::.::. : .:. ...
CCDS96 LNKGQCVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNPEYKDTPMDI
           360       370       380       390       400       410   

        360       370       380       390       400       410      
pF1KB4 DQTESLFKPHLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAIISLDF
        :      :::                                                 
CCDS96 AQL-----PHLPEKTSESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENSEDPEPDR
                420       430       440       450       460        




870 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Thu Nov  3 14:53:20 2016 done: Thu Nov  3 14:53:21 2016
 Total Scan time:  4.920 Total Display time:  0.250

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com