Result of FASTA (ccds) for pFN21AB7759
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB7759, 447 aa
  1>>>pF1KB7759 447 - 447 aa - 447 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 6.5654+/-0.000749; mu= 13.5755+/- 0.046
 mean_var=117.1488+/-23.417, 0's: 0 Z-trim(113.0): 124  B-trim: 42 in 1/51
 Lambda= 0.118496
 statistics sampled from 13519 (13644) to 13519 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.77), E-opt: 0.2 (0.419), width:  16
 Scan time:  3.020

The best scores are:                                      opt bits E(32554)
CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11         ( 447) 3026 527.8 8.3e-150
CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11        ( 453) 2913 508.5 5.5e-144
CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11        ( 402) 2711 473.9 1.2e-133
CCDS44584.1 NR1H3 gene_id:10062|Hs108|chr11        ( 387) 1646 291.9 7.7e-79
CCDS42593.1 NR1H2 gene_id:7376|Hs108|chr19         ( 460) 1234 221.5 1.4e-57
CCDS58673.1 NR1H2 gene_id:7376|Hs108|chr19         ( 363) 1228 220.4 2.4e-57
CCDS9078.1 NR1H4 gene_id:9971|Hs108|chr12          ( 472)  915 167.0 3.8e-41
CCDS55875.1 NR1H4 gene_id:9971|Hs108|chr12         ( 482)  915 167.0 3.8e-41
CCDS55873.1 NR1H4 gene_id:9971|Hs108|chr12         ( 476)  897 163.9 3.2e-40
CCDS55876.1 NR1H4 gene_id:9971|Hs108|chr12         ( 486)  897 163.9 3.2e-40
CCDS2641.1 THRB gene_id:7068|Hs108|chr3            ( 461)  747 138.2 1.6e-32
CCDS42316.1 THRA gene_id:7067|Hs108|chr17          ( 410)  711 132.0 1.1e-30
CCDS54627.1 NR1I2 gene_id:8856|Hs108|chr3          ( 397)  696 129.5 6.1e-30
CCDS58546.1 THRA gene_id:7067|Hs108|chr17          ( 451)  663 123.9 3.4e-28
CCDS11360.1 THRA gene_id:7067|Hs108|chr17          ( 490)  656 122.7 8.3e-28
CCDS41430.1 NR1I3 gene_id:9970|Hs108|chr1          ( 352)  512 98.0 1.6e-20
CCDS41429.1 NR1I3 gene_id:9970|Hs108|chr1          ( 357)  493 94.7 1.6e-19
CCDS55874.1 NR1H4 gene_id:9971|Hs108|chr12         ( 425)  469 90.7 3.1e-18
CCDS44260.1 NR1I3 gene_id:9970|Hs108|chr1          ( 339)  459 88.9 8.5e-18
CCDS33718.1 NR1D2 gene_id:9975|Hs108|chr3          ( 579)  436 85.1   2e-16
CCDS45671.1 RARA gene_id:5914|Hs108|chr17          ( 365)  431 84.1 2.5e-16
CCDS58237.1 RARG gene_id:5916|Hs108|chr12          ( 432)  430 84.0 3.2e-16
CCDS46775.1 RARB gene_id:5915|Hs108|chr3           ( 336)  424 82.9 5.3e-16
CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17         ( 614)  419 82.3 1.5e-15
CCDS43136.1 NR1I2 gene_id:8856|Hs108|chr3          ( 434)  399 78.7 1.3e-14
CCDS2995.1 NR1I2 gene_id:8856|Hs108|chr3           ( 473)  399 78.8 1.4e-14
CCDS8310.1 PGR gene_id:5241|Hs108|chr11            ( 933)  402 79.5 1.6e-14
CCDS5234.1 ESR1 gene_id:2099|Hs108|chr6            ( 595)  398 78.7 1.8e-14
CCDS8757.1 VDR gene_id:7421|Hs108|chr12            ( 427)  385 76.3 6.6e-14
CCDS3772.1 NR3C2 gene_id:4306|Hs108|chr4           ( 984)  390 77.5 6.9e-14
CCDS55820.1 VDR gene_id:7421|Hs108|chr12           ( 477)  385 76.4 7.1e-14
CCDS41790.1 RARG gene_id:5916|Hs108|chr12          ( 443)  375 74.6 2.2e-13
CCDS53409.1 NR1I3 gene_id:9970|Hs108|chr1          ( 319)  368 73.3 3.9e-13
CCDS61469.1 ESR2 gene_id:2100|Hs108|chr14          ( 439)  353 70.9   3e-12
CCDS61470.1 ESR2 gene_id:2100|Hs108|chr14          ( 474)  353 70.9 3.2e-12
CCDS55920.1 ESR2 gene_id:2100|Hs108|chr14          ( 481)  353 70.9 3.2e-12
CCDS32096.1 ESR2 gene_id:2100|Hs108|chr14          ( 495)  353 70.9 3.3e-12
CCDS9762.1 ESR2 gene_id:2100|Hs108|chr14           ( 530)  353 70.9 3.4e-12
CCDS73751.1 NR2E3 gene_id:10002|Hs108|chr15        ( 367)  347 69.8 5.3e-12
CCDS2642.1 RARB gene_id:5915|Hs108|chr3            ( 448)  348 70.0 5.5e-12
CCDS73750.1 NR2E3 gene_id:10002|Hs108|chr15        ( 410)  347 69.8 5.7e-12
CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5           ( 423)  347 69.8 5.9e-12
CCDS44261.1 NR1I3 gene_id:9970|Hs108|chr1          ( 340)  345 69.4 6.3e-12
CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20         ( 449)  346 69.7 6.9e-12
CCDS1228.1 NR1I3 gene_id:9970|Hs108|chr1           ( 348)  343 69.1 8.1e-12
CCDS53405.1 NR1I3 gene_id:9970|Hs108|chr1          ( 296)  341 68.7 9.1e-12
CCDS2610.2 PPARG gene_id:5468|Hs108|chr3           ( 477)  344 69.4 9.2e-12
CCDS44262.1 NR1I3 gene_id:9970|Hs108|chr1          ( 309)  341 68.7 9.4e-12
CCDS41428.1 NR1I3 gene_id:9970|Hs108|chr1          ( 314)  341 68.7 9.5e-12
CCDS2609.1 PPARG gene_id:5468|Hs108|chr3           ( 505)  344 69.4 9.6e-12


>>CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11              (447 aa)
 initn: 3026 init1: 3026 opt: 3026  Z-score: 2803.0  bits: 527.8 E(32554): 8.3e-150
Smith-Waterman score: 3026; 100.0% identity (100.0% similar) in 447 aa overlap (1-447:1-447)

               10        20        30        40        50        60
pF1KB7 MSLWLGAPVPDIPPDSAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTAGVGLEA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS79 MSLWLGAPVPDIPPDSAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTAGVGLEA
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB7 AEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS79 AEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKG
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB7 FFRRSVIKGAHYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS79 FFRRSVIKGAHYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLK
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB7 RQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLRVTPWPM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS79 RQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLRVTPWPM
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB7 APDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS79 APDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLL
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB7 ETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS79 ETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLI
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB7 AISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS79 AISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSV
              370       380       390       400       410       420

              430       440       
pF1KB7 HSEQVFALRLQDKKLPPLLSEIWDVHE
       :::::::::::::::::::::::::::
CCDS79 HSEQVFALRLQDKKLPPLLSEIWDVHE
              430       440       

>>CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11             (453 aa)
 initn: 2910 init1: 2910 opt: 2913  Z-score: 2698.5  bits: 508.5 E(32554): 5.5e-144
Smith-Waterman score: 2913; 99.1% identity (99.1% similar) in 438 aa overlap (13-447:16-453)

                  10           20        30        40        50    
pF1KB7    MSLWLGAPVPDIPPD---SAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTA
                      ::    :::::::::::::::::::::::::::::::::::::::
CCDS73 MQQTSWNPLGGTCKQPPGRTHSAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTA
               10        20        30        40        50        60

           60        70        80        90       100       110    
pF1KB7 GVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 GVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLS
               70        80        90       100       110       120

          120       130       140       150       160       170    
pF1KB7 CEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 CEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQI
              130       140       150       160       170       180

          180       190       200       210       220       230    
pF1KB7 RLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 RLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLR
              190       200       210       220       230       240

          240       250       260       270       280       290    
pF1KB7 VTPWPMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 VTPWPMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSA
              250       260       270       280       290       300

          300       310       320       330       340       350    
pF1KB7 IEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 IEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDA
              310       320       330       340       350       360

          360       370       380       390       400       410    
pF1KB7 EFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 EFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSL
              370       380       390       400       410       420

          420       430       440       
pF1KB7 RTLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE
       :::::::::::::::::::::::::::::::::
CCDS73 RTLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE
              430       440       450   

>>CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11             (402 aa)
 initn: 2711 init1: 2711 opt: 2711  Z-score: 2512.6  bits: 473.9 E(32554): 1.2e-133
Smith-Waterman score: 2711; 100.0% identity (100.0% similar) in 402 aa overlap (46-447:1-402)

          20        30        40        50        60        70     
pF1KB7 SAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSE
                                     ::::::::::::::::::::::::::::::
CCDS44                               MPHSAGGTAGVGLEAAEPTALLTRAEPPSE
                                             10        20        30

          80        90       100       110       120       130     
pF1KB7 PTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICH
               40        50        60        70        80        90

         140       150       160       170       180       190     
pF1KB7 SGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPR
              100       110       120       130       140       150

         200       210       220       230       240       250     
pF1KB7 ASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLRVTPWPMAPDPHSREARQQRFA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLRVTPWPMAPDPHSREARQQRFA
              160       170       180       190       200       210

         260       270       280       290       300       310     
pF1KB7 HFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYNPGSESITF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 HFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYNPGSESITF
              220       230       240       250       260       270

         320       330       340       350       360       370     
pF1KB7 LKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQ
              280       290       300       310       320       330

         380       390       400       410       420       430     
pF1KB7 LQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKL
              340       350       360       370       380       390

         440       
pF1KB7 PPLLSEIWDVHE
       ::::::::::::
CCDS44 PPLLSEIWDVHE
              400  

>>CCDS44584.1 NR1H3 gene_id:10062|Hs108|chr11             (387 aa)
 initn: 1646 init1: 1646 opt: 1646  Z-score: 1528.9  bits: 291.9 E(32554): 7.7e-79
Smith-Waterman score: 2498; 86.6% identity (86.6% similar) in 447 aa overlap (1-447:1-387)

               10        20        30        40        50        60
pF1KB7 MSLWLGAPVPDIPPDSAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTAGVGLEA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MSLWLGAPVPDIPPDSAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTAGVGLEA
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB7 AEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKG
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB7 FFRRSVIKGAHYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 FFRRSVIKGAHYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLK
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB7 RQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLRVTPWPM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::    
CCDS44 RQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLRVT----
              190       200       210       220       230          

              250       260       270       280       290       300
pF1KB7 APDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLL
                                                               ::::
CCDS44 --------------------------------------------------------VMLL
                                                                240

              310       320       330       340       350       360
pF1KB7 ETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLI
              250       260       270       280       290       300

              370       380       390       400       410       420
pF1KB7 AISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSV
              310       320       330       340       350       360

              430       440       
pF1KB7 HSEQVFALRLQDKKLPPLLSEIWDVHE
       :::::::::::::::::::::::::::
CCDS44 HSEQVFALRLQDKKLPPLLSEIWDVHE
              370       380       

>>CCDS42593.1 NR1H2 gene_id:7376|Hs108|chr19              (460 aa)
 initn: 1837 init1: 1228 opt: 1234  Z-score: 1147.2  bits: 221.5 E(32554): 1.4e-57
Smith-Waterman score: 1835; 63.0% identity (78.6% similar) in 459 aa overlap (13-447:4-460)

               10        20        30        40        50        60
pF1KB7 MSLWLGAPVPDIPPDSAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTAGVGLEA
                   :  :...   ::    .  : ..:  . .::.  :  .:    :    
CCDS42          MSSPTTSSLDTPLPGNGPPQPGAPSSSPTV-KEEGPEPWPGGPDPDVPGTD
                        10        20        30         40        50

               70        80        90       100       110       120
pF1KB7 AEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKG
          .:  :    : .: :   .::::::::::::.::: :::::::::::::::::::::
CCDS42 EASSACSTDWVIP-DPEEEPERKRKKGPAPKMLGHELCRVCGDKASGFHYNVLSCEGCKG
               60         70        80        90       100         

              130         140       150       160       170        
pF1KB7 FFRRSVIKGA--HYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKK
       ::::::..:.  .: :..:: : ::..::::::.::::::..:::::.::::::::: ::
CCDS42 FFRRSVVRGGARRYACRGGGTCQMDAFMRRKCQQCRLRKCKEAGMREQCVLSEEQIRKKK
     110       120       130       140       150       160         

      180       190             200                       210      
pF1KB7 LKRQEEEQAHATSLP--PRASSP----PQILP----------------QLSPEQLGMIEK
       ...:..:.   .. :  :..::     :   :                ::.  :  ::..
CCDS42 IRKQQQESQSQSQSPVGPQGSSSSASGPGASPGGSEAGSQGSGEGEGVQLTAAQELMIQQ
     170       180       190       200       210       220         

        220       230       240       250       260       270      
pF1KB7 LVAAQQQCNRRSFSDRLRVTPWPMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLP
       ::::: :::.:::::. .:::::.. ::.::.::::::::::::::.:::::::::::.:
CCDS42 LVAAQLQCNKRSFSDQPKVTPWPLGADPQSRDARQQRFAHFTELAIISVQEIVDFAKQVP
     230       240       250       260       270       280         

        280       290       300       310       320       330      
pF1KB7 GFLQLSREDQIALLKTSAIEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFI
       :::::.:::::::::.:.::.:::::.::::  .: :::::::.:...:: .::::::::
CCDS42 GFLQLGREDQIALLKASTIEIMLLETARRYNHETECITFLKDFTYSKDDFHRAGLQVEFI
     290       300       310       320       330       340         

        340       350       360       370       380       390      
pF1KB7 NPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIH
       :::::::::: .: :.:::.::::::.::::::::::.  .:: ::. ::::: .:. :.
CCDS42 NPIFEFSRAMRRLGLDDAEYALLIAINIFSADRPNVQEPGRVEALQQPYVEALLSYTRIK
     350       360       370       380       390       400         

        400       410       420       430       440       
pF1KB7 HPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE
       .:.:.: ::::::::::::::::::::::::::::::::::::::::::::
CCDS42 RPQDQLRFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE
     410       420       430       440       450       460

>>CCDS58673.1 NR1H2 gene_id:7376|Hs108|chr19              (363 aa)
 initn: 1300 init1: 1228 opt: 1228  Z-score: 1143.0  bits: 220.4 E(32554): 2.4e-57
Smith-Waterman score: 1274; 67.9% identity (83.1% similar) in 302 aa overlap (168-447:62-363)

       140       150       160       170       180       190       
pF1KB7 GHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLP--PR
                                     :::::::: ::...:..:.   .. :  :.
CCDS58 EEGPEPWPGGPDPDVPGTDEASSACSTDWGVLSEEQIRKKKIRKQQQESQSQSQSPVGPQ
              40        50        60        70        80        90 

             200                       210       220       230     
pF1KB7 ASSP----PQILP----------------QLSPEQLGMIEKLVAAQQQCNRRSFSDRLRV
       .::     :   :                ::.  :  ::..::::: :::.:::::. .:
CCDS58 GSSSSASGPGASPGGSEAGSQGSGEGEGVQLTAAQELMIQQLVAAQLQCNKRSFSDQPKV
             100       110       120       130       140       150 

         240       250       260       270       280       290     
pF1KB7 TPWPMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSAI
       ::::.. ::.::.::::::::::::::.:::::::::::.::::::.:::::::::.:.:
CCDS58 TPWPLGADPQSRDARQQRFAHFTELAIISVQEIVDFAKQVPGFLQLGREDQIALLKASTI
             160       170       180       190       200       210 

         300       310       320       330       340       350     
pF1KB7 EVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAE
       :.:::::.::::  .: :::::::.:...:: .:::::::::::::::::: .: :.:::
CCDS58 EIMLLETARRYNHETECITFLKDFTYSKDDFHRAGLQVEFINPIFEFSRAMRRLGLDDAE
             220       230       240       250       260       270 

         360       370       380       390       400       410     
pF1KB7 FALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLR
       .::::::.::::::::::.  .:: ::. ::::: .:. :..:.:.: ::::::::::::
CCDS58 YALLIAINIFSADRPNVQEPGRVEALQQPYVEALLSYTRIKRPQDQLRFPRMLMKLVSLR
             280       290       300       310       320       330 

         420       430       440       
pF1KB7 TLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE
       ::::::::::::::::::::::::::::::::
CCDS58 TLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE
             340       350       360   

>>CCDS9078.1 NR1H4 gene_id:9971|Hs108|chr12               (472 aa)
 initn: 862 init1: 462 opt: 915  Z-score: 852.3  bits: 167.0 E(32554): 3.8e-41
Smith-Waterman score: 915; 39.1% identity (68.5% similar) in 391 aa overlap (63-446:92-472)

             40        50        60        70        80        90  
pF1KB7 QGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKM
                                     :.  : ..:       .  . :  . : ..
CCDS90 SSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRI
              70        80        90       100       110       120 

            100       110       120       130       140       150  
pF1KB7 LGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQE
        :.::: ::::.:::.:::.:.:::::::::::. :.: : :..::.: :: ::::::::
CCDS90 KGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQE
             130       140       150       160       170       180 

            160       170       180       190       200       210  
pF1KB7 CRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLG
       ::::::.. ::  ::.:.: : . :.:... ...:  :      .:  . : :..    .
CCDS90 CRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTV---NEDSEGRDLRQVTSTTKS
             190       200       210       220          230        

             220       230         240        250       260        
pF1KB7 MIEKL-VAAQQQCNRRSFSDRL--RVTPWPMAPDPHSRE-ARQQRFAHFTELAIVSVQEI
         ::  .. .::   . . :    .  :  ..    ..: . .. :  .::.:   :: .
CCDS90 CREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNHVQVL
      240       250       260       270       280       290        

      270       280       290       300          310       320     
pF1KB7 VDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYN---PGSESITFLKDFSYNRED
       :.:.:.::::  :..:::::::: ::.:.:.:.... .:   :...:     :.  .:  
CCDS90 VEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHS-----DLLEER--
      300       310       320       330       340            350   

         330       340       350       360       370       380     
pF1KB7 FAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTY
       . ..:.. :.:.:.: : ....::.... :.::: :: :.: ::  ..:.  ::.::.  
CCDS90 IRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPL
             360       370       380       390       400       410 

         390       400       410       420       430       440     
pF1KB7 VEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWDV
       ...:.   .::.:..   :  .: .:. :::..  :.:.... :..:.:. ::: :::::
CCDS90 LDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDV
             420       430       440       450       460       470 

         
pF1KB7 HE
       . 
CCDS90 Q 
         

>>CCDS55875.1 NR1H4 gene_id:9971|Hs108|chr12              (482 aa)
 initn: 891 init1: 462 opt: 915  Z-score: 852.1  bits: 167.0 E(32554): 3.8e-41
Smith-Waterman score: 915; 39.1% identity (68.5% similar) in 391 aa overlap (63-446:102-482)

             40        50        60        70        80        90  
pF1KB7 QGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKM
                                     :.  : ..:       .  . :  . : ..
CCDS55 SSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRI
              80        90       100       110       120       130 

            100       110       120       130       140       150  
pF1KB7 LGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQE
        :.::: ::::.:::.:::.:.:::::::::::. :.: : :..::.: :: ::::::::
CCDS55 KGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQE
             140       150       160       170       180       190 

            160       170       180       190       200       210  
pF1KB7 CRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLG
       ::::::.. ::  ::.:.: : . :.:... ...:  :      .:  . : :..    .
CCDS55 CRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTV---NEDSEGRDLRQVTSTTKS
             200       210       220       230          240        

             220       230         240        250       260        
pF1KB7 MIEKL-VAAQQQCNRRSFSDRL--RVTPWPMAPDPHSRE-ARQQRFAHFTELAIVSVQEI
         ::  .. .::   . . :    .  :  ..    ..: . .. :  .::.:   :: .
CCDS55 CREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNHVQVL
      250       260       270       280       290       300        

      270       280       290       300          310       320     
pF1KB7 VDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYN---PGSESITFLKDFSYNRED
       :.:.:.::::  :..:::::::: ::.:.:.:.... .:   :...:     :.  .:  
CCDS55 VEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHS-----DLLEER--
      310       320       330       340       350            360   

         330       340       350       360       370       380     
pF1KB7 FAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTY
       . ..:.. :.:.:.: : ....::.... :.::: :: :.: ::  ..:.  ::.::.  
CCDS55 IRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPL
             370       380       390       400       410       420 

         390       400       410       420       430       440     
pF1KB7 VEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWDV
       ...:.   .::.:..   :  .: .:. :::..  :.:.... :..:.:. ::: :::::
CCDS55 LDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDV
             430       440       450       460       470       480 

         
pF1KB7 HE
       . 
CCDS55 Q 
         

>>CCDS55873.1 NR1H4 gene_id:9971|Hs108|chr12              (476 aa)
 initn: 820 init1: 420 opt: 897  Z-score: 835.6  bits: 163.9 E(32554): 3.2e-40
Smith-Waterman score: 897; 38.7% identity (67.8% similar) in 395 aa overlap (63-446:92-476)

             40        50        60        70        80        90  
pF1KB7 QGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKM
                                     :.  : ..:       .  . :  . : ..
CCDS55 SSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRI
              70        80        90       100       110       120 

            100       110       120       130       140       150  
pF1KB7 LGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQE
        :.::: ::::.:::.:::.:.:::::::::::. :.: : :..::.: :: ::::::::
CCDS55 KGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQE
             130       140       150       160       170       180 

            160           170       180       190       200        
pF1KB7 CRLRKCRQAGMREECV----LSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSP
       ::::::.. ::  ::.    :.: : . :.:... ...:  :      .:  . : :.. 
CCDS55 CRLRKCKEMGMLAECMYTGLLTEIQCKSKRLRKNVKQHADQTV---NEDSEGRDLRQVTS
             190       200       210       220          230        

      210        220       230         240        250       260    
pF1KB7 EQLGMIEKL-VAAQQQCNRRSFSDRL--RVTPWPMAPDPHSRE-ARQQRFAHFTELAIVS
          .  ::  .. .::   . . :    .  :  ..    ..: . .. :  .::.:   
CCDS55 TTKSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNH
      240       250       260       270       280       290        

          270       280       290       300          310       320 
pF1KB7 VQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYN---PGSESITFLKDFSY
       :: .:.:.:.::::  :..:::::::: ::.:.:.:.... .:   :...:     :.  
CCDS55 VQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHS-----DLLE
      300       310       320       330       340            350   

             330       340       350       360       370       380 
pF1KB7 NREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERL
       .:  . ..:.. :.:.:.: : ....::.... :.::: :: :.: ::  ..:.  ::.:
CCDS55 ER--IRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKL
             360       370       380       390       400       410 

             390       400       410       420       430       440 
pF1KB7 QHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSE
       :.  ...:.   .::.:..   :  .: .:. :::..  :.:.... :..:.:. ::: :
CCDS55 QEPLLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCE
             420       430       440       450       460       470 

             
pF1KB7 IWDVHE
       ::::. 
CCDS55 IWDVQ 
             

>>CCDS55876.1 NR1H4 gene_id:9971|Hs108|chr12              (486 aa)
 initn: 873 init1: 420 opt: 897  Z-score: 835.5  bits: 163.9 E(32554): 3.2e-40
Smith-Waterman score: 897; 38.7% identity (67.8% similar) in 395 aa overlap (63-446:102-486)

             40        50        60        70        80        90  
pF1KB7 QGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKM
                                     :.  : ..:       .  . :  . : ..
CCDS55 SSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRI
              80        90       100       110       120       130 

            100       110       120       130       140       150  
pF1KB7 LGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQE
        :.::: ::::.:::.:::.:.:::::::::::. :.: : :..::.: :: ::::::::
CCDS55 KGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQE
             140       150       160       170       180       190 

            160           170       180       190       200        
pF1KB7 CRLRKCRQAGMREECV----LSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSP
       ::::::.. ::  ::.    :.: : . :.:... ...:  :      .:  . : :.. 
CCDS55 CRLRKCKEMGMLAECMYTGLLTEIQCKSKRLRKNVKQHADQTV---NEDSEGRDLRQVTS
             200       210       220       230          240        

      210        220       230         240        250       260    
pF1KB7 EQLGMIEKL-VAAQQQCNRRSFSDRL--RVTPWPMAPDPHSRE-ARQQRFAHFTELAIVS
          .  ::  .. .::   . . :    .  :  ..    ..: . .. :  .::.:   
CCDS55 TTKSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNH
      250       260       270       280       290       300        

          270       280       290       300          310       320 
pF1KB7 VQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYN---PGSESITFLKDFSY
       :: .:.:.:.::::  :..:::::::: ::.:.:.:.... .:   :...:     :.  
CCDS55 VQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHS-----DLLE
      310       320       330       340       350            360   

             330       340       350       360       370       380 
pF1KB7 NREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERL
       .:  . ..:.. :.:.:.: : ....::.... :.::: :: :.: ::  ..:.  ::.:
CCDS55 ER--IRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKL
             370       380       390       400       410       420 

             390       400       410       420       430       440 
pF1KB7 QHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSE
       :.  ...:.   .::.:..   :  .: .:. :::..  :.:.... :..:.:. ::: :
CCDS55 QEPLLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCE
             430       440       450       460       470       480 

             
pF1KB7 IWDVHE
       ::::. 
CCDS55 IWDVQ 
             




447 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Fri Nov  4 22:11:33 2016 done: Fri Nov  4 22:11:33 2016
 Total Scan time:  3.020 Total Display time:  0.060

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com