Result of FASTA (ccds) for pF1KB5869
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB5869, 463 aa
  1>>>pF1KB5869 463 - 463 aa - 463 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 8.4156+/-0.000893; mu= 4.1307+/- 0.054
 mean_var=165.3627+/-33.545, 0's: 0 Z-trim(111.8): 125  B-trim: 0 in 0/52
 Lambda= 0.099737
 statistics sampled from 12541 (12666) to 12541 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.737), E-opt: 0.2 (0.389), width:  16
 Scan time:  3.440

The best scores are:                                      opt bits E(32554)
CCDS1248.1 RXRG gene_id:6258|Hs108|chr1            ( 463) 3107 458.9 4.9e-129
CCDS72970.1 RXRG gene_id:6258|Hs108|chr1           ( 340) 2280 339.9 2.5e-93
CCDS35172.1 RXRA gene_id:6256|Hs108|chr9           ( 462) 2162 323.0 4.2e-88
CCDS4768.1 RXRB gene_id:6257|Hs108|chr6            ( 533) 1942 291.3 1.6e-78
CCDS59007.1 RXRB gene_id:6257|Hs108|chr6           ( 537) 1785 268.8   1e-71
CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15         ( 414)  976 152.3   9e-37
CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5           ( 423)  976 152.3 9.1e-37
CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20         ( 417)  903 141.8 1.3e-33
CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20         ( 464)  903 141.8 1.4e-33
CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20         ( 474)  903 141.8 1.5e-33
CCDS6220.2 HNF4G gene_id:3174|Hs108|chr8           ( 445)  902 141.7 1.5e-33
CCDS68131.1 HNF4A gene_id:3172|Hs108|chr20         ( 395)  898 141.1 2.1e-33
CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20         ( 442)  898 141.1 2.3e-33
CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20         ( 449)  898 141.1 2.3e-33
CCDS42876.1 HNF4A gene_id:3172|Hs108|chr20         ( 452)  898 141.1 2.3e-33
CCDS83303.1 HNF4G gene_id:3174|Hs108|chr8          ( 408)  897 140.9 2.3e-33
CCDS45359.1 NR2F2 gene_id:7026|Hs108|chr15         ( 261)  571 93.9 2.1e-19
CCDS45358.1 NR2F2 gene_id:7026|Hs108|chr15         ( 281)  571 93.9 2.3e-19
CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12          ( 598)  524 87.3 4.6e-17
CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12         ( 611)  524 87.3 4.7e-17
CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12         ( 652)  524 87.4   5e-17
CCDS74905.1 NR2C2 gene_id:7182|Hs108|chr3          ( 596)  486 81.9   2e-15
CCDS2621.1 NR2C2 gene_id:7182|Hs108|chr3           ( 615)  486 81.9 2.1e-15
CCDS58060.1 ESRRG gene_id:2104|Hs108|chr1          ( 396)  472 79.8 5.8e-15
CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12         ( 467)  470 79.5 8.2e-15
CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12         ( 483)  470 79.5 8.4e-15
CCDS9051.1 NR2C1 gene_id:7181|Hs108|chr12          ( 603)  470 79.6   1e-14
CCDS73750.1 NR2E3 gene_id:10002|Hs108|chr15        ( 410)  444 75.7 9.8e-14
CCDS11366.1 RARA gene_id:5914|Hs108|chr17          ( 462)  438 74.9   2e-13
CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9           ( 443)  430 73.7 4.2e-13
CCDS8850.1 RARG gene_id:5916|Hs108|chr12           ( 454)  430 73.7 4.3e-13
CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19         ( 404)  427 73.3 5.3e-13
CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9           ( 626)  430 73.8 5.7e-13
CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9           ( 637)  430 73.8 5.7e-13
CCDS2642.1 RARB gene_id:5915|Hs108|chr3            ( 448)  425 73.0   7e-13
CCDS42317.1 RARA gene_id:5914|Hs108|chr17          ( 457)  424 72.9 7.9e-13
CCDS58236.1 RARG gene_id:5916|Hs108|chr12          ( 382)  422 72.6 8.3e-13
CCDS41790.1 RARG gene_id:5916|Hs108|chr12          ( 443)  422 72.6 9.4e-13
CCDS10177.1 RORA gene_id:6095|Hs108|chr15          ( 523)  395 68.7 1.6e-11
CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2           ( 598)  395 68.8 1.8e-11
CCDS69165.1 NR2E1 gene_id:7101|Hs108|chr6          ( 422)  391 68.1   2e-11
CCDS35137.1 NR6A1 gene_id:2649|Hs108|chr9          ( 480)  392 68.3   2e-11
CCDS33669.1 PPARA gene_id:5465|Hs108|chr22         ( 468)  388 67.7 2.9e-11
CCDS55340.1 NR6A1 gene_id:2649|Hs108|chr9          ( 475)  388 67.7   3e-11
CCDS65127.1 NR6A1 gene_id:2649|Hs108|chr9          ( 476)  388 67.7   3e-11
CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17         ( 614)  390 68.1   3e-11
CCDS6646.1 RORB gene_id:6096|Hs108|chr9            ( 459)  387 67.6 3.2e-11
CCDS73751.1 NR2E3 gene_id:10002|Hs108|chr15        ( 367)  385 67.2 3.2e-11
CCDS1401.1 NR5A2 gene_id:2494|Hs108|chr1           ( 541)  388 67.7 3.3e-11
CCDS45271.1 RORA gene_id:6095|Hs108|chr15          ( 468)  385 67.3 3.9e-11


>>CCDS1248.1 RXRG gene_id:6258|Hs108|chr1                 (463 aa)
 initn: 3107 init1: 3107 opt: 3107  Z-score: 2430.1  bits: 458.9 E(32554): 4.9e-129
Smith-Waterman score: 3107; 100.0% identity (100.0% similar) in 463 aa overlap (1-463:1-463)

               10        20        30        40        50        60
pF1KB5 MYGNYSHFMKFPAGYGGSPGHTGSTSMSPSAALSTGKPMDSHPSYTDTPVSAPRTLSAVG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MYGNYSHFMKFPAGYGGSPGHTGSTSMSPSAALSTGKPMDSHPSYTDTPVSAPRTLSAVG
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB5 TPLNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNVVNSVSSSEDIKPLPGLPG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 TPLNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNVVNSVSSSEDIKPLPGLPG
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB5 IGNMNYPSTSPGSLVKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCRDNKD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 IGNMNYPSTSPGSLVKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCRDNKD
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB5 CLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDMPVERIL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 CLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDMPVERIL
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB5 EAELAVEPKTESYGDMNMENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLEDQVI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 EAELAVEPKTESYGDMNMENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLEDQVI
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB5 LLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVSKMKD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVSKMKD
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB5 MQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRFAKLL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRFAKLL
              370       380       390       400       410       420

              430       440       450       460   
pF1KB5 LRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT
       :::::::::::::::::::::::::::::::::::::::::::
CCDS12 LRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT
              430       440       450       460   

>>CCDS72970.1 RXRG gene_id:6258|Hs108|chr1                (340 aa)
 initn: 2280 init1: 2280 opt: 2280  Z-score: 1789.0  bits: 339.9 E(32554): 2.5e-93
Smith-Waterman score: 2280; 100.0% identity (100.0% similar) in 340 aa overlap (124-463:1-340)

           100       110       120       130       140       150   
pF1KB5 APPSSQLNVVNSVSSSEDIKPLPGLPGIGNMNYPSTSPGSLVKHICAICGDRSSGKHYGV
                                     ::::::::::::::::::::::::::::::
CCDS72                               MNYPSTSPGSLVKHICAICGDRSSGKHYGV
                                             10        20        30

           160       170       180       190       200       210   
pF1KB5 YSCEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEER
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 YSCEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEER
               40        50        60        70        80        90

           220       230       240       250       260       270   
pF1KB5 QRSRERAESEAECATSGHEDMPVERILEAELAVEPKTESYGDMNMENSTNDPVTNICHAA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 QRSRERAESEAECATSGHEDMPVERILEAELAVEPKTESYGDMNMENSTNDPVTNICHAA
              100       110       120       130       140       150

           280       290       300       310       320       330   
pF1KB5 DKQLFTLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 DKQLFTLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHV
              160       170       180       190       200       210

           340       350       360       370       380       390   
pF1KB5 HRSSAHSAGVGSIFDRVLTELVSKMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 HRSSAHSAGVGSIFDRVLTELVSKMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETL
              220       230       240       250       260       270

           400       410       420       430       440       450   
pF1KB5 REKVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 REKVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLM
              280       290       300       310       320       330

           460   
pF1KB5 EMLETPLQIT
       ::::::::::
CCDS72 EMLETPLQIT
              340

>>CCDS35172.1 RXRA gene_id:6256|Hs108|chr9                (462 aa)
 initn: 2139 init1: 1217 opt: 2162  Z-score: 1695.3  bits: 323.0 E(32554): 4.2e-88
Smith-Waterman score: 2162; 74.1% identity (87.2% similar) in 452 aa overlap (18-463:21-462)

                  10        20         30        40        50      
pF1KB5    MYGNYSHFMKFPAGYGGSPGHTGSTSMS-PSAALSTGKPMDSHPSYTDTPVSAPRTL
                           ::  ::  ::. ::   : :  . : :.   .:.:   ::
CCDS35 MDTKHFLPLDFSTQVNSSLTSP--TGRGSMAAPSLHPSLGPGIGS-PGQLHSPIS---TL
               10        20          30        40         50       

         60        70        80        90       100        110     
pF1KB5 SAVGTPLNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNV-VNSVSSSEDIKPL
       :   .:.:..: :. ::.: ::: : .. . : ... .  : ::.  .: ::::::::: 
CCDS35 S---SPINGMGPPFSVISSPMGPHSMSVPTTPTLGF-STGSPQLSSPMNPVSSSEDIKPP
              60        70        80         90       100       110

         120        130       140       150       160       170    
pF1KB5 PGLPGIGNM-NYPSTSPGSLVKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYT
        :: :. ..  .:: . .:..:::::::::::::::::::::::::::::::.:::: ::
CCDS35 LGLNGVLKVPAHPSGNMASFTKHICAICGDRSSGKHYGVYSCEGCKGFFKRTVRKDLTYT
              120       130       140       150       160       170

          180       190       200       210       220       230    
pF1KB5 CRDNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDM
       ::::::::::::::::::::::::::.::::::::::::::...: :.:.: ..:..:::
CCDS35 CRDNKDCLIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQRGKDRNENEVESTSSANEDM
              180       190       200       210       220       230

          240       250          260       270       280       290 
pF1KB5 PVERILEAELAVEPKTESYGDMNM---ENSTNDPVTNICHAADKQLFTLVEWAKRIPHFS
       :::::::::::::::::.: . ::    .: ::::::::.::::::::::::::::::::
CCDS35 PVERILEAELAVEPKTETYVEANMGLNPSSPNDPVTNICQAADKQLFTLVEWAKRIPHFS
              240       250       260       270       280       290

             300       310       320       330       340       350 
pF1KB5 DLTLEDQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVL
       .: :.::::::::::::::::::::::..:.:::::::::::::.::::::::.::::::
CCDS35 ELPLDDQVILLRAGWNELLIASFSHRSIAVKDGILLATGLHVHRNSAHSAGVGAIFDRVL
              300       310       320       330       340       350

             360       370       380       390       400       410 
pF1KB5 TELVSKMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPE
       :::::::.::::::.::::::::::::::.::::::.:::.:::::::.:::: :.::::
CCDS35 TELVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEAYCKHKYPE
              360       370       380       390       400       410

             420       430       440       450       460   
pF1KB5 QPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT
       ::::::::::::::::::::::::::::::::::::::::::::::.: :.:
CCDS35 QPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQMT
              420       430       440       450       460  

>>CCDS4768.1 RXRB gene_id:6257|Hs108|chr6                 (533 aa)
 initn: 1926 init1: 1199 opt: 1942  Z-score: 1523.2  bits: 291.3 E(32554): 1.6e-78
Smith-Waterman score: 1984; 67.4% identity (81.8% similar) in 473 aa overlap (13-462:68-532)

                                 10        20        30            
pF1KB5                   MYGNYSHFMKFPAGYGGSPGHTGSTSMSPSAA----LSTGKP
                                     ::  :  : .:  : ::...    :  : :
CCDS47 RRRPWLDPAAAAAAAVAGGEQQTPEPEPGEAGRDGM-GDSGRDSRSPDSSSPNPLPQGVP
        40        50        60        70         80        90      

       40        50        60              70        80        90  
pF1KB5 MDSHPSYTDTPVSAPRTLSAVGTPLNA------LGSPYRVITSAMGPPSGALAAPPGINL
         : :.    : .:: .:.. :.:         ::::. ::.:.:: :.    ::::.. 
CCDS47 PPSPPGPPLPPSTAP-SLGGSGAPPPPPMPPPPLGSPFPVISSSMGSPGLPPPAPPGFS-
        100       110        120       130       140       150     

             100            110       120         130       140    
pF1KB5 VAPPSS-QLNVVNSVSSS-----EDIKPLPGLPGIGNMNYPST--SPGSLVKHICAICGD
        .: :: :.: . :. ..     ::.:: : : :. ... :    .::.  :..::::::
CCDS47 -GPVSSPQINSTVSLPGGGSGPPEDVKP-PVL-GVRGLHCPPPPGGPGAG-KRLCAICGD
           160       170       180         190       200        210

          150       160       170       180       190       200    
pF1KB5 RSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGM
       ::::::::::::::::::::::::::: :.::::::: .:::::::::::::::::. ::
CCDS47 RSSGKHYGVYSCEGCKGFFKRTIRKDLTYSCRDNKDCTVDKRQRNRCQYCRYQKCLATGM
              220       230       240       250       260       270

          210       220       230       240       250              
pF1KB5 KREAVQEERQRSRERAESEAECATSGHEDMPVERILEAELAVEPKTESY-----GDMNME
       :::::::::::.... ....: : .. :.:::.:::::::::: :...      :  .  
CCDS47 KREAVQEERQRGKDK-DGDGEGAGGAPEEMPVDRILEAELAVEQKSDQGVEGPGGTGGSG
              280        290       300       310       320         

     260       270       280       290       300       310         
pF1KB5 NSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSHRSV
       .: ::::::::.::::::::::::::::::::.: :.::::::::::::::::::::::.
CCDS47 SSPNDPVTNICQAADKQLFTLVEWAKRIPHFSSLPLDDQVILLRAGWNELLIASFSHRSI
     330       340       350       360       370       380         

     320       330       340       350       360       370         
pF1KB5 SVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVSKMKDMQMDKSELGCLRAIVLFNP
       .:.:::::::::::::.::::::::.:::::::::::::.::.:::.::::::::.::::
CCDS47 DVRDGILLATGLHVHRNSAHSAGVGAIFDRVLTELVSKMRDMRMDKTELGCLRAIILFNP
     390       400       410       420       430       440         

     380       390       400       410       420       430         
pF1KB5 DAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFF
       ::::::::::::.:::::::.::.: ::::::: ::::::::::::::::::::::::::
CCDS47 DAKGLSNPSEVEVLREKVYASLETYCKQKYPEQQGRFAKLLLRLPALRSIGLKCLEHLFF
     450       460       470       480       490       500         

     440       450       460   
pF1KB5 FKLIGDTPIDTFLMEMLETPLQIT
       ::::::::::::::::::.: :. 
CCDS47 FKLIGDTPIDTFLMEMLEAPHQLA
     510       520       530   

>>CCDS59007.1 RXRB gene_id:6257|Hs108|chr6                (537 aa)
 initn: 1938 init1: 678 opt: 1785  Z-score: 1401.1  bits: 268.8 E(32554): 1e-71
Smith-Waterman score: 1966; 66.9% identity (81.1% similar) in 477 aa overlap (13-462:68-536)

                                 10        20        30            
pF1KB5                   MYGNYSHFMKFPAGYGGSPGHTGSTSMSPSAA----LSTGKP
                                     ::  :  : .:  : ::...    :  : :
CCDS59 RRRPWLDPAAAAAAAVAGGEQQTPEPEPGEAGRDGM-GDSGRDSRSPDSSSPNPLPQGVP
        40        50        60        70         80        90      

       40        50        60              70        80        90  
pF1KB5 MDSHPSYTDTPVSAPRTLSAVGTPLNA------LGSPYRVITSAMGPPSGALAAPPGINL
         : :.    : .:: .:.. :.:         ::::. ::.:.:: :.    ::::.. 
CCDS59 PPSPPGPPLPPSTAP-SLGGSGAPPPPPMPPPPLGSPFPVISSSMGSPGLPPPAPPGFS-
        100       110        120       130       140       150     

             100            110       120         130       140    
pF1KB5 VAPPSS-QLNVVNSVSSS-----EDIKPLPGLPGIGNMNYPST--SPGSLVKHICAICGD
        .: :: :.: . :. ..     ::.:: : : :. ... :    .::.  :..::::::
CCDS59 -GPVSSPQINSTVSLPGGGSGPPEDVKP-PVL-GVRGLHCPPPPGGPGAG-KRLCAICGD
           160       170       180         190       200        210

          150       160       170       180       190       200    
pF1KB5 RSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGM
       ::::::::::::::::::::::::::: :.::::::: .:::::::::::::::::. ::
CCDS59 RSSGKHYGVYSCEGCKGFFKRTIRKDLTYSCRDNKDCTVDKRQRNRCQYCRYQKCLATGM
              220       230       240       250       260       270

          210       220       230       240       250              
pF1KB5 KREAVQEERQRSRERAESEAECATSGHEDMPVERILEAELAVEPKTESY-----GDMNME
       :::::::::::.... ....: : .. :.:::.:::::::::: :...      :  .  
CCDS59 KREAVQEERQRGKDK-DGDGEGAGGAPEEMPVDRILEAELAVEQKSDQGVEGPGGTGGSG
              280        290       300       310       320         

     260       270       280       290       300       310         
pF1KB5 NSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSHRSV
       .: ::::::::.::::::::::::::::::::.: :.::::::::::::::::::::::.
CCDS59 SSPNDPVTNICQAADKQLFTLVEWAKRIPHFSSLPLDDQVILLRAGWNELLIASFSHRSI
     330       340       350       360       370       380         

     320       330       340           350       360       370     
pF1KB5 SVQDGILLATGLHVHRSSAHSAGVGSIFDR----VLTELVSKMKDMQMDKSELGCLRAIV
       .:.:::::::::::::.::::::::.::::    :::::::::.::.:::.::::::::.
CCDS59 DVRDGILLATGLHVHRNSAHSAGVGAIFDRSLSRVLTELVSKMRDMRMDKTELGCLRAII
     390       400       410       420       430       440         

         380       390       400       410       420       430     
pF1KB5 LFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKCLE
       ::::::::::::::::.:::::::.::.: ::::::: ::::::::::::::::::::::
CCDS59 LFNPDAKGLSNPSEVEVLREKVYASLETYCKQKYPEQQGRFAKLLLRLPALRSIGLKCLE
     450       460       470       480       490       500         

         440       450       460   
pF1KB5 HLFFFKLIGDTPIDTFLMEMLETPLQIT
       ::::::::::::::::::::::.: :. 
CCDS59 HLFFFKLIGDTPIDTFLMEMLEAPHQLA
     510       520       530       

>>CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15              (414 aa)
 initn: 822 init1: 389 opt: 976  Z-score: 773.7  bits: 152.3 E(32554): 9e-37
Smith-Waterman score: 976; 40.9% identity (69.6% similar) in 391 aa overlap (75-456:23-400)

           50        60        70        80        90       100    
pF1KB5 YTDTPVSAPRTLSAVGTPLNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNVVN
                                     ....::  .   :::    :: . :    .
CCDS10         MAMVVSTWRDPQDEVPGSQGSQASQAPPVPG--PPPG----APHTPQTPGQG
                       10        20        30              40      

          110       120       130        140       150       160   
pF1KB5 SVSSSEDIKPLPGLPGIGNMNYPSTSPGSLVKHI-CAICGDRSSGKHYGVYSCEGCKGFF
       . .:.       :  : :.   :...  .  .:: :..:::.::::::: ..:::::.::
CCDS10 GPASTPAQTAAGGQGGPGG---PGSDKQQQQQHIECVVCGDKSSGKHYGQFTCEGCKSFF
         50        60           70        80        90       100   

           170       180       190       200       210       220   
pF1KB5 KRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESE
       ::..:..: :::: :..: ::...::.::::: .::: .::.:::::  : :      ..
CCDS10 KRSVRRNLSYTCRANRNCPIDQHHRNQCQYCRLKKCLKVGMRREAVQ--RGRMPPTQPTH
           110       120       130       140       150         160 

           230       240            250       260       270        
pF1KB5 AECATSGHEDMPVERILEAELAV----EP-KTESYGDMNMENSTNDPVTNICHAADKQLF
       .. : .. . .  .  : . ...    ::  :  .:.. :. ..   . :::. : ..::
CCDS10 GQFALTNGDPLNCHSYLSGYISLLLRAEPYPTSRFGSQCMQPNNIMGIENICELAARMLF
             170       180       190       200       210       220 

      280       290       300       310       320        330       
pF1KB5 TLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSHRSVSVQDGILLAT-GLHVHRSS
       . ::::. :: : :: . ::: :::  :.::.. . .. :. .. . :::. :::.   :
CCDS10 SAVEWARNIPFFPDLQITDQVALLRLTWSELFVLNAAQCSMPLHVAPLLAAAGLHASPMS
             230       240       250       260       270       280 

       340         350       360       370       380       390     
pF1KB5 AHSAGVGSIFD--RVLTELVSKMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLRE
       :    : ...:  :.. : : :.: ...:..: .::.:::::. :: :::. ..::.:.:
CCDS10 ADR--VVAFMDHIRIFQEQVEKLKALHVDSAEYSCLKAIVLFTSDACGLSDVAHVESLQE
               290       300       310       320       330         

         400       410       420       430       440       450     
pF1KB5 KVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEM
       :   .:: :....::.:: ::.:::::::.::... . .:.::: .:.: :::.:.. .:
CCDS10 KSQCALEEYVRSQYPNQPTRFGKLLLRLPSLRTVSSSVIEQLFFVRLVGKTPIETLIRDM
     340       350       360       370       380       390         

         460          
pF1KB5 LETPLQIT       
       :              
CCDS10 LLSGSSFNWPYMAIQ
     400       410    

>>CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5                (423 aa)
 initn: 793 init1: 392 opt: 976  Z-score: 773.6  bits: 152.3 E(32554): 9.1e-37
Smith-Waterman score: 976; 40.0% identity (67.3% similar) in 413 aa overlap (53-456:11-407)

             30        40        50        60        70        80  
pF1KB5 GSTSMSPSAALSTGKPMDSHPSYTDTPVSAPRTLSAVGTPLNALGSPYRVITSAMGPPSG
                                     :.   : :.:    :.:  .  .: :  .:
CCDS40                     MAMVVSSWRDPQDDVAGGNP----GGPNPAAQAARGGGGG
                                   10        20            30      

             90       100       110       120       130        140 
pF1KB5 ALAAPPGINLVAPPSSQLNVVNSVSSSEDIKPLPGLPGIGNMNYPSTSPGSLVKHI-CAI
       :       .  :: . :      . ..      ::  :  ... :..  :.  .:: :..
CCDS40 AGEQQQQAGSGAPHTPQ------TPGQPGAPATPGTAGDKGQGPPGS--GQSQQHIECVV
         40        50              60        70          80        

             150       160       170       180       190       200 
pF1KB5 CGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLV
       :::.::::::: ..:::::.::::..:..: :::: :..: ::...::.::::: .::: 
CCDS40 CGDKSSGKHYGQFTCEGCKSFFKRSVRRNLTYTCRANRNCPIDQHHRNQCQYCRLKKCLK
       90       100       110       120       130       140        

             210       220       230       240            250      
pF1KB5 MGMKREAVQEERQRSRERAESEAECATSGHEDMPVERILEAELAV----EP-KTESYGDM
       .::.:::::  : :      . .. : .. . .  .  : . ...    ::  :  ::..
CCDS40 VGMRREAVQ--RGRMPPTQPNPGQYALTNGDPLNGHCYLSGYISLLLRAEPYPTSRYGSQ
      150         160       170       180       190       200      

        260       270       280       290       300       310      
pF1KB5 NMENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSH
        :. ..   . :::. : . ::. ::::. :: : :: . ::: :::  :.::.. . ..
CCDS40 CMQPNNIMGIENICELAARLLFSAVEWARNIPFFPDLQITDQVSLLRLTWSELFVLNAAQ
        210       220       230       240       250       260      

        320        330       340         350       360       370   
pF1KB5 RSVSVQDGILLAT-GLHVHRSSAHSAGVGSIFD--RVLTELVSKMKDMQMDKSELGCLRA
        :. .. . :::. :::.   ::    : ...:  :.. : : :.: ...:..: .::.:
CCDS40 CSMPLHVAPLLAAAGLHASPMSADR--VVAFMDHIRIFQEQVEKLKALHVDSAEYSCLKA
        270       280       290         300       310       320    

           380       390       400       410       420       430   
pF1KB5 IVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKC
       ::::. :: :::. ...:.:.::   .:: :....::.::.::.:::::::.::... . 
CCDS40 IVLFTSDACGLSDAAHIESLQEKSQCALEEYVRSQYPNQPSRFGKLLLRLPSLRTVSSSV
          330       340       350       360       370       380    

           440       450       460            
pF1KB5 LEHLFFFKLIGDTPIDTFLMEMLETPLQIT         
       .:.::: .:.: :::.:.. .::                
CCDS40 IEQLFFVRLVGKTPIETLIRDMLLSGSSFNWPYMSIQCS
          390       400       410       420   

>>CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20              (417 aa)
 initn: 888 init1: 490 opt: 903  Z-score: 716.9  bits: 141.8 E(32554): 1.3e-33
Smith-Waterman score: 903; 39.2% identity (71.4% similar) in 370 aa overlap (93-456:12-374)

             70        80        90       100       110       120  
pF1KB5 LNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNVVNSVSSSEDIKPLPGLPGIG
                                     .:  :. :. . ..   :... :     .:
CCDS13                    MRLSKTLVDMDMADYSAALDPAYTTLEFENVQVLT----MG
                                  10        20        30           

                 130        140       150       160       170      
pF1KB5 NMNYPS-----TSPGSL-VKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCR
       : . ::     ..:.:: :. .:::::::..:::::. ::.::::::.:..::. .:.::
CCDS13 NDTSPSEGTNLNAPNSLGVSALCAICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCR
        40        50        60        70        80        90       

        180       190       200       210       220       230      
pF1KB5 DNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDMPV
        ...:..:: .::.:.::: .::.  :::.::::.::.:   :  :  . .  . . .  
CCDS13 FSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEAVQNERDRISTRRSSYEDSSLPSINALLQ
       100       110       120       130       140       150       

        240       250       260       270       280       290      
pF1KB5 ERILEAELAVEPKTESYGDMNMENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLE
        ..:  ...  : .   ::.  .. ..  ....:..  .::..:::::: :: : .: :.
CCDS13 AEVLSRQIT-SPVSGINGDIRAKKIAS--IADVCESMKEQLLVLVEWAKYIPAFCELPLD
       160        170       180         190       200       210    

        300       310       320       330       340       350      
pF1KB5 DQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVS
       ::: ::::  .: :. . ..::.  .: .::..   : :   . : .. .  :.: ::: 
CCDS13 DQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDYIVPRHCPELAEMSRVSIRILDELVL
          220       230       240       250       260       270    

        360       370       380       390       400       410      
pF1KB5 KMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRF
        ....:.: .: . :.::..:.:::::::.:.... :: .: ..:: : ...  .. :::
CCDS13 PFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRF
          280       290       300       310       320       330    

        420       430       440       450       460                
pF1KB5 AKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT             
       ..::: ::.:.::  . .:.. :.::.: . ::..:.:::                    
CCDS13 GELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNLLQEMLLGGPCQAQEGRGWSGDSPGD
          340       350       360       370       380       390    

CCDS13 RPHTVSSPLSSLASPLCRFGQVA
          400       410       

>>CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20              (464 aa)
 initn: 888 init1: 490 opt: 903  Z-score: 716.2  bits: 141.8 E(32554): 1.4e-33
Smith-Waterman score: 903; 39.2% identity (71.4% similar) in 370 aa overlap (93-456:12-374)

             70        80        90       100       110       120  
pF1KB5 LNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNVVNSVSSSEDIKPLPGLPGIG
                                     .:  :. :. . ..   :... :     .:
CCDS46                    MRLSKTLVDMDMADYSAALDPAYTTLEFENVQVLT----MG
                                  10        20        30           

                 130        140       150       160       170      
pF1KB5 NMNYPS-----TSPGSL-VKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCR
       : . ::     ..:.:: :. .:::::::..:::::. ::.::::::.:..::. .:.::
CCDS46 NDTSPSEGTNLNAPNSLGVSALCAICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCR
        40        50        60        70        80        90       

        180       190       200       210       220       230      
pF1KB5 DNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDMPV
        ...:..:: .::.:.::: .::.  :::.::::.::.:   :  :  . .  . . .  
CCDS46 FSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEAVQNERDRISTRRSSYEDSSLPSINALLQ
       100       110       120       130       140       150       

        240       250       260       270       280       290      
pF1KB5 ERILEAELAVEPKTESYGDMNMENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLE
        ..:  ...  : .   ::.  .. ..  ....:..  .::..:::::: :: : .: :.
CCDS46 AEVLSRQIT-SPVSGINGDIRAKKIAS--IADVCESMKEQLLVLVEWAKYIPAFCELPLD
       160        170       180         190       200       210    

        300       310       320       330       340       350      
pF1KB5 DQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVS
       ::: ::::  .: :. . ..::.  .: .::..   : :   . : .. .  :.: ::: 
CCDS46 DQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDYIVPRHCPELAEMSRVSIRILDELVL
          220       230       240       250       260       270    

        360       370       380       390       400       410      
pF1KB5 KMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRF
        ....:.: .: . :.::..:.:::::::.:.... :: .: ..:: : ...  .. :::
CCDS46 PFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRF
          280       290       300       310       320       330    

        420       430       440       450       460                
pF1KB5 AKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT             
       ..::: ::.:.::  . .:.. :.::.: . ::..:.:::                    
CCDS46 GELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNLLQEMLLGGSPSDAPHAHHPLHPHLM
          340       350       360       370       380       390    

CCDS46 QEHMGTNVIVANTMPTHLSNGQMSTPETPQPSPPGGSGSEPYKLLPGAVATIVKPLSAIP
          400       410       420       430       440       450    

>>CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20              (474 aa)
 initn: 888 init1: 490 opt: 903  Z-score: 716.0  bits: 141.8 E(32554): 1.5e-33
Smith-Waterman score: 903; 39.2% identity (71.4% similar) in 370 aa overlap (93-456:12-374)

             70        80        90       100       110       120  
pF1KB5 LNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNVVNSVSSSEDIKPLPGLPGIG
                                     .:  :. :. . ..   :... :     .:
CCDS13                    MRLSKTLVDMDMADYSAALDPAYTTLEFENVQVLT----MG
                                  10        20        30           

                 130        140       150       160       170      
pF1KB5 NMNYPS-----TSPGSL-VKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCR
       : . ::     ..:.:: :. .:::::::..:::::. ::.::::::.:..::. .:.::
CCDS13 NDTSPSEGTNLNAPNSLGVSALCAICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCR
        40        50        60        70        80        90       

        180       190       200       210       220       230      
pF1KB5 DNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDMPV
        ...:..:: .::.:.::: .::.  :::.::::.::.:   :  :  . .  . . .  
CCDS13 FSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEAVQNERDRISTRRSSYEDSSLPSINALLQ
       100       110       120       130       140       150       

        240       250       260       270       280       290      
pF1KB5 ERILEAELAVEPKTESYGDMNMENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLE
        ..:  ...  : .   ::.  .. ..  ....:..  .::..:::::: :: : .: :.
CCDS13 AEVLSRQIT-SPVSGINGDIRAKKIAS--IADVCESMKEQLLVLVEWAKYIPAFCELPLD
       160        170       180         190       200       210    

        300       310       320       330       340       350      
pF1KB5 DQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVS
       ::: ::::  .: :. . ..::.  .: .::..   : :   . : .. .  :.: ::: 
CCDS13 DQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDYIVPRHCPELAEMSRVSIRILDELVL
          220       230       240       250       260       270    

        360       370       380       390       400       410      
pF1KB5 KMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRF
        ....:.: .: . :.::..:.:::::::.:.... :: .: ..:: : ...  .. :::
CCDS13 PFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRF
          280       290       300       310       320       330    

        420       430       440       450       460                
pF1KB5 AKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT             
       ..::: ::.:.::  . .:.. :.::.: . ::..:.:::                    
CCDS13 GELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNLLQEMLLGGSPSDAPHAHHPLHPHLM
          340       350       360       370       380       390    

CCDS13 QEHMGTNVIVANTMPTHLSNGQMCEWPRPRGQAATPETPQPSPPGGSGSEPYKLLPGAVA
          400       410       420       430       440       450    




463 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Sat Nov  5 15:23:31 2016 done: Sat Nov  5 15:23:31 2016
 Total Scan time:  3.440 Total Display time:  0.080

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com