Result of FASTA (ccds) for pFN21AB7751
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB7751, 445 aa
  1>>>pF1KB7751 445 - 445 aa - 445 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 5.8153+/-0.000889; mu= 16.3099+/- 0.054
 mean_var=85.7608+/-17.131, 0's: 0 Z-trim(108.4): 126  B-trim: 41 in 1/50
 Lambda= 0.138494
 statistics sampled from 10086 (10212) to 10086 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.687), E-opt: 0.2 (0.314), width:  16
 Scan time:  3.070

The best scores are:                                      opt bits E(32554)
CCDS6220.2 HNF4G gene_id:3174|Hs108|chr8           ( 445) 2982 605.6 3.3e-173
CCDS83303.1 HNF4G gene_id:3174|Hs108|chr8          ( 408) 2750 559.2 2.7e-159
CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20         ( 464) 2187 446.7 2.2e-125
CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20         ( 474) 2080 425.4 6.1e-119
CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20         ( 442) 2070 423.3 2.3e-118
CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20         ( 417) 1969 403.2 2.6e-112
CCDS42876.1 HNF4A gene_id:3172|Hs108|chr20         ( 452) 1963 402.0 6.4e-112
CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20         ( 449) 1959 401.2 1.1e-111
CCDS68131.1 HNF4A gene_id:3172|Hs108|chr20         ( 395) 1852 379.8 2.7e-105
CCDS4768.1 RXRB gene_id:6257|Hs108|chr6            ( 533)  935 196.6   5e-50
CCDS35172.1 RXRA gene_id:6256|Hs108|chr9           ( 462)  916 192.8 6.2e-49
CCDS1248.1 RXRG gene_id:6258|Hs108|chr1            ( 463)  902 190.0 4.3e-48
CCDS72970.1 RXRG gene_id:6258|Hs108|chr1           ( 340)  898 189.1 5.8e-48
CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15         ( 414)  773 164.2 2.3e-40
CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5           ( 423)  764 162.4   8e-40
CCDS59007.1 RXRB gene_id:6257|Hs108|chr6           ( 537)  633 136.3 7.3e-32
CCDS45359.1 NR2F2 gene_id:7026|Hs108|chr15         ( 261)  432 95.9   5e-20
CCDS45358.1 NR2F2 gene_id:7026|Hs108|chr15         ( 281)  432 95.9 5.3e-20
CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12         ( 467)  424 94.5 2.4e-19
CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12         ( 483)  424 94.5 2.5e-19
CCDS9051.1 NR2C1 gene_id:7181|Hs108|chr12          ( 603)  424 94.6   3e-19
CCDS74905.1 NR2C2 gene_id:7182|Hs108|chr3          ( 596)  404 90.6 4.7e-18
CCDS2621.1 NR2C2 gene_id:7182|Hs108|chr3           ( 615)  404 90.6 4.9e-18
CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19         ( 404)  393 88.3 1.6e-17
CCDS41790.1 RARG gene_id:5916|Hs108|chr12          ( 443)  387 87.1 3.9e-17
CCDS8850.1 RARG gene_id:5916|Hs108|chr12           ( 454)  386 86.9 4.6e-17
CCDS58236.1 RARG gene_id:5916|Hs108|chr12          ( 382)  381 85.8   8e-17
CCDS11366.1 RARA gene_id:5914|Hs108|chr17          ( 462)  376 84.9 1.9e-16
CCDS73750.1 NR2E3 gene_id:10002|Hs108|chr15        ( 410)  373 84.3 2.6e-16
CCDS69165.1 NR2E1 gene_id:7101|Hs108|chr6          ( 422)  373 84.3 2.6e-16
CCDS2642.1 RARB gene_id:5915|Hs108|chr3            ( 448)  373 84.3 2.8e-16
CCDS42317.1 RARA gene_id:5914|Hs108|chr17          ( 457)  371 83.9 3.7e-16
CCDS5063.1 NR2E1 gene_id:7101|Hs108|chr6           ( 385)  369 83.4 4.2e-16
CCDS9850.2 ESRRB gene_id:2103|Hs108|chr14          ( 508)  369 83.5 5.3e-16
CCDS73751.1 NR2E3 gene_id:10002|Hs108|chr15        ( 367)  357 81.0 2.2e-15
CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2           ( 598)  347 79.2 1.3e-14
CCDS58061.1 ESRRG gene_id:2104|Hs108|chr1          ( 470)  340 77.7 2.8e-14
CCDS55340.1 NR6A1 gene_id:2649|Hs108|chr9          ( 475)  339 77.5 3.2e-14
CCDS65127.1 NR6A1 gene_id:2649|Hs108|chr9          ( 476)  339 77.5 3.2e-14
CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9           ( 443)  337 77.1   4e-14
CCDS35137.1 NR6A1 gene_id:2649|Hs108|chr9          ( 480)  337 77.1 4.3e-14
CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9           ( 626)  337 77.2 5.3e-14
CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9           ( 637)  337 77.2 5.3e-14
CCDS1517.1 ESRRG gene_id:2104|Hs108|chr1           ( 435)  333 76.3 6.8e-14
CCDS41468.1 ESRRG gene_id:2104|Hs108|chr1          ( 458)  333 76.3 7.1e-14
CCDS58060.1 ESRRG gene_id:2104|Hs108|chr1          ( 396)  330 75.7 9.6e-14
CCDS8757.1 VDR gene_id:7421|Hs108|chr12            ( 427)  327 75.1 1.5e-13
CCDS10177.1 RORA gene_id:6095|Hs108|chr15          ( 523)  328 75.3 1.6e-13
CCDS55820.1 VDR gene_id:7421|Hs108|chr12           ( 477)  327 75.1 1.7e-13
CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12          ( 598)  328 75.4 1.8e-13


>>CCDS6220.2 HNF4G gene_id:3174|Hs108|chr8                (445 aa)
 initn: 2982 init1: 2982 opt: 2982  Z-score: 3223.2  bits: 605.6 E(32554): 3.3e-173
Smith-Waterman score: 2982; 100.0% identity (100.0% similar) in 445 aa overlap (1-445:1-445)

               10        20        30        40        50        60
pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPETSMNTTDNGVNCLCAICGDRATGKH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPETSMNTTDNGVNCLCAICGDRATGKH
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB7 YGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 YGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQ
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB7 NERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCESM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 NERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCESM
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB7 KQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 KQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVI
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB7 HRNSCEVEISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 HRNSCEVEISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMR
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB7 FQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 FQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQE
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB7 MLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 MLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSG
              370       380       390       400       410       420

              430       440     
pF1KB7 QEQYKIAANQASVISHQHLSKQKQL
       :::::::::::::::::::::::::
CCDS62 QEQYKIAANQASVISHQHLSKQKQL
              430       440     

>>CCDS83303.1 HNF4G gene_id:3174|Hs108|chr8               (408 aa)
 initn: 2750 init1: 2750 opt: 2750  Z-score: 2973.2  bits: 559.2 E(32554): 2.7e-159
Smith-Waterman score: 2750; 100.0% identity (100.0% similar) in 408 aa overlap (38-445:1-408)

        10        20        30        40        50        60       
pF1KB7 EVLDPTYTTLEFETMQILYNSSDSSAPETSMNTTDNGVNCLCAICGDRATGKHYGASSCD
                                     ::::::::::::::::::::::::::::::
CCDS83                               MNTTDNGVNCLCAICGDRATGKHYGASSCD
                                             10        20        30

        70        80        90       100       110       120       
pF1KB7 GCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQNERDRIS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 GCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQNERDRIS
               40        50        60        70        80        90

       130       140       150       160       170       180       
pF1KB7 TRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCESMKQQLLVL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 TRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCESMKQQLLVL
              100       110       120       130       140       150

       190       200       210       220       230       240       
pF1KB7 VEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVIHRNSCEV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 VEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVIHRNSCEV
              160       170       180       190       200       210

       250       260       270       280       290       300       
pF1KB7 EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMRFQVQIGL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMRFQVQIGL
              220       230       240       250       260       270

       310       320       330       340       350       360       
pF1KB7 EDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQEMLLGGAS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 EDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQEMLLGGAS
              280       290       300       310       320       330

       370       380       390       400       410       420       
pF1KB7 NDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSGQEQYKIA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 NDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSGQEQYKIA
              340       350       360       370       380       390

       430       440     
pF1KB7 ANQASVISHQHLSKQKQL
       ::::::::::::::::::
CCDS83 ANQASVISHQHLSKQKQL
              400        

>>CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20              (464 aa)
 initn: 2051 init1: 1163 opt: 2187  Z-score: 2364.5  bits: 446.7 E(32554): 2.2e-125
Smith-Waterman score: 2187; 73.7% identity (88.8% similar) in 437 aa overlap (1-434:10-446)

                        10        20        30         40          
pF1KB7          MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLC
                ::::.:: .:::.:::::::..:.:  ..:.:  : :..:. .. ::. ::
CCDS46 MRLSKTLVDMDMADYSAALDPAYTTLEFENVQVLTMGNDTSPSEGTNLNAPNSLGVSALC
               10        20        30        40        50        60

      50        60        70        80        90       100         
pF1KB7 AICGDRATGKHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKC
       :::::::::::::::::::::::::::.::.:.::::::::::::::::::::::::.::
CCDS46 AICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKC
               70        80        90       100       110       120

     110       120       130       140       150       160         
pF1KB7 FRAGMKKEAVQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKK
       ::::::::::::::::::::::... :..::::.: :::: ::::.    : . :: .::
CCDS46 FRAGMKKEAVQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKK
              130       140       150       160       170       180

     170       180       190       200       210       220         
pF1KB7 IASIGDVCESMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYK
       ::::.:::::::.::::::::::::::::::::::::::::::::::::::::::::..:
CCDS46 IASIADVCESMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFK
              190       200       210       220       230       240

     230       240        250       260       270       280        
pF1KB7 DILLLGNNYVIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAK
       :.:::::.:.. :.  :. :.:::. :.::::: ::::.:::::::: ::::.:::::::
CCDS46 DVLLLGNDYIVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAK
              250       260       270       280       290       300

      290       300       310       320       330       340        
pF1KB7 GLSDPVKIKNMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKL
       ::::: ::: .: :::..:::::::::::::::::::::::::::::::::::::::.::
CCDS46 GLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKL
              310       320       330       340       350       360

      350       360       370       380       390       400        
pF1KB7 FGMVKIDNLLQEMLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTP
       :::.:::::::::::::. .:. : :::.:::: :. .  ..:. . : : .   :.:::
CCDS46 FGMAKIDNLLQEMLLGGSPSDAPHAHHPLHPHLMQEHMGTNVIVANTMPTHLSNGQMSTP
              370       380       390       400       410       420

      410       420       430       440            
pF1KB7 ETPLPSPPQGSGQEQYKIAANQASVISHQHLSKQKQL       
       ::: :::: :::.: ::.  . ...:                  
CCDS46 ETPQPSPPGGSGSEPYKLLPGAVATIVKPLSAIPQPTITKQEVI
              430       440       450       460    

>>CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20              (474 aa)
 initn: 2028 init1: 1163 opt: 2080  Z-score: 2248.8  bits: 425.4 E(32554): 6.1e-119
Smith-Waterman score: 2153; 71.8% identity (86.8% similar) in 447 aa overlap (1-434:10-456)

                        10        20        30         40          
pF1KB7          MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLC
                ::::.:: .:::.:::::::..:.:  ..:.:  : :..:. .. ::. ::
CCDS13 MRLSKTLVDMDMADYSAALDPAYTTLEFENVQVLTMGNDTSPSEGTNLNAPNSLGVSALC
               10        20        30        40        50        60

      50        60        70        80        90       100         
pF1KB7 AICGDRATGKHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKC
       :::::::::::::::::::::::::::.::.:.::::::::::::::::::::::::.::
CCDS13 AICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKC
               70        80        90       100       110       120

     110       120       130       140       150       160         
pF1KB7 FRAGMKKEAVQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKK
       ::::::::::::::::::::::... :..::::.: :::: ::::.    : . :: .::
CCDS13 FRAGMKKEAVQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKK
              130       140       150       160       170       180

     170       180       190       200       210       220         
pF1KB7 IASIGDVCESMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYK
       ::::.:::::::.::::::::::::::::::::::::::::::::::::::::::::..:
CCDS13 IASIADVCESMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFK
              190       200       210       220       230       240

     230       240        250       260       270       280        
pF1KB7 DILLLGNNYVIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAK
       :.:::::.:.. :.  :. :.:::. :.::::: ::::.:::::::: ::::.:::::::
CCDS13 DVLLLGNDYIVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAK
              250       260       270       280       290       300

      290       300       310       320       330       340        
pF1KB7 GLSDPVKIKNMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKL
       ::::: ::: .: :::..:::::::::::::::::::::::::::::::::::::::.::
CCDS13 GLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKL
              310       320       330       340       350       360

      350       360       370       380       390       400        
pF1KB7 FGMVKIDNLLQEMLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQI---
       :::.:::::::::::::. .:. : :::.:::: :. .  ..:. . : : .   :.   
CCDS13 FGMAKIDNLLQEMLLGGSPSDAPHAHHPLHPHLMQEHMGTNVIVANTMPTHLSNGQMCEW
              370       380       390       400       410       420

                410       420       430       440            
pF1KB7 -------STPETPLPSPPQGSGQEQYKIAANQASVISHQHLSKQKQL       
              .::::: :::: :::.: ::.  . ...:                  
CCDS13 PRPRGQAATPETPQPSPPGGSGSEPYKLLPGAVATIVKPLSAIPQPTITKQEVI
              430       440       450       460       470    

>>CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20              (442 aa)
 initn: 2051 init1: 1163 opt: 2070  Z-score: 2238.4  bits: 423.3 E(32554): 2.3e-118
Smith-Waterman score: 2070; 74.2% identity (88.6% similar) in 411 aa overlap (27-434:14-424)

               10        20        30         40         50        
pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLCAICGDRATG
                                 .: :.:  : :..:. .. ::. :::::::::::
CCDS46              MVSVNAPLGAPVESSYDTSPSEGTNLNAPNSLGVSALCAICGDRATG
                            10        20        30        40       

       60        70        80        90       100       110        
pF1KB7 KHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEA
       ::::::::::::::::::.::.:.::::::::::::::::::::::::.:::::::::::
CCDS46 KHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEA
        50        60        70        80        90       100       

      120       130       140       150       160       170        
pF1KB7 VQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCE
       :::::::::::::... :..::::.: :::: ::::.    : . :: .::::::.::::
CCDS46 VQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKKIASIADVCE
       110       120       130       140       150       160       

      180       190       200       210       220       230        
pF1KB7 SMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNY
       :::.::::::::::::::::::::::::::::::::::::::::::::..::.:::::.:
CCDS46 SMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDY
       170       180       190       200       210       220       

      240        250       260       270       280       290       
pF1KB7 VIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIK
       .. :.  :. :.:::. :.::::: ::::.:::::::: ::::.:::::::::::: :::
CCDS46 IVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIK
       230       240       250       260       270       280       

       300       310       320       330       340       350       
pF1KB7 NMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNL
        .: :::..:::::::::::::::::::::::::::::::::::::::.:::::.:::::
CCDS46 RLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNL
       290       300       310       320       330       340       

       360       370       380       390       400       410       
pF1KB7 LQEMLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQ
       ::::::::. .:. : :::.:::: :. .  ..:. . : : .   :.:::::: :::: 
CCDS46 LQEMLLGGSPSDAPHAHHPLHPHLMQEHMGTNVIVANTMPTHLSNGQMSTPETPQPSPPG
       350       360       370       380       390       400       

       420       430       440            
pF1KB7 GSGQEQYKIAANQASVISHQHLSKQKQL       
       :::.: ::.  . ...:                  
CCDS46 GSGSEPYKLLPGAVATIVKPLSAIPQPTITKQEVI
       410       420       430       440  

>>CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20              (417 aa)
 initn: 1163 init1: 1163 opt: 1969  Z-score: 2129.7  bits: 403.2 E(32554): 2.6e-112
Smith-Waterman score: 1969; 75.2% identity (89.1% similar) in 395 aa overlap (1-387:10-404)

                        10        20        30         40          
pF1KB7          MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLC
                ::::.:: .:::.:::::::..:.:  ..:.:  : :..:. .. ::. ::
CCDS13 MRLSKTLVDMDMADYSAALDPAYTTLEFENVQVLTMGNDTSPSEGTNLNAPNSLGVSALC
               10        20        30        40        50        60

      50        60        70        80        90       100         
pF1KB7 AICGDRATGKHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKC
       :::::::::::::::::::::::::::.::.:.::::::::::::::::::::::::.::
CCDS13 AICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKC
               70        80        90       100       110       120

     110       120       130       140       150       160         
pF1KB7 FRAGMKKEAVQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKK
       ::::::::::::::::::::::... :..::::.: :::: ::::.    : . :: .::
CCDS13 FRAGMKKEAVQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKK
              130       140       150       160       170       180

     170       180       190       200       210       220         
pF1KB7 IASIGDVCESMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYK
       ::::.:::::::.::::::::::::::::::::::::::::::::::::::::::::..:
CCDS13 IASIADVCESMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFK
              190       200       210       220       230       240

     230       240        250       260       270       280        
pF1KB7 DILLLGNNYVIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAK
       :.:::::.:.. :.  :. :.:::. :.::::: ::::.:::::::: ::::.:::::::
CCDS13 DVLLLGNDYIVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAK
              250       260       270       280       290       300

      290       300       310       320       330       340        
pF1KB7 GLSDPVKIKNMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKL
       ::::: ::: .: :::..:::::::::::::::::::::::::::::::::::::::.::
CCDS13 GLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKL
              310       320       330       340       350       360

      350       360         370          380       390       400   
pF1KB7 FGMVKIDNLLQEMLLGGA--SNDGSHLH--HPM-HPHLSQDPLTGQTILLGPMSTLVHAD
       :::.:::::::::::::   ...:       :  .::  ..::.                
CCDS13 FGMAKIDNLLQEMLLGGPCQAQEGRGWSGDSPGDRPHTVSSPLSSLASPLCRFGQVA   
              370       380       390       400       410          

           410       420       430       440     
pF1KB7 QISTPETPLPSPPQGSGQEQYKIAANQASVISHQHLSKQKQL

>>CCDS42876.1 HNF4A gene_id:3172|Hs108|chr20              (452 aa)
 initn: 2028 init1: 1163 opt: 1963  Z-score: 2122.7  bits: 402.0 E(32554): 6.4e-112
Smith-Waterman score: 2036; 72.2% identity (86.5% similar) in 421 aa overlap (27-434:14-434)

               10        20        30         40         50        
pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLCAICGDRATG
                                 .: :.:  : :..:. .. ::. :::::::::::
CCDS42              MVSVNAPLGAPVESSYDTSPSEGTNLNAPNSLGVSALCAICGDRATG
                            10        20        30        40       

       60        70        80        90       100       110        
pF1KB7 KHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEA
       ::::::::::::::::::.::.:.::::::::::::::::::::::::.:::::::::::
CCDS42 KHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEA
        50        60        70        80        90       100       

      120       130       140       150       160       170        
pF1KB7 VQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCE
       :::::::::::::... :..::::.: :::: ::::.    : . :: .::::::.::::
CCDS42 VQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKKIASIADVCE
       110       120       130       140       150       160       

      180       190       200       210       220       230        
pF1KB7 SMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNY
       :::.::::::::::::::::::::::::::::::::::::::::::::..::.:::::.:
CCDS42 SMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDY
       170       180       190       200       210       220       

      240        250       260       270       280       290       
pF1KB7 VIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIK
       .. :.  :. :.:::. :.::::: ::::.:::::::: ::::.:::::::::::: :::
CCDS42 IVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIK
       230       240       250       260       270       280       

       300       310       320       330       340       350       
pF1KB7 NMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNL
        .: :::..:::::::::::::::::::::::::::::::::::::::.:::::.:::::
CCDS42 RLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNL
       290       300       310       320       330       340       

       360       370       380       390       400                 
pF1KB7 LQEMLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQI----------ST
       ::::::::. .:. : :::.:::: :. .  ..:. . : : .   :.          .:
CCDS42 LQEMLLGGSPSDAPHAHHPLHPHLMQEHMGTNVIVANTMPTHLSNGQMCEWPRPRGQAAT
       350       360       370       380       390       400       

       410       420       430       440            
pF1KB7 PETPLPSPPQGSGQEQYKIAANQASVISHQHLSKQKQL       
       :::: :::: :::.: ::.  . ...:                  
CCDS42 PETPQPSPPGGSGSEPYKLLPGAVATIVKPLSAIPQPTITKQEVI
       410       420       430       440       450  

>>CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20              (449 aa)
 initn: 2028 init1: 1163 opt: 1959  Z-score: 2118.5  bits: 401.2 E(32554): 1.1e-111
Smith-Waterman score: 2032; 72.5% identity (86.6% similar) in 418 aa overlap (30-434:14-431)

               10        20        30         40         50        
pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLCAICGDRATG
                                    :.:  : :..:. .. ::. :::::::::::
CCDS74                 MSDWGQGFPQDPPDTSPSEGTNLNAPNSLGVSALCAICGDRATG
                               10        20        30        40    

       60        70        80        90       100       110        
pF1KB7 KHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEA
       ::::::::::::::::::.::.:.::::::::::::::::::::::::.:::::::::::
CCDS74 KHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEA
           50        60        70        80        90       100    

      120       130       140       150       160       170        
pF1KB7 VQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCE
       :::::::::::::... :..::::.: :::: ::::.    : . :: .::::::.::::
CCDS74 VQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKKIASIADVCE
          110       120       130       140       150       160    

      180       190       200       210       220       230        
pF1KB7 SMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNY
       :::.::::::::::::::::::::::::::::::::::::::::::::..::.:::::.:
CCDS74 SMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDY
          170       180       190       200       210       220    

      240        250       260       270       280       290       
pF1KB7 VIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIK
       .. :.  :. :.:::. :.::::: ::::.:::::::: ::::.:::::::::::: :::
CCDS74 IVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIK
          230       240       250       260       270       280    

       300       310       320       330       340       350       
pF1KB7 NMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNL
        .: :::..:::::::::::::::::::::::::::::::::::::::.:::::.:::::
CCDS74 RLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNL
          290       300       310       320       330       340    

       360       370       380       390       400                 
pF1KB7 LQEMLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQI----------ST
       ::::::::. .:. : :::.:::: :. .  ..:. . : : .   :.          .:
CCDS74 LQEMLLGGSPSDAPHAHHPLHPHLMQEHMGTNVIVANTMPTHLSNGQMCEWPRPRGQAAT
          350       360       370       380       390       400    

       410       420       430       440            
pF1KB7 PETPLPSPPQGSGQEQYKIAANQASVISHQHLSKQKQL       
       :::: :::: :::.: ::.  . ...:                  
CCDS74 PETPQPSPPGGSGSEPYKLLPGAVATIVKPLSAIPQPTITKQEVI
          410       420       430       440         

>>CCDS68131.1 HNF4A gene_id:3172|Hs108|chr20              (395 aa)
 initn: 1189 init1: 1163 opt: 1852  Z-score: 2003.7  bits: 379.8 E(32554): 2.7e-105
Smith-Waterman score: 1852; 75.9% identity (88.3% similar) in 369 aa overlap (27-387:14-382)

               10        20        30         40         50        
pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLCAICGDRATG
                                 .: :.:  : :..:. .. ::. :::::::::::
CCDS68              MVSVNAPLGAPVESSYDTSPSEGTNLNAPNSLGVSALCAICGDRATG
                            10        20        30        40       

       60        70        80        90       100       110        
pF1KB7 KHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEA
       ::::::::::::::::::.::.:.::::::::::::::::::::::::.:::::::::::
CCDS68 KHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEA
        50        60        70        80        90       100       

      120       130       140       150       160       170        
pF1KB7 VQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCE
       :::::::::::::... :..::::.: :::: ::::.    : . :: .::::::.::::
CCDS68 VQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKKIASIADVCE
       110       120       130       140       150       160       

      180       190       200       210       220       230        
pF1KB7 SMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNY
       :::.::::::::::::::::::::::::::::::::::::::::::::..::.:::::.:
CCDS68 SMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDY
       170       180       190       200       210       220       

      240        250       260       270       280       290       
pF1KB7 VIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIK
       .. :.  :. :.:::. :.::::: ::::.:::::::: ::::.:::::::::::: :::
CCDS68 IVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIK
       230       240       250       260       270       280       

       300       310       320       330       340       350       
pF1KB7 NMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNL
        .: :::..:::::::::::::::::::::::::::::::::::::::.:::::.:::::
CCDS68 RLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNL
       290       300       310       320       330       340       

       360           370        380       390       400       410  
pF1KB7 LQEMLLGGASND----GSHLHHPM-HPHLSQDPLTGQTILLGPMSTLVHADQISTPETPL
       ::::::::  .     :     :  .::  ..::.                         
CCDS68 LQEMLLGGPCQAQEGRGWSGDSPGDRPHTVSSPLSSLASPLCRFGQVA            
       350       360       370       380       390                 

            420       430       440     
pF1KB7 PSPPQGSGQEQYKIAANQASVISHQHLSKQKQL

>>CCDS4768.1 RXRB gene_id:6257|Hs108|chr6                 (533 aa)
 initn: 746 init1: 409 opt: 935  Z-score: 1011.6  bits: 196.6 E(32554): 5e-50
Smith-Waterman score: 935; 43.8% identity (75.3% similar) in 324 aa overlap (48-362:204-526)

        20        30        40        50        60        70       
pF1KB7 EFETMQILYNSSDSSAPETSMNTTDNGVNCLCAICGDRATGKHYGASSCDGCKGFFRRSI
                                     ::::::::..:::::. ::.::::::.:.:
CCDS47 GPPEDVKPPVLGVRGLHCPPPPGGPGAGKRLCAICGDRSSGKHYGVYSCEGCKGFFKRTI
           180       190       200       210       220       230   

        80        90       100       110       120       130       
pF1KB7 RKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQNERDRISTRRSTFDGSN
       ::. .:::: ...:.::: .::.:.::: .::. .:::.::::.::.: . . .  .:..
CCDS47 RKDLTYSCRDNKDCTVDKRQRNRCQYCRYQKCLATGMKREAVQEERQRGKDKDGDGEGAG
           240       250       260       270       280       290   

            140       150          160       170       180         
pF1KB7 -----IPSINTLAQAEVRSRQIS---VSSPGSSTDINVKKIASIGDVCESMKQQLLVLVE
            .: .. . .::.  .: :   : .::..   . .    . ..:..  .::..:::
CCDS47 GAPEEMP-VDRILEAELAVEQKSDQGVEGPGGTGGSGSSPNDPVTNICQAADKQLFTLVE
           300        310       320       330       340       350  

     190       200       210       220       230       240         
pF1KB7 WAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVIHRNSCEVE-
       ::: :: :  ::::::: ::::  .: :. . ..::.  .: .::...  .:::: .   
CCDS47 WAKRIPHFSSLPLDDQVILLRAGWNELLIASFSHRSIDVRDGILLATGLHVHRNSAHSAG
            360       370       380       390       400       410  

      250       260       270       280       290       300        
pF1KB7 ISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMRFQVQIGLE
       .. . .::: :::  ......: .: .::.::..:.:::::::.: ... .: .:  .::
CCDS47 VGAIFDRVLTELVSKMRDMRMDKTELGCLRAIILFNPDAKGLSNPSEVEVLREKVYASLE
            420       430       440       450       460       470  

      310       320       330       340       350       360        
pF1KB7 DYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQEMLLGGASN
        : ...  ...:::..::: ::.:.::  . .:.. : ::.: . ::..:.:::      
CCDS47 TYCKQKYPEQQGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQL
            480       490       500       510       520       530  

      370       380       390       400       410       420        
pF1KB7 DGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSGQEQYKIAA
                                                                   
CCDS47 A                                                           
                                                                   




445 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Sun Nov  6 03:10:24 2016 done: Sun Nov  6 03:10:25 2016
 Total Scan time:  3.070 Total Display time:  0.080

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com