FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7740, 482 aa
1>>>pF1KB7740 482 - 482 aa - 482 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.8031+/-0.00102; mu= 16.6974+/- 0.061
mean_var=94.7120+/-18.641, 0's: 0 Z-trim(106.5): 125 B-trim: 38 in 1/52
Lambda= 0.131787
statistics sampled from 8903 (9029) to 8903 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.646), E-opt: 0.2 (0.277), width: 16
Scan time: 2.880
The best scores are: opt bits E(32554)
CCDS55875.1 NR1H4 gene_id:9971|Hs108|chr12 ( 482) 3269 632.0 4.1e-181
CCDS55876.1 NR1H4 gene_id:9971|Hs108|chr12 ( 486) 3251 628.6 4.4e-180
CCDS9078.1 NR1H4 gene_id:9971|Hs108|chr12 ( 472) 3009 582.6 3.1e-166
CCDS55873.1 NR1H4 gene_id:9971|Hs108|chr12 ( 476) 2991 579.2 3.3e-165
CCDS55874.1 NR1H4 gene_id:9971|Hs108|chr12 ( 425) 1810 354.6 1.2e-97
CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11 ( 453) 924 186.2 6.4e-47
CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11 ( 402) 915 184.4 1.9e-46
CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11 ( 447) 915 184.5 2.1e-46
CCDS54627.1 NR1I2 gene_id:8856|Hs108|chr3 ( 397) 571 119.0 9.3e-27
CCDS42316.1 THRA gene_id:7067|Hs108|chr17 ( 410) 560 116.9 4.1e-26
CCDS2641.1 THRB gene_id:7068|Hs108|chr3 ( 461) 557 116.4 6.6e-26
CCDS58546.1 THRA gene_id:7067|Hs108|chr17 ( 451) 534 112.0 1.3e-24
CCDS11360.1 THRA gene_id:7067|Hs108|chr17 ( 490) 530 111.3 2.4e-24
CCDS44584.1 NR1H3 gene_id:10062|Hs108|chr11 ( 387) 496 104.7 1.8e-22
CCDS1228.1 NR1I3 gene_id:9970|Hs108|chr1 ( 348) 476 100.9 2.3e-21
CCDS41430.1 NR1I3 gene_id:9970|Hs108|chr1 ( 352) 476 100.9 2.3e-21
CCDS42593.1 NR1H2 gene_id:7376|Hs108|chr19 ( 460) 468 99.5 8.2e-21
CCDS41429.1 NR1I3 gene_id:9970|Hs108|chr1 ( 357) 456 97.1 3.3e-20
CCDS58673.1 NR1H2 gene_id:7376|Hs108|chr19 ( 363) 439 93.9 3.1e-19
CCDS44260.1 NR1I3 gene_id:9970|Hs108|chr1 ( 339) 429 92.0 1.1e-18
CCDS44261.1 NR1I3 gene_id:9970|Hs108|chr1 ( 340) 409 88.2 1.5e-17
CCDS5234.1 ESR1 gene_id:2099|Hs108|chr6 ( 595) 384 83.6 6.4e-16
CCDS2621.1 NR2C2 gene_id:7182|Hs108|chr3 ( 615) 373 81.5 2.8e-15
CCDS74905.1 NR2C2 gene_id:7182|Hs108|chr3 ( 596) 370 80.9 4e-15
CCDS8757.1 VDR gene_id:7421|Hs108|chr12 ( 427) 353 77.6 2.9e-14
CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 ( 467) 353 77.6 3.2e-14
CCDS55820.1 VDR gene_id:7421|Hs108|chr12 ( 477) 353 77.6 3.2e-14
CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 ( 483) 353 77.6 3.2e-14
CCDS9051.1 NR2C1 gene_id:7181|Hs108|chr12 ( 603) 353 77.7 3.8e-14
CCDS43136.1 NR1I2 gene_id:8856|Hs108|chr3 ( 434) 350 77.0 4.4e-14
CCDS2995.1 NR1I2 gene_id:8856|Hs108|chr3 ( 473) 350 77.1 4.7e-14
CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 ( 614) 348 76.8 7.5e-14
CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 344 75.9 1e-13
CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 343 75.7 1.2e-13
CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 339 74.9 1.7e-13
CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 339 74.9 1.9e-13
CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 ( 598) 338 74.9 2.7e-13
CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 ( 611) 338 74.9 2.8e-13
CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12 ( 652) 338 74.9 2.9e-13
CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 336 74.4 2.9e-13
CCDS3772.1 NR3C2 gene_id:4306|Hs108|chr4 ( 984) 339 75.2 3.5e-13
CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20 ( 417) 333 73.8 4e-13
CCDS53405.1 NR1I3 gene_id:9970|Hs108|chr1 ( 296) 331 73.3 4e-13
CCDS44262.1 NR1I3 gene_id:9970|Hs108|chr1 ( 309) 331 73.3 4.2e-13
CCDS41428.1 NR1I3 gene_id:9970|Hs108|chr1 ( 314) 331 73.3 4.2e-13
CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20 ( 464) 333 73.8 4.4e-13
CCDS68131.1 HNF4A gene_id:3172|Hs108|chr20 ( 395) 332 73.6 4.4e-13
CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20 ( 474) 333 73.8 4.4e-13
CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20 ( 442) 332 73.6 4.8e-13
CCDS42876.1 HNF4A gene_id:3172|Hs108|chr20 ( 452) 332 73.6 4.9e-13
>>CCDS55875.1 NR1H4 gene_id:9971|Hs108|chr12 (482 aa)
initn: 3269 init1: 3269 opt: 3269 Z-score: 3365.0 bits: 632.0 E(32554): 4.1e-181
Smith-Waterman score: 3269; 100.0% identity (100.0% similar) in 482 aa overlap (1-482:1-482)
10 20 30 40 50 60
pF1KB7 MVMQFQGLENPIQISPHCSCTPSGFFMEMMSMKPAKGVLTEQVAGPLGQNLEVEPYSQYS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MVMQFQGLENPIQISPHCSCTPSGFFMEMMSMKPAKGVLTEQVAGPLGQNLEVEPYSQYS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 NVQFPQVQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 NVQFPQVQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 KPRMGASAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 KPRMGASAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 MDMYMRRKCQECRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MDMYMRRKCQECRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 QVTSTTKSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 QVTSTTKSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEM
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 ATNHVQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ATNHVQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 RIRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 RIRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB7 LLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWD
430 440 450 460 470 480
pF1KB7 VQ
::
CCDS55 VQ
>>CCDS55876.1 NR1H4 gene_id:9971|Hs108|chr12 (486 aa)
initn: 3320 init1: 1810 opt: 3251 Z-score: 3346.5 bits: 628.6 E(32554): 4.4e-180
Smith-Waterman score: 3251; 99.2% identity (99.2% similar) in 486 aa overlap (1-482:1-486)
10 20 30 40 50 60
pF1KB7 MVMQFQGLENPIQISPHCSCTPSGFFMEMMSMKPAKGVLTEQVAGPLGQNLEVEPYSQYS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MVMQFQGLENPIQISPHCSCTPSGFFMEMMSMKPAKGVLTEQVAGPLGQNLEVEPYSQYS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 NVQFPQVQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 NVQFPQVQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 KPRMGASAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 KPRMGASAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCV
130 140 150 160 170 180
190 200 210 220 230
pF1KB7 MDMYMRRKCQECRLRKCKEMGMLAEC----LLTEIQCKSKRLRKNVKQHADQTVNEDSEG
:::::::::::::::::::::::::: ::::::::::::::::::::::::::::::
CCDS55 MDMYMRRKCQECRLRKCKEMGMLAECMYTGLLTEIQCKSKRLRKNVKQHADQTVNEDSEG
190 200 210 220 230 240
240 250 260 270 280 290
pF1KB7 RDLRQVTSTTKSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 RDLRQVTSTTKSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLI
250 260 270 280 290 300
300 310 320 330 340 350
pF1KB7 LTEMATNHVQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LTEMATNHVQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSD
310 320 330 340 350 360
360 370 380 390 400 410
pF1KB7 LLEERIRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LLEERIRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEK
370 380 390 400 410 420
420 430 440 450 460 470
pF1KB7 LQEPLLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LQEPLLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLC
430 440 450 460 470 480
480
pF1KB7 EIWDVQ
::::::
CCDS55 EIWDVQ
>>CCDS9078.1 NR1H4 gene_id:9971|Hs108|chr12 (472 aa)
initn: 3009 init1: 3009 opt: 3009 Z-score: 3098.0 bits: 582.6 E(32554): 3.1e-166
Smith-Waterman score: 3009; 100.0% identity (100.0% similar) in 446 aa overlap (37-482:27-472)
10 20 30 40 50 60
pF1KB7 GLENPIQISPHCSCTPSGFFMEMMSMKPAKGVLTEQVAGPLGQNLEVEPYSQYSNVQFPQ
::::::::::::::::::::::::::::::
CCDS90 MGSKMNLIEHSHLPTTDEFSFSENLFGVLTEQVAGPLGQNLEVEPYSQYSNVQFPQ
10 20 30 40 50
70 80 90 100 110 120
pF1KB7 VQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 VQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGA
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB7 SAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 SAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMR
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB7 RKCQECRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLRQVTSTT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 RKCQECRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLRQVTSTT
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB7 KSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNHVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 KSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNHVQ
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB7 VLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEERIRNSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 VLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEERIRNSG
300 310 320 330 340 350
370 380 390 400 410 420
pF1KB7 ISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLLDVLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 ISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLLDVLQ
360 370 380 390 400 410
430 440 450 460 470 480
pF1KB7 KLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 KLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDVQ
420 430 440 450 460 470
>>CCDS55873.1 NR1H4 gene_id:9971|Hs108|chr12 (476 aa)
initn: 3060 init1: 1810 opt: 2991 Z-score: 3079.4 bits: 579.2 E(32554): 3.3e-165
Smith-Waterman score: 2991; 99.1% identity (99.1% similar) in 450 aa overlap (37-482:27-476)
10 20 30 40 50 60
pF1KB7 GLENPIQISPHCSCTPSGFFMEMMSMKPAKGVLTEQVAGPLGQNLEVEPYSQYSNVQFPQ
::::::::::::::::::::::::::::::
CCDS55 MGSKMNLIEHSHLPTTDEFSFSENLFGVLTEQVAGPLGQNLEVEPYSQYSNVQFPQ
10 20 30 40 50
70 80 90 100 110 120
pF1KB7 VQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGA
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB7 SAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 SAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMR
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB7 RKCQECRLRKCKEMGMLAEC----LLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLRQV
:::::::::::::::::::: ::::::::::::::::::::::::::::::::::::
CCDS55 RKCQECRLRKCKEMGMLAECMYTGLLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLRQV
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB7 TSTTKSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 TSTTKSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMAT
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB7 NHVQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEERI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 NHVQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEERI
300 310 320 330 340 350
370 380 390 400 410 420
pF1KB7 RNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 RNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLL
360 370 380 390 400 410
430 440 450 460 470 480
pF1KB7 DVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 DVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDVQ
420 430 440 450 460 470
>>CCDS55874.1 NR1H4 gene_id:9971|Hs108|chr12 (425 aa)
initn: 1810 init1: 1810 opt: 1810 Z-score: 1866.6 bits: 354.6 E(32554): 1.2e-97
Smith-Waterman score: 2559; 89.5% identity (89.5% similar) in 446 aa overlap (37-482:27-425)
10 20 30 40 50 60
pF1KB7 GLENPIQISPHCSCTPSGFFMEMMSMKPAKGVLTEQVAGPLGQNLEVEPYSQYSNVQFPQ
::::::::::::::::::::::::::::::
CCDS55 MGSKMNLIEHSHLPTTDEFSFSENLFGVLTEQVAGPLGQNLEVEPYSQYSNVQFPQ
10 20 30 40 50
70 80 90 100 110 120
pF1KB7 VQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGA
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB7 SAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMR
:::::::::::::::::::::::::::::::::
CCDS55 SAGRIKGDELCVVCGDRASGYHYNALTCEGCKG---------------------------
120 130 140
190 200 210 220 230 240
pF1KB7 RKCQECRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLRQVTSTT
::::::::::::::::::::::::::::::::::::::::
CCDS55 --------------------LLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLRQVTSTT
150 160 170 180
250 260 270 280 290 300
pF1KB7 KSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNHVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 KSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNHVQ
190 200 210 220 230 240
310 320 330 340 350 360
pF1KB7 VLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEERIRNSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEERIRNSG
250 260 270 280 290 300
370 380 390 400 410 420
pF1KB7 ISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLLDVLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLLDVLQ
310 320 330 340 350 360
430 440 450 460 470 480
pF1KB7 KLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 KLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDVQ
370 380 390 400 410 420
>>CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11 (453 aa)
initn: 891 init1: 462 opt: 924 Z-score: 955.8 bits: 186.2 E(32554): 6.4e-47
Smith-Waterman score: 924; 36.7% identity (65.5% similar) in 452 aa overlap (46-482:8-452)
20 30 40 50 60 70
pF1KB7 PHCSCTPSGFFMEMMSMKPAKGVLTEQVAGPLGQNLEVEPYSQYSNVQF--PQVQPQISS
::: . . : .: :.. : .: :.
CCDS73 MQQTSWNPLGGTCKQPPGRTHSAVELWKPGAQDASSQ
10 20 30
80 90 100 110 120 130
pF1KB7 SSYYSN--LGFYPQQPEEWY-SPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGR
.. :. : ..:. . :. :. : ..: . . : . : .
CCDS73 AQGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPK
40 50 60 70 80 90
140 150 160 170 180 190
pF1KB7 IKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQ
. :.::: ::::.:::.:::.:.:::::::::::. :.: : :..::.: :: :::::::
CCDS73 MLGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQ
100 110 120 130 140 150
200 210 220 230 240
pF1KB7 ECRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTV---NEDSEGRDLRQVTSTTK
:::::::.. :: ::.:.: : . :.:... ...: : .: . : :..
CCDS73 ECRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQL
160 170 180 190 200 210
250 260 270 280 290 300
pF1KB7 SCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNHVQV
. :: .. .:: . . : . : .. ..: . .. : .::.: ::
CCDS73 GMIEKL-VAAQQQCNRRSFSDRL--RVTPWPMAPDPHSRE-ARQQRFAHFTELAIVSVQE
220 230 240 250 260 270
310 320 330 340 350 360
pF1KB7 LVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHS-----DLLEER-
.:.:.:.:::: :..:::::::: ::.:.:.:.... .: :...: :. .:
CCDS73 IVDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYN---PGSESITFLKDFSYNRE
280 290 300 310 320 330
370 380 390 400 410 420
pF1KB7 -IRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEP
. ..:.. :.:.:.: : ....::.... :.::: :: :.: :: ..:. ::.::.
CCDS73 DFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHT
340 350 360 370 380 390
430 440 450 460 470 480
pF1KB7 LLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWD
...:. .::.:.. : .: .:. :::.. :.:.... :..:.:. ::: ::::
CCDS73 YVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWD
400 410 420 430 440 450
pF1KB7 VQ
:.
CCDS73 VHE
>>CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11 (402 aa)
initn: 937 init1: 462 opt: 915 Z-score: 947.3 bits: 184.4 E(32554): 1.9e-46
Smith-Waterman score: 915; 39.3% identity (68.9% similar) in 392 aa overlap (102-482:18-401)
80 90 100 110 120 130
pF1KB7 SSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRI
:. : ..: . . : . : ..
CCDS44 MPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKM
10 20 30 40
140 150 160 170 180 190
pF1KB7 KGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQE
:.::: ::::.:::.:::.:.:::::::::::. :.: : :..::.: :: ::::::::
CCDS44 LGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQE
50 60 70 80 90 100
200 210 220 230 240
pF1KB7 CRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTV---NEDSEGRDLRQVTSTTKS
::::::.. :: ::.:.: : . :.:... ...: : .: . : :.. .
CCDS44 CRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLG
110 120 130 140 150 160
250 260 270 280 290 300
pF1KB7 CREKTELTPDQQTLLHFIMDSYNKQRM-PQEITNKILKEEFSAEENFLILTEMATNHVQV
:: .. .:: . . : . :. : .. ..: . .. : .::.: ::
CCDS44 MIEKL-VAAQQQCNRRSFSD---RLRVTPWPMAPDPHSRE-ARQQRFAHFTELAIVSVQE
170 180 190 200 210 220
310 320 330 340 350 360
pF1KB7 LVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHS-----DLLEER-
.:.:.:.:::: :..:::::::: ::.:.:.:.... .: :...: :. .:
CCDS44 IVDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYN---PGSESITFLKDFSYNRE
230 240 250 260 270
370 380 390 400 410 420
pF1KB7 -IRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEP
. ..:.. :.:.:.: : ....::.... :.::: :: :.: :: ..:. ::.::.
CCDS44 DFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHT
280 290 300 310 320 330
430 440 450 460 470 480
pF1KB7 LLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWD
...:. .::.:.. : .: .:. :::.. :.:.... :..:.:. ::: ::::
CCDS44 YVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWD
340 350 360 370 380 390
pF1KB7 VQ
:.
CCDS44 VHE
400
>>CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11 (447 aa)
initn: 891 init1: 462 opt: 915 Z-score: 946.6 bits: 184.5 E(32554): 2.1e-46
Smith-Waterman score: 915; 39.3% identity (68.9% similar) in 392 aa overlap (102-482:63-446)
80 90 100 110 120 130
pF1KB7 SSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRI
:. : ..: . . : . : ..
CCDS79 QGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKM
40 50 60 70 80 90
140 150 160 170 180 190
pF1KB7 KGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQE
:.::: ::::.:::.:::.:.:::::::::::. :.: : :..::.: :: ::::::::
CCDS79 LGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQE
100 110 120 130 140 150
200 210 220 230 240
pF1KB7 CRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTV---NEDSEGRDLRQVTSTTKS
::::::.. :: ::.:.: : . :.:... ...: : .: . : :.. .
CCDS79 CRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLG
160 170 180 190 200 210
250 260 270 280 290 300
pF1KB7 CREKTELTPDQQTLLHFIMDSYNKQRM-PQEITNKILKEEFSAEENFLILTEMATNHVQV
:: .. .:: . . : . :. : .. ..: . .. : .::.: ::
CCDS79 MIEKL-VAAQQQCNRRSFSD---RLRVTPWPMAPDPHSRE-ARQQRFAHFTELAIVSVQE
220 230 240 250 260
310 320 330 340 350 360
pF1KB7 LVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHS-----DLLEER-
.:.:.:.:::: :..:::::::: ::.:.:.:.... .: :...: :. .:
CCDS79 IVDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYN---PGSESITFLKDFSYNRE
270 280 290 300 310 320
370 380 390 400 410 420
pF1KB7 -IRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEP
. ..:.. :.:.:.: : ....::.... :.::: :: :.: :: ..:. ::.::.
CCDS79 DFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHT
330 340 350 360 370 380
430 440 450 460 470 480
pF1KB7 LLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWD
...:. .::.:.. : .: .:. :::.. :.:.... :..:.:. ::: ::::
CCDS79 YVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWD
390 400 410 420 430 440
pF1KB7 VQ
:.
CCDS79 VHE
>>CCDS54627.1 NR1I2 gene_id:8856|Hs108|chr3 (397 aa)
initn: 563 init1: 225 opt: 571 Z-score: 593.9 bits: 119.0 E(32554): 9.3e-27
Smith-Waterman score: 639; 32.4% identity (61.6% similar) in 380 aa overlap (118-481:23-394)
90 100 110 120 130 140
pF1KB7 EEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRIKGDELCVVCGDRASGY
: :: ..:. .. : ..: ::::.:.::
CCDS54 MEVRPKESWNHADFVHCEDTESVPGKPSVNADE-EVGGPQICRVCGDKATGY
10 20 30 40 50
150 160 170 180 190 200
pF1KB7 HYNALTCEGCKGFFRRSITKNAVYKCK-NGGNCVMDMYMRRKCQECRLRKCKEMGMLAEC
:.:..:::::::::::.. .:: .: : : . ::.:: :::::: : :: :
CCDS54 HFNVMTCEGCKGFFRRAMKRNARLRCPFRKGACEITRKTRRQCQACRLRKCLESGMKKEM
60 70 80 90 100 110
210 220 230 240 250 260
pF1KB7 LLTEIQCKSKRL---RKNVKQHADQTVNEDSEGRDLRQVTSTTKSCREKTELTPDQQTLL
.... . .: ::. .. . : .. .. .. :.. . . :: : :.
CCDS54 IMSDEAVEERRALIKRKKSERTGTQPLGVQGLTEEQRMMIRELMDAQMKTFDT----TFS
120 130 140 150 160
270 280 290 300 310
pF1KB7 HFIMDSYNKQRMPQE--ITNKILKEEFSAEENFLILTEMA---TNHVQVLVEFTKKLPGF
:: . : .. . : . ...: : .: .:: : . .. :.: . :
CCDS54 HFKNFRVSLQLRGEDGSVWNYKPPADSGGKEIFSLLPHMADMSTYMFKGIISFAKVISYF
170 180 190 200 210 220
320 330 340 350 360 370
pF1KB7 QTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEERIRNS--GISDEYITPMF
. : ::::.::::.: : :: .:: . . . : .... :... . ::.
CCDS54 RDLPIEDQISLLKGAAFELCQLRFNTVFNAETGTWECGRLSYCLEDTAGGFQQLLLEPML
230 240 250 260 270 280
380 390 400 410 420 430
pF1KB7 SFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLLDVLQKLCKIHQPEN
.:. . .:.. .:::.:. :: ..:::: . ....:..::: . .:.. . ..:.
CCDS54 KFHYMLKKLQLHEEEYVLMQAISLFSPDRPGVLQHRVVDQLQEQFAITLKSYIECNRPQ-
290 300 310 320 330 340
440 450 460 470 480
pF1KB7 PQH---FACLLGRLTELRTFNHHHAEMLMSWRVND-HKF-TPLLCEIWDVQ
: : : ... :::::..: .:.. :. :..: : : :::. :.. .
CCDS54 PAHRFLFLKIMAMLTELRSINAQHTQRLL--RIQDIHPFATPLMQELFGITGS
350 360 370 380 390
>>CCDS42316.1 THRA gene_id:7067|Hs108|chr17 (410 aa)
initn: 546 init1: 216 opt: 560 Z-score: 582.4 bits: 116.9 E(32554): 4.1e-26
Smith-Waterman score: 621; 33.7% identity (59.9% similar) in 377 aa overlap (134-482:50-408)
110 120 130 140 150 160
pF1KB7 ETLYQGETEVAEMPVTKKPRMGASAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRR
:: ::::::.:.:::: .:::::::::::
CCDS42 RSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKATGYHYRCITCEGCKGFFRR
20 30 40 50 60 70
170 180 190 200 210 220
pF1KB7 SITKN--AVYKCKNGGNCVMDMYMRRKCQECRLRKCKEMGMLAECLLTEIQCKSKRLRKN
.: :: .:.:: . ::.: : .:: ::..:: .:: . .: . :::. :
CCDS42 TIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGMAMDLVLDD----SKRVAK-
80 90 100 110 120 130
230 240 250 260 270
pF1KB7 VKQHADQTVNEDSEGRDLRQVTSTTKSCREKTELTPDQQTLLHFIMD---------SYNK
.. .:. :. :. .: ... : ::.. :.:. . :. :
CCDS42 -RKLIEQN-------RERRRKEEMIRSLQQRPEPTPEEWDLIHIATEAHRSTNAQGSHWK
140 150 160 170 180
280 290 300 310 320
pF1KB7 QR---MPQEITNKILKEEFSAE----ENFLILTEMATNHVQVLVEFTKKLPGFQTLDHED
:: .:..: .. . ... : : .:.. : . .:.:.:::: :. : ::
CCDS42 QRRKFLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFSELPCED
190 200 210 220 230 240
330 340 350 360 370
pF1KB7 QIALLKGSAVEAMFLRSAEIFNKKLP----SGHSDLLEERIRNSG---ISDEYITPMFSF
:: :::: .: : ::.: .. . ::. . .:...:.: .:: .: .
CCDS42 QIILLKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGVVSDA----IFEL
250 260 270 280 290 300
380 390 400 410 420 430
pF1KB7 YKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLLDVLQKLCKIHQPENPQ
::.. ... . : ::: :....: ::. . . .:: :: : .... . :. .:
CCDS42 GKSLSAFNLDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVN-HRKHNIP
310 320 330 340 350 360
440 450 460 470 480
pF1KB7 HF-ACLLGRLTELRTFNHHHAEMLMSWRVN--DHKFTPLLCEIWDVQ
:: :: ..:.:: .. :: .. .:. . : ::. :... :
CCDS42 HFWPKLLMKVTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFEDQEV
370 380 390 400 410
482 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 09:19:07 2016 done: Fri Nov 4 09:19:08 2016
Total Scan time: 2.880 Total Display time: 0.060
Function used was FASTA [36.3.4 Apr, 2011]