FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3732, 461 aa
1>>>pF1KB3732 461 - 461 aa - 461 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.1162+/-0.000943; mu= 14.5354+/- 0.057
mean_var=95.3133+/-18.988, 0's: 0 Z-trim(107.5): 124 B-trim: 0 in 0/52
Lambda= 0.131370
statistics sampled from 9505 (9629) to 9505 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.67), E-opt: 0.2 (0.296), width: 16
Scan time: 3.040
The best scores are: opt bits E(32554)
CCDS2641.1 THRB gene_id:7068|Hs108|chr3 ( 461) 3173 611.8 4.7e-175
CCDS42316.1 THRA gene_id:7067|Hs108|chr17 ( 410) 2178 423.2 2.5e-118
CCDS58546.1 THRA gene_id:7067|Hs108|chr17 ( 451) 1923 374.9 9.6e-104
CCDS11360.1 THRA gene_id:7067|Hs108|chr17 ( 490) 1918 374.0 2e-103
CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11 ( 453) 755 153.5 4.2e-37
CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11 ( 402) 747 152.0 1.1e-36
CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11 ( 447) 747 152.0 1.2e-36
CCDS54627.1 NR1I2 gene_id:8856|Hs108|chr3 ( 397) 616 127.1 3.2e-29
CCDS55873.1 NR1H4 gene_id:9971|Hs108|chr12 ( 476) 578 120.0 5.5e-27
CCDS55876.1 NR1H4 gene_id:9971|Hs108|chr12 ( 486) 578 120.0 5.5e-27
CCDS9078.1 NR1H4 gene_id:9971|Hs108|chr12 ( 472) 557 116.0 8.5e-26
CCDS55875.1 NR1H4 gene_id:9971|Hs108|chr12 ( 482) 557 116.0 8.7e-26
CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 504 105.9 8.8e-23
CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 504 105.9 8.9e-23
CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 502 105.6 1.1e-22
CCDS46775.1 RARB gene_id:5915|Hs108|chr3 ( 336) 500 105.1 1.2e-22
CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 497 104.6 1.9e-22
CCDS58237.1 RARG gene_id:5916|Hs108|chr12 ( 432) 497 104.6 2.1e-22
CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 497 104.6 2.2e-22
CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 497 104.6 2.2e-22
CCDS45671.1 RARA gene_id:5914|Hs108|chr17 ( 365) 490 103.2 4.6e-22
CCDS58673.1 NR1H2 gene_id:7376|Hs108|chr19 ( 363) 394 85.0 1.4e-16
CCDS3772.1 NR3C2 gene_id:4306|Hs108|chr4 ( 984) 397 85.9 2.1e-16
CCDS8757.1 VDR gene_id:7421|Hs108|chr12 ( 427) 375 81.5 1.9e-15
CCDS55820.1 VDR gene_id:7421|Hs108|chr12 ( 477) 375 81.5 2.1e-15
CCDS41429.1 NR1I3 gene_id:9970|Hs108|chr1 ( 357) 367 79.9 4.7e-15
CCDS10179.1 RORA gene_id:6095|Hs108|chr15 ( 556) 364 79.5 1e-14
CCDS44584.1 NR1H3 gene_id:10062|Hs108|chr11 ( 387) 361 78.8 1.1e-14
CCDS5234.1 ESR1 gene_id:2099|Hs108|chr6 ( 595) 362 79.1 1.4e-14
CCDS43136.1 NR1I2 gene_id:8856|Hs108|chr3 ( 434) 357 78.1 2.1e-14
CCDS60383.1 NR5A2 gene_id:2494|Hs108|chr1 ( 469) 357 78.1 2.2e-14
CCDS2995.1 NR1I2 gene_id:8856|Hs108|chr3 ( 473) 357 78.1 2.2e-14
CCDS1400.1 NR5A2 gene_id:2494|Hs108|chr1 ( 495) 357 78.1 2.3e-14
CCDS1401.1 NR5A2 gene_id:2494|Hs108|chr1 ( 541) 357 78.1 2.5e-14
CCDS42593.1 NR1H2 gene_id:7376|Hs108|chr19 ( 460) 355 77.7 2.8e-14
CCDS68131.1 HNF4A gene_id:3172|Hs108|chr20 ( 395) 353 77.3 3.2e-14
CCDS10178.1 RORA gene_id:6095|Hs108|chr15 ( 548) 355 77.8 3.2e-14
CCDS45271.1 RORA gene_id:6095|Hs108|chr15 ( 468) 354 77.5 3.2e-14
CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20 ( 417) 353 77.3 3.4e-14
CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20 ( 442) 353 77.3 3.5e-14
CCDS10177.1 RORA gene_id:6095|Hs108|chr15 ( 523) 354 77.6 3.5e-14
CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20 ( 449) 353 77.3 3.6e-14
CCDS42876.1 HNF4A gene_id:3172|Hs108|chr20 ( 452) 353 77.3 3.6e-14
CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20 ( 464) 353 77.3 3.7e-14
CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20 ( 474) 353 77.3 3.7e-14
CCDS6856.1 NR5A1 gene_id:2516|Hs108|chr9 ( 461) 352 77.1 4.2e-14
CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 ( 467) 348 76.4 7.1e-14
CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 ( 483) 348 76.4 7.3e-14
CCDS53405.1 NR1I3 gene_id:9970|Hs108|chr1 ( 296) 345 75.7 7.3e-14
CCDS44262.1 NR1I3 gene_id:9970|Hs108|chr1 ( 309) 345 75.7 7.6e-14
>>CCDS2641.1 THRB gene_id:7068|Hs108|chr3 (461 aa)
initn: 3173 init1: 3173 opt: 3173 Z-score: 3256.3 bits: 611.8 E(32554): 4.7e-175
Smith-Waterman score: 3173; 100.0% identity (100.0% similar) in 461 aa overlap (1-461:1-461)
10 20 30 40 50 60
pF1KB3 MTPNSMTENGLTAWDKPKHCPDREHDWKLVGMSEACLHRKSHSERRSTLKNEQSSPHLIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 MTPNSMTENGLTAWDKPKHCPDREHDWKLVGMSEACLHRKSHSERRSTLKNEQSSPHLIQ
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 TTWTSSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELCVVCGDKATGYHYR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 TTWTSSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELCVVCGDKATGYHYR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 CITCEGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFKKCIYVGMATDLVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 CITCEGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFKKCIYVGMATDLVL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 DDSKRLAKRKLIEENREKRRREELQKSIGHKPEPTDEEWELIKTVTEAHVATNAQGSHWK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 DDSKRLAKRKLIEENREKRRREELQKSIGHKPEPTDEEWELIKTVTEAHVATNAQGSHWK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 QKRKFLPEDIGQAPIVNAPEGGKVDLEAFSHFTKIITPAITRVVDFAKKLPMFCELPCED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 QKRKFLPEDIGQAPIVNAPEGGKVDLEAFSHFTKIITPAITRVVDFAKKLPMFCELPCED
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 QIILLKGCCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLGVVSDAIFDLGMSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 QIILLKGCCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLGVVSDAIFDLGMSL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB3 SSFNLDDTEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHYINYRKHHVTHFWPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 SSFNLDDTEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHYINYRKHHVTHFWPK
370 380 390 400 410 420
430 440 450 460
pF1KB3 LLMKVTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED
:::::::::::::::::::::::::::::::::::::::::
CCDS26 LLMKVTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED
430 440 450 460
>>CCDS42316.1 THRA gene_id:7067|Hs108|chr17 (410 aa)
initn: 2178 init1: 2178 opt: 2178 Z-score: 2237.8 bits: 423.2 E(32554): 2.5e-118
Smith-Waterman score: 2178; 84.5% identity (94.6% similar) in 367 aa overlap (95-461:41-407)
70 80 90 100 110 120
pF1KB3 SSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELCVVCGDKATGYHYRCITC
::::::::::: ::::::::::::::::::
CCDS42 GSDPEENSARSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKATGYHYRCITC
20 30 40 50 60 70
130 140 150 160 170 180
pF1KB3 EGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFKKCIYVGMATDLVLDDSK
:::::::::::::::::.:::::.. :::::.:::::: ::::::: :::: ::::::::
CCDS42 EGCKGFFRRTIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGMAMDLVLDDSK
80 90 100 110 120 130
190 200 210 220 230 240
pF1KB3 RLAKRKLIEENREKRRREELQKSIGHKPEPTDEEWELIKTVTEAHVATNAQGSHWKQKRK
:.:::::::.:::.::.::. .:. ..:::: :::.::. .:::: .::::::::::.::
CCDS42 RVAKRKLIEQNRERRRKEEMIRSLQQRPEPTPEEWDLIHIATEAHRSTNAQGSHWKQRRK
140 150 160 170 180 190
250 260 270 280 290 300
pF1KB3 FLPEDIGQAPIVNAPEGGKVDLEAFSHFTKIITPAITRVVDFAKKLPMFCELPCEDQIIL
:::.::::.:::. :.: ::::::::.:::::::::::::::::::::: ::::::::::
CCDS42 FLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFSELPCEDQIIL
200 210 220 230 240 250
310 320 330 340 350 360
pF1KB3 LKGCCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLGVVSDAIFDLGMSLSSFN
:::::::::::::::::::::.::::.::::: : :::::::::::::::.:: :::.::
CCDS42 LKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGVVSDAIFELGKSLSAFN
260 270 280 290 300 310
370 380 390 400 410 420
pF1KB3 LDDTEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHYINYRKHHVTHFWPKLLMK
::::::::::::::::.:: :: ::..::: :...:::::::.:.:::.. :::::::::
CCDS42 LDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVNHRKHNIPHFWPKLLMK
320 330 340 350 360 370
430 440 450 460
pF1KB3 VTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED
:::::::::::::::::::::::::::::::::::::
CCDS42 VTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFEDQEV
380 390 400 410
>>CCDS58546.1 THRA gene_id:7067|Hs108|chr17 (451 aa)
initn: 1918 init1: 1918 opt: 1923 Z-score: 1976.0 bits: 374.9 E(32554): 9.6e-104
Smith-Waterman score: 1923; 81.3% identity (93.5% similar) in 337 aa overlap (95-431:41-377)
70 80 90 100 110 120
pF1KB3 SSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELCVVCGDKATGYHYRCITC
::::::::::: ::::::::::::::::::
CCDS58 GSDPEENSARSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKATGYHYRCITC
20 30 40 50 60 70
130 140 150 160 170 180
pF1KB3 EGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFKKCIYVGMATDLVLDDSK
:::::::::::::::::.:::::.. :::::.:::::: ::::::: :::: ::::::::
CCDS58 EGCKGFFRRTIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGMAMDLVLDDSK
80 90 100 110 120 130
190 200 210 220 230 240
pF1KB3 RLAKRKLIEENREKRRREELQKSIGHKPEPTDEEWELIKTVTEAHVATNAQGSHWKQKRK
:.:::::::.:::.::.::. .:. ..:::: :::.::. .:::: .::::::::::.::
CCDS58 RVAKRKLIEQNRERRRKEEMIRSLQQRPEPTPEEWDLIHIATEAHRSTNAQGSHWKQRRK
140 150 160 170 180 190
250 260 270 280 290 300
pF1KB3 FLPEDIGQAPIVNAPEGGKVDLEAFSHFTKIITPAITRVVDFAKKLPMFCELPCEDQIIL
:::.::::.:::. :.: ::::::::.:::::::::::::::::::::: ::::::::::
CCDS58 FLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFSELPCEDQIIL
200 210 220 230 240 250
310 320 330 340 350 360
pF1KB3 LKGCCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLGVVSDAIFDLGMSLSSFN
:::::::::::::::::::::.::::.::::: : :::::::::::::::.:: :::.::
CCDS58 LKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGVVSDAIFELGKSLSAFN
260 270 280 290 300 310
370 380 390 400 410 420
pF1KB3 LDDTEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHYINYRKHHVTHFWPKLLMK
::::::::::::::::.:: :: ::..::: :...:::::::.:.:::.. :::::::::
CCDS58 LDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVNHRKHNIPHFWPKLLMK
320 330 340 350 360 370
430 440 450 460
pF1KB3 VTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED
..:..
CCDS58 GPQVRQLEQQLGEAGSLQGPVLQHQSPKSPQQRLLELLHRSGILHARAVCGEDDSSEADS
380 390 400 410 420 430
>>CCDS11360.1 THRA gene_id:7067|Hs108|chr17 (490 aa)
initn: 1918 init1: 1918 opt: 1918 Z-score: 1970.4 bits: 374.0 E(32554): 2e-103
Smith-Waterman score: 1918; 82.7% identity (93.9% similar) in 330 aa overlap (95-424:41-370)
70 80 90 100 110 120
pF1KB3 SSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELCVVCGDKATGYHYRCITC
::::::::::: ::::::::::::::::::
CCDS11 GSDPEENSARSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKATGYHYRCITC
20 30 40 50 60 70
130 140 150 160 170 180
pF1KB3 EGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFKKCIYVGMATDLVLDDSK
:::::::::::::::::.:::::.. :::::.:::::: ::::::: :::: ::::::::
CCDS11 EGCKGFFRRTIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGMAMDLVLDDSK
80 90 100 110 120 130
190 200 210 220 230 240
pF1KB3 RLAKRKLIEENREKRRREELQKSIGHKPEPTDEEWELIKTVTEAHVATNAQGSHWKQKRK
:.:::::::.:::.::.::. .:. ..:::: :::.::. .:::: .::::::::::.::
CCDS11 RVAKRKLIEQNRERRRKEEMIRSLQQRPEPTPEEWDLIHIATEAHRSTNAQGSHWKQRRK
140 150 160 170 180 190
250 260 270 280 290 300
pF1KB3 FLPEDIGQAPIVNAPEGGKVDLEAFSHFTKIITPAITRVVDFAKKLPMFCELPCEDQIIL
:::.::::.:::. :.: ::::::::.:::::::::::::::::::::: ::::::::::
CCDS11 FLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFSELPCEDQIIL
200 210 220 230 240 250
310 320 330 340 350 360
pF1KB3 LKGCCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLGVVSDAIFDLGMSLSSFN
:::::::::::::::::::::.::::.::::: : :::::::::::::::.:: :::.::
CCDS11 LKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGVVSDAIFELGKSLSAFN
260 270 280 290 300 310
370 380 390 400 410 420
pF1KB3 LDDTEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHYINYRKHHVTHFWPKLLMK
::::::::::::::::.:: :: ::..::: :...:::::::.:.:::.. :::::::::
CCDS11 LDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVNHRKHNIPHFWPKLLMK
320 330 340 350 360 370
430 440 450 460
pF1KB3 VTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED
CCDS11 EREVQSSILYKGAAAEGRPGGSLGVHPEGQQLLGMHVVQGPQVRQLEQQLGEAGSLQGPV
380 390 400 410 420 430
>>CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11 (453 aa)
initn: 637 init1: 204 opt: 755 Z-score: 779.6 bits: 153.5 E(32554): 4.2e-37
Smith-Waterman score: 755; 30.2% identity (62.4% similar) in 463 aa overlap (12-460:4-450)
10 20 30 40 50
pF1KB3 MTPNSMTENGLTAWDKP-----KHCPDREHD----WKLVGMSEACLHRKSHSERRSTLKN
:.:. : :. : : :. :: : ..: . .. : :..
CCDS73 MQQTSWN-PLGGTCKQPPGRTHSAVELWK-PGAQDASSQAQGGSS--CILRE
10 20 30 40
60 70 80 90 100 110
pF1KB3 EQSSPHLIQTTWTSSIFHLDHDDVNDQSVSSAQTFQTE-EKKCKGYIPSYLDKDELCVVC
: :: : .. . . .. .. . . .:. :: :..: .::: ::
CCDS73 EARMPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLG-NELCSVC
50 60 70 80 90 100
120 130 140 150 160 170
pF1KB3 GDKATGYHYRCITCEGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFKKCI
::::.:.:: ..::::::::::.. :. : : :. :.: .: : .:::::..::
CCDS73 GDKASGFHYNVLSCEGCKGFFRRSVIKGAH--YICHSGGHCPMDTYMRRKCQECRLRKCR
110 120 130 140 150 160
180 190 200 210 220
pF1KB3 YVGMATDLVLDDSK-RLAKRKLIEENREKRRREELQKSIGHK--PEPTDEEWELIKTVTE
.:: . ::.. . :: : : ::.. . . : . :. . :. .:. ..
CCDS73 QAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVA
170 180 190 200 210 220
230 240 250 260 270 280
pF1KB3 AHVATNAQGSHWKQKRKFLPEDIGQAPIVNAPEGGKVDLEAFSHFTKIITPAITRVVDFA
:. : .. .... . : :.. :.. .. . :.:::.. .. ..::::
CCDS73 AQQQCNRRS--FSDRLRVTPW-----PMAPDPHSREARQQRFAHFTELAIVSVQEIVDFA
230 240 250 260 270
290 300 310 320 330 340
pF1KB3 KKLPMFCELPCEDQIILLKGCCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLG
:.:: : .: :::: ::: .:.: :... ::.: ::..:. ... .: .. ..::
CCDS73 KQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQ
280 290 300 310 320 330
350 360 370 380 390 400
pF1KB3 V-VSDAIFDLGMSLSSFNLDDTEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHY
: . ::... ... ..:.:.: ::: :. ..:.:::.. ..:. : ... :.. :
CCDS73 VEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAY
340 350 360 370 380 390
410 420 430 440 450 460
pF1KB3 INYRKHHVTHFWPKLLMKVTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED
.. .. : ..:..:::...:: ... :. . . .... . .:::. :...
CCDS73 VSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQ--DKKLPPLLSEIWDVHE
400 410 420 430 440 450
>>CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11 (402 aa)
initn: 637 init1: 204 opt: 747 Z-score: 772.2 bits: 152.0 E(32554): 1.1e-36
Smith-Waterman score: 747; 32.8% identity (66.9% similar) in 375 aa overlap (90-460:37-399)
60 70 80 90 100 110
pF1KB3 QTTWTSSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELCVVCGDKATGYHY
.:. :: :..: .::: ::::::.:.::
CCDS44 GTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLG-NELCSVCGDKASGFHY
10 20 30 40 50 60
120 130 140 150 160 170
pF1KB3 RCITCEGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFKKCIYVGMATDLV
..::::::::::.. :. : : :. :.: .: : .:::::..:: .:: . :
CCDS44 NVLSCEGCKGFFRRSVIKGAH--YICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECV
70 80 90 100 110 120
180 190 200 210 220 230
pF1KB3 LDDSK-RLAKRKLIEENREKRRREELQKSIGHK--PEPTDEEWELIKTVTEAHVATNAQG
:.. . :: : : ::.. . . : . :. . :. .:. .. :. : ..
CCDS44 LSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRS
130 140 150 160 170 180
240 250 260 270 280 290
pF1KB3 SHWKQKRKFLPEDIGQAPIVNAPEGGKVDLEAFSHFTKIITPAITRVVDFAKKLPMFCEL
.... . : :.. :.. .. . :.:::.. .. ..:::::.:: : .:
CCDS44 --FSDRLRVTPW-----PMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQL
190 200 210 220 230
300 310 320 330 340 350
pF1KB3 PCEDQIILLKGCCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLGV-VSDAIFD
:::: ::: .:.: :... ::.: ::..:. ... .: .. ..:: : . ::.
CCDS44 SREDQIALLKTSAIEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFE
240 250 260 270 280 290
360 370 380 390 400 410
pF1KB3 LGMSLSSFNLDDTEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHYINYRKHHVT
.. ... ..:.:.: ::: :. ..:.:::.. ..:. : ... :.. :.. .. :
CCDS44 FSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDR
300 310 320 330 340 350
420 430 440 450 460
pF1KB3 HFWPKLLMKVTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED
..:..:::...:: ... :. . . .... . .:::. :...
CCDS44 LMFPRMLMKLVSLRTLSSVHSEQVFALRLQ--DKKLPPLLSEIWDVHE
360 370 380 390 400
>>CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11 (447 aa)
initn: 637 init1: 204 opt: 747 Z-score: 771.5 bits: 152.0 E(32554): 1.2e-36
Smith-Waterman score: 747; 32.8% identity (66.9% similar) in 375 aa overlap (90-460:82-444)
60 70 80 90 100 110
pF1KB3 QTTWTSSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELCVVCGDKATGYHY
.:. :: :..: .::: ::::::.:.::
CCDS79 GTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLG-NELCSVCGDKASGFHY
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB3 RCITCEGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFKKCIYVGMATDLV
..::::::::::.. :. : : :. :.: .: : .:::::..:: .:: . :
CCDS79 NVLSCEGCKGFFRRSVIKGAH--YICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECV
120 130 140 150 160
180 190 200 210 220 230
pF1KB3 LDDSK-RLAKRKLIEENREKRRREELQKSIGHK--PEPTDEEWELIKTVTEAHVATNAQG
:.. . :: : : ::.. . . : . :. . :. .:. .. :. : ..
CCDS79 LSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRS
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB3 SHWKQKRKFLPEDIGQAPIVNAPEGGKVDLEAFSHFTKIITPAITRVVDFAKKLPMFCEL
.... . : :.. :.. .. . :.:::.. .. ..:::::.:: : .:
CCDS79 --FSDRLRVTPW-----PMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQL
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB3 PCEDQIILLKGCCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLGV-VSDAIFD
:::: ::: .:.: :... ::.: ::..:. ... .: .. ..:: : . ::.
CCDS79 SREDQIALLKTSAIEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFE
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB3 LGMSLSSFNLDDTEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHYINYRKHHVT
.. ... ..:.:.: ::: :. ..:.:::.. ..:. : ... :.. :.. .. :
CCDS79 FSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDR
350 360 370 380 390 400
420 430 440 450 460
pF1KB3 HFWPKLLMKVTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED
..:..:::...:: ... :. . . .... . .:::. :...
CCDS79 LMFPRMLMKLVSLRTLSSVHSEQVFALRLQ--DKKLPPLLSEIWDVHE
410 420 430 440
>>CCDS54627.1 NR1I2 gene_id:8856|Hs108|chr3 (397 aa)
initn: 201 init1: 201 opt: 616 Z-score: 638.1 bits: 127.1 E(32554): 3.2e-29
Smith-Waterman score: 616; 32.4% identity (63.2% similar) in 364 aa overlap (105-459:39-392)
80 90 100 110 120 130
pF1KB3 VNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELCVVCGDKATGYHYRCITCEGCKGFFRRT
..: ::::::::::. .:::::::::::.
CCDS54 WNHADFVHCEDTESVPGKPSVNADEEVGGPQICRVCGDKATGYHFNVMTCEGCKGFFRRA
10 20 30 40 50 60
140 150 160 170 180 190
pF1KB3 IQKNLHPSYSCKY-EGKCVIDKVTRNQCQECRFKKCIYVGMATDLVLDDSKRLAKRKLIE
...: . : . .: : : . :: ::: ::..::. :: .....: .: ::.
CCDS54 MKRNAR--LRCPFRKGACEITRKTRRQCQACRLRKCLESGMKKEMIMSDEAVEERRALIK
70 80 90 100 110 120
200 210 220 230 240
pF1KB3 ENREKRRREELQKSIGHKPEPTDEEWELIKTVTEAHVAT-NAQGSHWKQKRKFLP---ED
:.: .: : .: . :.:. .:. . .:.. : .. ::.:. : : ::
CCDS54 --RKKSERTGTQP-LGVQGL-TEEQRMMIRELMDAQMKTFDTTFSHFKNFRVSLQLRGED
130 140 150 160 170 180
250 260 270 280 290 300
pF1KB3 IGQAPIVNAPE--GGKVDLEAFSHFTKIITPAITRVVDFAKKLPMFCELPCEDQIILLKG
:.. . : ::: . . :.. . : . ...::: . .: .:: :::: ::::
CCDS54 -GSVWNYKPPADSGGKEIFSLLPHMADMSTYMFKGIISFAKVISYFRDLPIEDQISLLKG
190 200 210 220 230 240
310 320 330 340 350 360
pF1KB3 CCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLGVVSDAIFDLGMSLSSFNLDD
.:. .:: . .. :. : :... . .: .. . .. . . :....: .
CCDS54 AAFELCQLRFNTVFNAETGTWEC-GRLSYCLEDTAGGFQQLLLEPMLKFHYMLKKLQLHE
250 260 270 280 290 300
370 380 390 400 410 420
pF1KB3 TEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHYINYRKHHVTH--FWPKLLMKV
: .:.::. :.: ::::. . ... :..: .... ::. . . .: .. :.. .
CCDS54 EEYVLMQAISLFSPDRPGVLQHRVVDQLQEQFAITLKSYIECNRPQPAHRFLFLKIMAML
310 320 330 340 350 360
430 440 450 460
pF1KB3 TDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED
:.:: :.: :..:.:... : . ::. :.:
CCDS54 TELRSINAQHTQRLLRIQDIHP--FATPLMQELFGITGS
370 380 390
>>CCDS55873.1 NR1H4 gene_id:9971|Hs108|chr12 (476 aa)
initn: 557 init1: 223 opt: 578 Z-score: 598.0 bits: 120.0 E(32554): 5.5e-27
Smith-Waterman score: 584; 31.2% identity (56.9% similar) in 404 aa overlap (78-460:98-474)
50 60 70 80 90 100
pF1KB3 TLKNEQSSPHLIQTTWTSSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELC
:. . . . . .: : . . ::::
CCDS55 SNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRIKGDELC
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB3 VVCGDKATGYHYRCITCEGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFK
:::::.:.:::: .:::::::::::.: :: :.:: :.::.: : .:::::..
CCDS55 VVCGDRASGYHYNALTCEGCKGFFRRSITKN--AVYKCKNGGNCVMDMYMRRKCQECRLR
130 140 150 160 170 180
170 180 190 200 210
pF1KB3 KCIYVGMA-----TDLVLD---DSKRLAKR------KLIEENREKRRREELQ---KSIGH
:: .:: : :. . :::: : . ..:. : : ... :: .
CCDS55 KCKEMGMLAECMYTGLLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLRQVTSTTKSCRE
190 200 210 220 230 240
220 230 240 250 260 270
pF1KB3 KPEPTDEEWELIKTVTEAHVATNAQGSHWKQKRKFLPEDIGQAPIVNAPEGGKVDLEAFS
: : : .. :.. . ... : : . :.: :... : :
CCDS55 KTELTPDQQTLLHFIMDSY---NKQRMPQEITNKILKEEFSAE-------------ENFL
250 260 270 280
280 290 300 310 320 330
pF1KB3 HFTKIITPAITRVVDFAKKLPMFCELPCEDQIILLKGCCMEIMSLRAAVRYDPESETLTL
.:.. : . .:.:.:::: : : :::: :::: .: : ::.: .. . .
CCDS55 ILTEMATNHVQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPS---
290 300 310 320 330 340
340 350 360 370 380
pF1KB3 NGEMAVTRGQLKNGGLGVVSDA----IFDLGMSLSSFNLDDTEVALLQAVLLMSSDRPGL
:. . . ...:.: .:: .:.. :.. ... . : ::: :....: :: .
CCDS55 -GHSDLLEERIRNSG---ISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYI
350 360 370 380 390 400
390 400 410 420 430 440
pF1KB3 ACVERIEKYQDSFLLAFEHYINYRKHHVTHFWPKLLMKVTDLRMIGACHASRFLHMKVEC
: .:: :. .: .... . .. . . . :: ..:.:: .. :: .. .:.
CCDS55 KDREAVEKLQEPLLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVN-
410 420 430 440 450 460
450 460
pF1KB3 PTELFPPLFLEVFED
. : ::. :...
CCDS55 -DHKFTPLLCEIWDVQ
470
>>CCDS55876.1 NR1H4 gene_id:9971|Hs108|chr12 (486 aa)
initn: 557 init1: 223 opt: 578 Z-score: 597.9 bits: 120.0 E(32554): 5.5e-27
Smith-Waterman score: 584; 31.2% identity (56.9% similar) in 404 aa overlap (78-460:108-484)
50 60 70 80 90 100
pF1KB3 TLKNEQSSPHLIQTTWTSSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELC
:. . . . . .: : . . ::::
CCDS55 SNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRIKGDELC
80 90 100 110 120 130
110 120 130 140 150 160
pF1KB3 VVCGDKATGYHYRCITCEGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFK
:::::.:.:::: .:::::::::::.: :: :.:: :.::.: : .:::::..
CCDS55 VVCGDRASGYHYNALTCEGCKGFFRRSITKN--AVYKCKNGGNCVMDMYMRRKCQECRLR
140 150 160 170 180 190
170 180 190 200 210
pF1KB3 KCIYVGMA-----TDLVLD---DSKRLAKR------KLIEENREKRRREELQ---KSIGH
:: .:: : :. . :::: : . ..:. : : ... :: .
CCDS55 KCKEMGMLAECMYTGLLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLRQVTSTTKSCRE
200 210 220 230 240 250
220 230 240 250 260 270
pF1KB3 KPEPTDEEWELIKTVTEAHVATNAQGSHWKQKRKFLPEDIGQAPIVNAPEGGKVDLEAFS
: : : .. :.. . ... : : . :.: :... : :
CCDS55 KTELTPDQQTLLHFIMDSY---NKQRMPQEITNKILKEEFSAE-------------ENFL
260 270 280 290
280 290 300 310 320 330
pF1KB3 HFTKIITPAITRVVDFAKKLPMFCELPCEDQIILLKGCCMEIMSLRAAVRYDPESETLTL
.:.. : . .:.:.:::: : : :::: :::: .: : ::.: .. . .
CCDS55 ILTEMATNHVQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPS---
300 310 320 330 340 350
340 350 360 370 380
pF1KB3 NGEMAVTRGQLKNGGLGVVSDA----IFDLGMSLSSFNLDDTEVALLQAVLLMSSDRPGL
:. . . ...:.: .:: .:.. :.. ... . : ::: :....: :: .
CCDS55 -GHSDLLEERIRNSG---ISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYI
360 370 380 390 400 410
390 400 410 420 430 440
pF1KB3 ACVERIEKYQDSFLLAFEHYINYRKHHVTHFWPKLLMKVTDLRMIGACHASRFLHMKVEC
: .:: :. .: .... . .. . . . :: ..:.:: .. :: .. .:.
CCDS55 KDREAVEKLQEPLLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVN-
420 430 440 450 460 470
450 460
pF1KB3 PTELFPPLFLEVFED
. : ::. :...
CCDS55 -DHKFTPLLCEIWDVQ
480
461 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 13:51:32 2016 done: Thu Nov 3 13:51:32 2016
Total Scan time: 3.040 Total Display time: 0.080
Function used was FASTA [36.3.4 Apr, 2011]