FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7759, 447 aa
1>>>pF1KB7759 447 - 447 aa - 447 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.5654+/-0.000749; mu= 13.5755+/- 0.046
mean_var=117.1488+/-23.417, 0's: 0 Z-trim(113.0): 124 B-trim: 42 in 1/51
Lambda= 0.118496
statistics sampled from 13519 (13644) to 13519 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.77), E-opt: 0.2 (0.419), width: 16
Scan time: 3.020
The best scores are: opt bits E(32554)
CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11 ( 447) 3026 527.8 8.3e-150
CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11 ( 453) 2913 508.5 5.5e-144
CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11 ( 402) 2711 473.9 1.2e-133
CCDS44584.1 NR1H3 gene_id:10062|Hs108|chr11 ( 387) 1646 291.9 7.7e-79
CCDS42593.1 NR1H2 gene_id:7376|Hs108|chr19 ( 460) 1234 221.5 1.4e-57
CCDS58673.1 NR1H2 gene_id:7376|Hs108|chr19 ( 363) 1228 220.4 2.4e-57
CCDS9078.1 NR1H4 gene_id:9971|Hs108|chr12 ( 472) 915 167.0 3.8e-41
CCDS55875.1 NR1H4 gene_id:9971|Hs108|chr12 ( 482) 915 167.0 3.8e-41
CCDS55873.1 NR1H4 gene_id:9971|Hs108|chr12 ( 476) 897 163.9 3.2e-40
CCDS55876.1 NR1H4 gene_id:9971|Hs108|chr12 ( 486) 897 163.9 3.2e-40
CCDS2641.1 THRB gene_id:7068|Hs108|chr3 ( 461) 747 138.2 1.6e-32
CCDS42316.1 THRA gene_id:7067|Hs108|chr17 ( 410) 711 132.0 1.1e-30
CCDS54627.1 NR1I2 gene_id:8856|Hs108|chr3 ( 397) 696 129.5 6.1e-30
CCDS58546.1 THRA gene_id:7067|Hs108|chr17 ( 451) 663 123.9 3.4e-28
CCDS11360.1 THRA gene_id:7067|Hs108|chr17 ( 490) 656 122.7 8.3e-28
CCDS41430.1 NR1I3 gene_id:9970|Hs108|chr1 ( 352) 512 98.0 1.6e-20
CCDS41429.1 NR1I3 gene_id:9970|Hs108|chr1 ( 357) 493 94.7 1.6e-19
CCDS55874.1 NR1H4 gene_id:9971|Hs108|chr12 ( 425) 469 90.7 3.1e-18
CCDS44260.1 NR1I3 gene_id:9970|Hs108|chr1 ( 339) 459 88.9 8.5e-18
CCDS33718.1 NR1D2 gene_id:9975|Hs108|chr3 ( 579) 436 85.1 2e-16
CCDS45671.1 RARA gene_id:5914|Hs108|chr17 ( 365) 431 84.1 2.5e-16
CCDS58237.1 RARG gene_id:5916|Hs108|chr12 ( 432) 430 84.0 3.2e-16
CCDS46775.1 RARB gene_id:5915|Hs108|chr3 ( 336) 424 82.9 5.3e-16
CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 ( 614) 419 82.3 1.5e-15
CCDS43136.1 NR1I2 gene_id:8856|Hs108|chr3 ( 434) 399 78.7 1.3e-14
CCDS2995.1 NR1I2 gene_id:8856|Hs108|chr3 ( 473) 399 78.8 1.4e-14
CCDS8310.1 PGR gene_id:5241|Hs108|chr11 ( 933) 402 79.5 1.6e-14
CCDS5234.1 ESR1 gene_id:2099|Hs108|chr6 ( 595) 398 78.7 1.8e-14
CCDS8757.1 VDR gene_id:7421|Hs108|chr12 ( 427) 385 76.3 6.6e-14
CCDS3772.1 NR3C2 gene_id:4306|Hs108|chr4 ( 984) 390 77.5 6.9e-14
CCDS55820.1 VDR gene_id:7421|Hs108|chr12 ( 477) 385 76.4 7.1e-14
CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 375 74.6 2.2e-13
CCDS53409.1 NR1I3 gene_id:9970|Hs108|chr1 ( 319) 368 73.3 3.9e-13
CCDS61469.1 ESR2 gene_id:2100|Hs108|chr14 ( 439) 353 70.9 3e-12
CCDS61470.1 ESR2 gene_id:2100|Hs108|chr14 ( 474) 353 70.9 3.2e-12
CCDS55920.1 ESR2 gene_id:2100|Hs108|chr14 ( 481) 353 70.9 3.2e-12
CCDS32096.1 ESR2 gene_id:2100|Hs108|chr14 ( 495) 353 70.9 3.3e-12
CCDS9762.1 ESR2 gene_id:2100|Hs108|chr14 ( 530) 353 70.9 3.4e-12
CCDS73751.1 NR2E3 gene_id:10002|Hs108|chr15 ( 367) 347 69.8 5.3e-12
CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 348 70.0 5.5e-12
CCDS73750.1 NR2E3 gene_id:10002|Hs108|chr15 ( 410) 347 69.8 5.7e-12
CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 ( 423) 347 69.8 5.9e-12
CCDS44261.1 NR1I3 gene_id:9970|Hs108|chr1 ( 340) 345 69.4 6.3e-12
CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20 ( 449) 346 69.7 6.9e-12
CCDS1228.1 NR1I3 gene_id:9970|Hs108|chr1 ( 348) 343 69.1 8.1e-12
CCDS53405.1 NR1I3 gene_id:9970|Hs108|chr1 ( 296) 341 68.7 9.1e-12
CCDS2610.2 PPARG gene_id:5468|Hs108|chr3 ( 477) 344 69.4 9.2e-12
CCDS44262.1 NR1I3 gene_id:9970|Hs108|chr1 ( 309) 341 68.7 9.4e-12
CCDS41428.1 NR1I3 gene_id:9970|Hs108|chr1 ( 314) 341 68.7 9.5e-12
CCDS2609.1 PPARG gene_id:5468|Hs108|chr3 ( 505) 344 69.4 9.6e-12
>>CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11 (447 aa)
initn: 3026 init1: 3026 opt: 3026 Z-score: 2803.0 bits: 527.8 E(32554): 8.3e-150
Smith-Waterman score: 3026; 100.0% identity (100.0% similar) in 447 aa overlap (1-447:1-447)
10 20 30 40 50 60
pF1KB7 MSLWLGAPVPDIPPDSAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTAGVGLEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS79 MSLWLGAPVPDIPPDSAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTAGVGLEA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 AEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS79 AEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 FFRRSVIKGAHYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS79 FFRRSVIKGAHYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 RQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLRVTPWPM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS79 RQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLRVTPWPM
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 APDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS79 APDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 ETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS79 ETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLI
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 AISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS79 AISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSV
370 380 390 400 410 420
430 440
pF1KB7 HSEQVFALRLQDKKLPPLLSEIWDVHE
:::::::::::::::::::::::::::
CCDS79 HSEQVFALRLQDKKLPPLLSEIWDVHE
430 440
>>CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11 (453 aa)
initn: 2910 init1: 2910 opt: 2913 Z-score: 2698.5 bits: 508.5 E(32554): 5.5e-144
Smith-Waterman score: 2913; 99.1% identity (99.1% similar) in 438 aa overlap (13-447:16-453)
10 20 30 40 50
pF1KB7 MSLWLGAPVPDIPPD---SAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTA
:: :::::::::::::::::::::::::::::::::::::::
CCDS73 MQQTSWNPLGGTCKQPPGRTHSAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTA
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB7 GVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 GVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLS
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB7 CEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 CEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQI
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB7 RLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 RLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLR
190 200 210 220 230 240
240 250 260 270 280 290
pF1KB7 VTPWPMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 VTPWPMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSA
250 260 270 280 290 300
300 310 320 330 340 350
pF1KB7 IEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 IEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDA
310 320 330 340 350 360
360 370 380 390 400 410
pF1KB7 EFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 EFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSL
370 380 390 400 410 420
420 430 440
pF1KB7 RTLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE
:::::::::::::::::::::::::::::::::
CCDS73 RTLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE
430 440 450
>>CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11 (402 aa)
initn: 2711 init1: 2711 opt: 2711 Z-score: 2512.6 bits: 473.9 E(32554): 1.2e-133
Smith-Waterman score: 2711; 100.0% identity (100.0% similar) in 402 aa overlap (46-447:1-402)
20 30 40 50 60 70
pF1KB7 SAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSE
::::::::::::::::::::::::::::::
CCDS44 MPHSAGGTAGVGLEAAEPTALLTRAEPPSE
10 20 30
80 90 100 110 120 130
pF1KB7 PTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICH
40 50 60 70 80 90
140 150 160 170 180 190
pF1KB7 SGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPR
100 110 120 130 140 150
200 210 220 230 240 250
pF1KB7 ASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLRVTPWPMAPDPHSREARQQRFA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLRVTPWPMAPDPHSREARQQRFA
160 170 180 190 200 210
260 270 280 290 300 310
pF1KB7 HFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYNPGSESITF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 HFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYNPGSESITF
220 230 240 250 260 270
320 330 340 350 360 370
pF1KB7 LKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQ
280 290 300 310 320 330
380 390 400 410 420 430
pF1KB7 LQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKL
340 350 360 370 380 390
440
pF1KB7 PPLLSEIWDVHE
::::::::::::
CCDS44 PPLLSEIWDVHE
400
>>CCDS44584.1 NR1H3 gene_id:10062|Hs108|chr11 (387 aa)
initn: 1646 init1: 1646 opt: 1646 Z-score: 1528.9 bits: 291.9 E(32554): 7.7e-79
Smith-Waterman score: 2498; 86.6% identity (86.6% similar) in 447 aa overlap (1-447:1-387)
10 20 30 40 50 60
pF1KB7 MSLWLGAPVPDIPPDSAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTAGVGLEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MSLWLGAPVPDIPPDSAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTAGVGLEA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 AEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 FFRRSVIKGAHYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 FFRRSVIKGAHYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 RQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLRVTPWPM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 RQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLRVT----
190 200 210 220 230
250 260 270 280 290 300
pF1KB7 APDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLL
::::
CCDS44 --------------------------------------------------------VMLL
240
310 320 330 340 350 360
pF1KB7 ETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLI
250 260 270 280 290 300
370 380 390 400 410 420
pF1KB7 AISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSV
310 320 330 340 350 360
430 440
pF1KB7 HSEQVFALRLQDKKLPPLLSEIWDVHE
:::::::::::::::::::::::::::
CCDS44 HSEQVFALRLQDKKLPPLLSEIWDVHE
370 380
>>CCDS42593.1 NR1H2 gene_id:7376|Hs108|chr19 (460 aa)
initn: 1837 init1: 1228 opt: 1234 Z-score: 1147.2 bits: 221.5 E(32554): 1.4e-57
Smith-Waterman score: 1835; 63.0% identity (78.6% similar) in 459 aa overlap (13-447:4-460)
10 20 30 40 50 60
pF1KB7 MSLWLGAPVPDIPPDSAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTAGVGLEA
: :... :: . : ..: . .::. : .: :
CCDS42 MSSPTTSSLDTPLPGNGPPQPGAPSSSPTV-KEEGPEPWPGGPDPDVPGTD
10 20 30 40 50
70 80 90 100 110 120
pF1KB7 AEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKG
.: : : .: : .::::::::::::.::: :::::::::::::::::::::
CCDS42 EASSACSTDWVIP-DPEEEPERKRKKGPAPKMLGHELCRVCGDKASGFHYNVLSCEGCKG
60 70 80 90 100
130 140 150 160 170
pF1KB7 FFRRSVIKGA--HYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKK
::::::..:. .: :..:: : ::..::::::.::::::..:::::.::::::::: ::
CCDS42 FFRRSVVRGGARRYACRGGGTCQMDAFMRRKCQQCRLRKCKEAGMREQCVLSEEQIRKKK
110 120 130 140 150 160
180 190 200 210
pF1KB7 LKRQEEEQAHATSLP--PRASSP----PQILP----------------QLSPEQLGMIEK
...:..:. .. : :..:: : : ::. : ::..
CCDS42 IRKQQQESQSQSQSPVGPQGSSSSASGPGASPGGSEAGSQGSGEGEGVQLTAAQELMIQQ
170 180 190 200 210 220
220 230 240 250 260 270
pF1KB7 LVAAQQQCNRRSFSDRLRVTPWPMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLP
::::: :::.:::::. .:::::.. ::.::.::::::::::::::.:::::::::::.:
CCDS42 LVAAQLQCNKRSFSDQPKVTPWPLGADPQSRDARQQRFAHFTELAIISVQEIVDFAKQVP
230 240 250 260 270 280
280 290 300 310 320 330
pF1KB7 GFLQLSREDQIALLKTSAIEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFI
:::::.:::::::::.:.::.:::::.:::: .: :::::::.:...:: .::::::::
CCDS42 GFLQLGREDQIALLKASTIEIMLLETARRYNHETECITFLKDFTYSKDDFHRAGLQVEFI
290 300 310 320 330 340
340 350 360 370 380 390
pF1KB7 NPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIH
:::::::::: .: :.:::.::::::.::::::::::. .:: ::. ::::: .:. :.
CCDS42 NPIFEFSRAMRRLGLDDAEYALLIAINIFSADRPNVQEPGRVEALQQPYVEALLSYTRIK
350 360 370 380 390 400
400 410 420 430 440
pF1KB7 HPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE
.:.:.: ::::::::::::::::::::::::::::::::::::::::::::
CCDS42 RPQDQLRFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE
410 420 430 440 450 460
>>CCDS58673.1 NR1H2 gene_id:7376|Hs108|chr19 (363 aa)
initn: 1300 init1: 1228 opt: 1228 Z-score: 1143.0 bits: 220.4 E(32554): 2.4e-57
Smith-Waterman score: 1274; 67.9% identity (83.1% similar) in 302 aa overlap (168-447:62-363)
140 150 160 170 180 190
pF1KB7 GHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLP--PR
:::::::: ::...:..:. .. : :.
CCDS58 EEGPEPWPGGPDPDVPGTDEASSACSTDWGVLSEEQIRKKKIRKQQQESQSQSQSPVGPQ
40 50 60 70 80 90
200 210 220 230
pF1KB7 ASSP----PQILP----------------QLSPEQLGMIEKLVAAQQQCNRRSFSDRLRV
.:: : : ::. : ::..::::: :::.:::::. .:
CCDS58 GSSSSASGPGASPGGSEAGSQGSGEGEGVQLTAAQELMIQQLVAAQLQCNKRSFSDQPKV
100 110 120 130 140 150
240 250 260 270 280 290
pF1KB7 TPWPMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSAI
::::.. ::.::.::::::::::::::.:::::::::::.::::::.:::::::::.:.:
CCDS58 TPWPLGADPQSRDARQQRFAHFTELAIISVQEIVDFAKQVPGFLQLGREDQIALLKASTI
160 170 180 190 200 210
300 310 320 330 340 350
pF1KB7 EVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAE
:.:::::.:::: .: :::::::.:...:: .:::::::::::::::::: .: :.:::
CCDS58 EIMLLETARRYNHETECITFLKDFTYSKDDFHRAGLQVEFINPIFEFSRAMRRLGLDDAE
220 230 240 250 260 270
360 370 380 390 400 410
pF1KB7 FALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLR
.::::::.::::::::::. .:: ::. ::::: .:. :..:.:.: ::::::::::::
CCDS58 YALLIAINIFSADRPNVQEPGRVEALQQPYVEALLSYTRIKRPQDQLRFPRMLMKLVSLR
280 290 300 310 320 330
420 430 440
pF1KB7 TLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE
::::::::::::::::::::::::::::::::
CCDS58 TLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE
340 350 360
>>CCDS9078.1 NR1H4 gene_id:9971|Hs108|chr12 (472 aa)
initn: 862 init1: 462 opt: 915 Z-score: 852.3 bits: 167.0 E(32554): 3.8e-41
Smith-Waterman score: 915; 39.1% identity (68.5% similar) in 391 aa overlap (63-446:92-472)
40 50 60 70 80 90
pF1KB7 QGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKM
:. : ..: . . : . : ..
CCDS90 SSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRI
70 80 90 100 110 120
100 110 120 130 140 150
pF1KB7 LGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQE
:.::: ::::.:::.:::.:.:::::::::::. :.: : :..::.: :: ::::::::
CCDS90 KGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQE
130 140 150 160 170 180
160 170 180 190 200 210
pF1KB7 CRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLG
::::::.. :: ::.:.: : . :.:... ...: : .: . : :.. .
CCDS90 CRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTV---NEDSEGRDLRQVTSTTKS
190 200 210 220 230
220 230 240 250 260
pF1KB7 MIEKL-VAAQQQCNRRSFSDRL--RVTPWPMAPDPHSRE-ARQQRFAHFTELAIVSVQEI
:: .. .:: . . : . : .. ..: . .. : .::.: :: .
CCDS90 CREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNHVQVL
240 250 260 270 280 290
270 280 290 300 310 320
pF1KB7 VDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYN---PGSESITFLKDFSYNRED
:.:.:.:::: :..:::::::: ::.:.:.:.... .: :...: :. .:
CCDS90 VEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHS-----DLLEER--
300 310 320 330 340 350
330 340 350 360 370 380
pF1KB7 FAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTY
. ..:.. :.:.:.: : ....::.... :.::: :: :.: :: ..:. ::.::.
CCDS90 IRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPL
360 370 380 390 400 410
390 400 410 420 430 440
pF1KB7 VEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWDV
...:. .::.:.. : .: .:. :::.. :.:.... :..:.:. ::: :::::
CCDS90 LDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDV
420 430 440 450 460 470
pF1KB7 HE
.
CCDS90 Q
>>CCDS55875.1 NR1H4 gene_id:9971|Hs108|chr12 (482 aa)
initn: 891 init1: 462 opt: 915 Z-score: 852.1 bits: 167.0 E(32554): 3.8e-41
Smith-Waterman score: 915; 39.1% identity (68.5% similar) in 391 aa overlap (63-446:102-482)
40 50 60 70 80 90
pF1KB7 QGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKM
:. : ..: . . : . : ..
CCDS55 SSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRI
80 90 100 110 120 130
100 110 120 130 140 150
pF1KB7 LGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQE
:.::: ::::.:::.:::.:.:::::::::::. :.: : :..::.: :: ::::::::
CCDS55 KGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQE
140 150 160 170 180 190
160 170 180 190 200 210
pF1KB7 CRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLG
::::::.. :: ::.:.: : . :.:... ...: : .: . : :.. .
CCDS55 CRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTV---NEDSEGRDLRQVTSTTKS
200 210 220 230 240
220 230 240 250 260
pF1KB7 MIEKL-VAAQQQCNRRSFSDRL--RVTPWPMAPDPHSRE-ARQQRFAHFTELAIVSVQEI
:: .. .:: . . : . : .. ..: . .. : .::.: :: .
CCDS55 CREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNHVQVL
250 260 270 280 290 300
270 280 290 300 310 320
pF1KB7 VDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYN---PGSESITFLKDFSYNRED
:.:.:.:::: :..:::::::: ::.:.:.:.... .: :...: :. .:
CCDS55 VEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHS-----DLLEER--
310 320 330 340 350 360
330 340 350 360 370 380
pF1KB7 FAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTY
. ..:.. :.:.:.: : ....::.... :.::: :: :.: :: ..:. ::.::.
CCDS55 IRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPL
370 380 390 400 410 420
390 400 410 420 430 440
pF1KB7 VEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWDV
...:. .::.:.. : .: .:. :::.. :.:.... :..:.:. ::: :::::
CCDS55 LDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDV
430 440 450 460 470 480
pF1KB7 HE
.
CCDS55 Q
>>CCDS55873.1 NR1H4 gene_id:9971|Hs108|chr12 (476 aa)
initn: 820 init1: 420 opt: 897 Z-score: 835.6 bits: 163.9 E(32554): 3.2e-40
Smith-Waterman score: 897; 38.7% identity (67.8% similar) in 395 aa overlap (63-446:92-476)
40 50 60 70 80 90
pF1KB7 QGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKM
:. : ..: . . : . : ..
CCDS55 SSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRI
70 80 90 100 110 120
100 110 120 130 140 150
pF1KB7 LGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQE
:.::: ::::.:::.:::.:.:::::::::::. :.: : :..::.: :: ::::::::
CCDS55 KGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQE
130 140 150 160 170 180
160 170 180 190 200
pF1KB7 CRLRKCRQAGMREECV----LSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSP
::::::.. :: ::. :.: : . :.:... ...: : .: . : :..
CCDS55 CRLRKCKEMGMLAECMYTGLLTEIQCKSKRLRKNVKQHADQTV---NEDSEGRDLRQVTS
190 200 210 220 230
210 220 230 240 250 260
pF1KB7 EQLGMIEKL-VAAQQQCNRRSFSDRL--RVTPWPMAPDPHSRE-ARQQRFAHFTELAIVS
. :: .. .:: . . : . : .. ..: . .. : .::.:
CCDS55 TTKSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNH
240 250 260 270 280 290
270 280 290 300 310 320
pF1KB7 VQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYN---PGSESITFLKDFSY
:: .:.:.:.:::: :..:::::::: ::.:.:.:.... .: :...: :.
CCDS55 VQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHS-----DLLE
300 310 320 330 340 350
330 340 350 360 370 380
pF1KB7 NREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERL
.: . ..:.. :.:.:.: : ....::.... :.::: :: :.: :: ..:. ::.:
CCDS55 ER--IRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKL
360 370 380 390 400 410
390 400 410 420 430 440
pF1KB7 QHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSE
:. ...:. .::.:.. : .: .:. :::.. :.:.... :..:.:. ::: :
CCDS55 QEPLLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCE
420 430 440 450 460 470
pF1KB7 IWDVHE
::::.
CCDS55 IWDVQ
>>CCDS55876.1 NR1H4 gene_id:9971|Hs108|chr12 (486 aa)
initn: 873 init1: 420 opt: 897 Z-score: 835.5 bits: 163.9 E(32554): 3.2e-40
Smith-Waterman score: 897; 38.7% identity (67.8% similar) in 395 aa overlap (63-446:102-486)
40 50 60 70 80 90
pF1KB7 QGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKM
:. : ..: . . : . : ..
CCDS55 SSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRI
80 90 100 110 120 130
100 110 120 130 140 150
pF1KB7 LGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQE
:.::: ::::.:::.:::.:.:::::::::::. :.: : :..::.: :: ::::::::
CCDS55 KGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQE
140 150 160 170 180 190
160 170 180 190 200
pF1KB7 CRLRKCRQAGMREECV----LSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSP
::::::.. :: ::. :.: : . :.:... ...: : .: . : :..
CCDS55 CRLRKCKEMGMLAECMYTGLLTEIQCKSKRLRKNVKQHADQTV---NEDSEGRDLRQVTS
200 210 220 230 240
210 220 230 240 250 260
pF1KB7 EQLGMIEKL-VAAQQQCNRRSFSDRL--RVTPWPMAPDPHSRE-ARQQRFAHFTELAIVS
. :: .. .:: . . : . : .. ..: . .. : .::.:
CCDS55 TTKSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNH
250 260 270 280 290 300
270 280 290 300 310 320
pF1KB7 VQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYN---PGSESITFLKDFSY
:: .:.:.:.:::: :..:::::::: ::.:.:.:.... .: :...: :.
CCDS55 VQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHS-----DLLE
310 320 330 340 350 360
330 340 350 360 370 380
pF1KB7 NREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERL
.: . ..:.. :.:.:.: : ....::.... :.::: :: :.: :: ..:. ::.:
CCDS55 ER--IRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKL
370 380 390 400 410 420
390 400 410 420 430 440
pF1KB7 QHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSE
:. ...:. .::.:.. : .: .:. :::.. :.:.... :..:.:. ::: :
CCDS55 QEPLLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCE
430 440 450 460 470 480
pF1KB7 IWDVHE
::::.
CCDS55 IWDVQ
447 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 22:11:33 2016 done: Fri Nov 4 22:11:33 2016
Total Scan time: 3.020 Total Display time: 0.060
Function used was FASTA [36.3.4 Apr, 2011]