FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0940, 459 aa
1>>>pF1KE0940 459 - 459 aa - 459 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.7189+/-0.00106; mu= 11.3635+/- 0.064
mean_var=99.4889+/-19.308, 0's: 0 Z-trim(106.6): 124 B-trim: 0 in 0/50
Lambda= 0.128584
statistics sampled from 8924 (9051) to 8924 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.647), E-opt: 0.2 (0.278), width: 16
Scan time: 2.130
The best scores are: opt bits E(32554)
CCDS6646.1 RORB gene_id:6096|Hs108|chr9 ( 459) 3088 583.5 1.6e-166
CCDS45271.1 RORA gene_id:6095|Hs108|chr15 ( 468) 1971 376.3 3.8e-104
CCDS10179.1 RORA gene_id:6095|Hs108|chr15 ( 556) 1967 375.5 7.4e-104
CCDS10178.1 RORA gene_id:6095|Hs108|chr15 ( 548) 1964 375.0 1.1e-103
CCDS10177.1 RORA gene_id:6095|Hs108|chr15 ( 523) 1957 373.7 2.5e-103
CCDS30856.1 RORC gene_id:6097|Hs108|chr1 ( 497) 877 173.3 5e-43
CCDS1004.1 RORC gene_id:6097|Hs108|chr1 ( 518) 877 173.3 5.1e-43
CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 ( 614) 432 90.8 4.2e-18
CCDS33718.1 NR1D2 gene_id:9975|Hs108|chr3 ( 579) 426 89.7 8.7e-18
CCDS60383.1 NR5A2 gene_id:2494|Hs108|chr1 ( 469) 415 87.6 3e-17
CCDS1400.1 NR5A2 gene_id:2494|Hs108|chr1 ( 495) 415 87.6 3.1e-17
CCDS1401.1 NR5A2 gene_id:2494|Hs108|chr1 ( 541) 415 87.6 3.4e-17
CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 404 85.5 1e-16
CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 404 85.6 1.2e-16
CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 404 85.6 1.2e-16
CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 400 84.8 2e-16
CCDS33669.1 PPARA gene_id:5465|Hs108|chr22 ( 468) 397 84.3 3e-16
CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 396 84.1 3.3e-16
CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 396 84.1 3.4e-16
CCDS4804.1 PPARD gene_id:5467|Hs108|chr6 ( 361) 391 83.1 5.2e-16
CCDS54994.1 PPARD gene_id:5467|Hs108|chr6 ( 402) 391 83.1 5.7e-16
CCDS2610.2 PPARG gene_id:5468|Hs108|chr3 ( 477) 392 83.3 5.8e-16
CCDS2609.1 PPARG gene_id:5468|Hs108|chr3 ( 505) 392 83.4 6.1e-16
CCDS4803.1 PPARD gene_id:5467|Hs108|chr6 ( 441) 391 83.1 6.2e-16
CCDS6856.1 NR5A1 gene_id:2516|Hs108|chr9 ( 461) 390 83.0 7.3e-16
CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 ( 340) 387 82.3 8.2e-16
CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 ( 463) 387 82.4 1.1e-15
CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 384 81.9 1.6e-15
CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 ( 414) 382 81.5 1.9e-15
CCDS55340.1 NR6A1 gene_id:2649|Hs108|chr9 ( 475) 382 81.5 2.1e-15
CCDS65127.1 NR6A1 gene_id:2649|Hs108|chr9 ( 476) 378 80.7 3.5e-15
CCDS35137.1 NR6A1 gene_id:2649|Hs108|chr9 ( 480) 378 80.7 3.5e-15
CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 ( 423) 377 80.5 3.6e-15
CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 ( 533) 378 80.8 3.9e-15
CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 ( 537) 378 80.8 3.9e-15
CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19 ( 404) 367 78.7 1.3e-14
CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 ( 467) 367 78.7 1.4e-14
CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 ( 483) 367 78.7 1.5e-14
CCDS9051.1 NR2C1 gene_id:7181|Hs108|chr12 ( 603) 367 78.8 1.8e-14
CCDS46775.1 RARB gene_id:5915|Hs108|chr3 ( 336) 356 76.6 4.4e-14
CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 ( 626) 356 76.7 7.5e-14
CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 ( 637) 356 76.7 7.6e-14
CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 ( 443) 350 75.5 1.2e-13
CCDS74905.1 NR2C2 gene_id:7182|Hs108|chr3 ( 596) 350 75.6 1.6e-13
CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 ( 598) 350 75.6 1.6e-13
CCDS2621.1 NR2C2 gene_id:7182|Hs108|chr3 ( 615) 350 75.6 1.6e-13
CCDS5063.1 NR2E1 gene_id:7101|Hs108|chr6 ( 385) 343 74.2 2.6e-13
CCDS69165.1 NR2E1 gene_id:7101|Hs108|chr6 ( 422) 343 74.2 2.8e-13
CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 ( 598) 340 73.7 5.7e-13
CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 ( 611) 340 73.7 5.8e-13
>>CCDS6646.1 RORB gene_id:6096|Hs108|chr9 (459 aa)
initn: 3088 init1: 3088 opt: 3088 Z-score: 3103.2 bits: 583.5 E(32554): 1.6e-166
Smith-Waterman score: 3088; 100.0% identity (100.0% similar) in 459 aa overlap (1-459:1-459)
10 20 30 40 50 60
pF1KE0 MRAQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQQNNASYSCPRQRNCLIDRTNRN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 MRAQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQQNNASYSCPRQRNCLIDRTNRN
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 RCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLYAEVQKHQQRLQEQRQQQSGEAEALAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 RCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLYAEVQKHQQRLQEQRQQQSGEAEALAR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 VYSSSISNGLSNLNNETSGTYANGHVIDLPKSEGYYNVDSGQPSPDQSGLDMTGIKQIKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 VYSSSISNGLSNLNNETSGTYANGHVIDLPKSEGYYNVDSGQPSPDQSGLDMTGIKQIKQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 EPIYDLTSVPNLFTYSSFNNGQLAPGITMTEIDRIAQNIIKSHLETCQYTMEELHQLAWQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 EPIYDLTSVPNLFTYSSFNNGQLAPGITMTEIDRIAQNIIKSHLETCQYTMEELHQLAWQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 THTYEEIKAYQSKSREALWQQCAIQITHAIQYVVEFAKRITGFMELCQNDQILLLKSGCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 THTYEEIKAYQSKSREALWQQCAIQITHAIQYVVEFAKRITGFMELCQNDQILLLKSGCL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 EVVLVRMCRAFNPLNNTVLFEGKYGGMQMFKALGSDDLVNEAFDFAKNLCSLQLTEEEIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 EVVLVRMCRAFNPLNNTVLFEGKYGGMQMFKALGSDDLVNEAFDFAKNLCSLQLTEEEIA
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 LFSSAVLISPDRAWLIEPRKVQKLQEKIYFALQHVIQKNHLDDETLAKLIAKIPTITAVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 LFSSAVLISPDRAWLIEPRKVQKLQEKIYFALQHVIQKNHLDDETLAKLIAKIPTITAVC
370 380 390 400 410 420
430 440 450
pF1KE0 NLHGEKLQVFKQSHPEIVNTLFPPLYKELFNPDCATGCK
:::::::::::::::::::::::::::::::::::::::
CCDS66 NLHGEKLQVFKQSHPEIVNTLFPPLYKELFNPDCATGCK
430 440 450
>>CCDS45271.1 RORA gene_id:6095|Hs108|chr15 (468 aa)
initn: 1833 init1: 1137 opt: 1971 Z-score: 1983.2 bits: 376.3 E(32554): 3.8e-104
Smith-Waterman score: 1971; 63.9% identity (85.1% similar) in 457 aa overlap (1-453:9-459)
10 20 30 40 50
pF1KE0 MRAQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQQNNASYSCPRQRNC
:.::::.::::::::::::::::::::::::::::::::.::.::::::.::
CCDS45 MMYFVIAAMKAQIEIIPCKICGDKSSGIHYGVITCEGCKGFFRRSQQSNATYSCPRQKNC
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE0 LIDRTNRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLYAEVQKHQ-QRLQEQRQQQ
:::::.::::::::::::::.:::::::::::::::::::::::::::. :. :...:::
CCDS45 LIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQRDSLYAEVQKHRMQQQQRDHQQQ
70 80 90 100 110 120
120 130 140 150 160
pF1KE0 SGEAEALARVYSSSISNGLSNLNNETSGTYANGHVIDLPKSEGY---YNVDSGQPSPDQS
:::: :. .:. : .:::..:... :. : .::. . :... . .: :::::::
CCDS45 PGEAEPLTPTYNIS-ANGLTELHDDLSN-YIDGHTPEGSKADSAVSSFYLDI-QPSPDQS
130 140 150 160 170
170 180 190 200 210 220
pF1KE0 GLDMTGIKQIKQEPIYDLTSVPNLFTYSSFNNGQLAPGITMTEIDRIAQNIIKSHLETCQ
:::..::: ::: : : . ..: : ::.::. .: ..:.:....:::: ::::::::
CCDS45 GLDINGIK---PEPICDYTPASGFFPYCSFTNGETSPTVSMAELEHLAQNISKSHLETCQ
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE0 YTMEELHQLAWQTHTYEEIKAYQSKSREALWQQCAIQITHAIQYVVEFAKRITGFMELCQ
: :::.:..::: :::. ::.:.::..:: :::.::.:::::::::::: :::::::
CCDS45 YLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKITEAIQYVVEFAKRIDGFMELCQ
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE0 NDQILLLKSGCLEVVLVRMCRAFNPLNNTVLFEGKYGGMQMFKALGSDDLVNEAFDFAKN
::::.:::.: ::::..::::::. :::: :.:::.. ..::.:: .:... .:.:.:.
CCDS45 NDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYASPDVFKSLGCEDFISFVFEFGKS
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE0 LCSLQLTEEEIALFSSAVLISPDRAWLIEPRKVQKLQEKIYFALQHVIQKNHLDDETLAK
:::..:::.::::::. ::.: ::.:: : :..:::.:: .:::::.:::: .: :.:
CCDS45 LCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQKIQLALQHVLQKNHREDGILTK
360 370 380 390 400 410
410 420 430 440 450
pF1KE0 LIAKIPTITAVCNLHGEKLQVFKQSHPEIVNTLFPPLYKELFNPDCATGCK
:: :. :. :.:. : :::..:: .:.:: :::::::::. .
CCDS45 LICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLYKELFTSEFEPAMQIDG
420 430 440 450 460
>>CCDS10179.1 RORA gene_id:6095|Hs108|chr15 (556 aa)
initn: 1829 init1: 1137 opt: 1967 Z-score: 1978.1 bits: 375.5 E(32554): 7.4e-104
Smith-Waterman score: 1967; 63.9% identity (84.9% similar) in 457 aa overlap (1-453:97-547)
10 20 30
pF1KE0 MRAQIEVIPCKICGDKSSGIHYGVITCEGC
: ::::.:::::::::::::::::::::::
CCDS10 FVLTGVCCSWRQNGKPPYSQKEDKEVQTGYMNAQIEIIPCKICGDKSSGIHYGVITCEGC
70 80 90 100 110 120
40 50 60 70 80 90
pF1KE0 KGFFRRSQQNNASYSCPRQRNCLIDRTNRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQR
:::::::::.::.::::::.:::::::.::::::::::::::.:::::::::::::::::
CCDS10 KGFFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQR
130 140 150 160 170 180
100 110 120 130 140
pF1KE0 DSLYAEVQKHQ-QRLQEQRQQQSGEAEALARVYSSSISNGLSNLNNETSGTYANGHVIDL
::::::::::. :. :...::: :::: :. .:. : .:::..:... :. : .::. .
CCDS10 DSLYAEVQKHRMQQQQRDHQQQPGEAEPLTPTYNIS-ANGLTELHDDLSN-YIDGHTPEG
190 200 210 220 230 240
150 160 170 180 190 200
pF1KE0 PKSEGY---YNVDSGQPSPDQSGLDMTGIKQIKQEPIYDLTSVPNLFTYSSFNNGQLAPG
:... . .: ::::::::::..::: ::: : : . ..: : ::.::. .:
CCDS10 SKADSAVSSFYLDI-QPSPDQSGLDINGIK---PEPICDYTPASGFFPYCSFTNGETSPT
250 260 270 280 290 300
210 220 230 240 250 260
pF1KE0 ITMTEIDRIAQNIIKSHLETCQYTMEELHQLAWQTHTYEEIKAYQSKSREALWQQCAIQI
..:.:....:::: ::::::::: :::.:..::: :::. ::.:.::..:: :::.:
CCDS10 VSMAELEHLAQNISKSHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKI
310 320 330 340 350 360
270 280 290 300 310 320
pF1KE0 THAIQYVVEFAKRITGFMELCQNDQILLLKSGCLEVVLVRMCRAFNPLNNTVLFEGKYGG
:.:::::::::::: :::::::::::.:::.: ::::..::::::. :::: :.:::..
CCDS10 TEAIQYVVEFAKRIDGFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYAS
370 380 390 400 410 420
330 340 350 360 370 380
pF1KE0 MQMFKALGSDDLVNEAFDFAKNLCSLQLTEEEIALFSSAVLISPDRAWLIEPRKVQKLQE
..::.:: .:... .:.:.:.:::..:::.::::::. ::.: ::.:: : :..:::.
CCDS10 PDVFKSLGCEDFISFVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQ
430 440 450 460 470 480
390 400 410 420 430 440
pF1KE0 KIYFALQHVIQKNHLDDETLAKLIAKIPTITAVCNLHGEKLQVFKQSHPEIVNTLFPPLY
:: .:::::.:::: .: :.::: :. :. :.:. : :::..:: .:.:: :::::
CCDS10 KIQLALQHVLQKNHREDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLY
490 500 510 520 530 540
450
pF1KE0 KELFNPDCATGCK
::::. .
CCDS10 KELFTSEFEPAMQIDG
550
>>CCDS10178.1 RORA gene_id:6095|Hs108|chr15 (548 aa)
initn: 1826 init1: 1137 opt: 1964 Z-score: 1975.1 bits: 375.0 E(32554): 1.1e-103
Smith-Waterman score: 1964; 63.8% identity (85.1% similar) in 456 aa overlap (2-453:90-539)
10 20 30
pF1KE0 MRAQIEVIPCKICGDKSSGIHYGVITCEGCK
.::::.::::::::::::::::::::::::
CCDS10 QLEHINWDGATAKNFINLREFFSFLLPALRKAQIEIIPCKICGDKSSGIHYGVITCEGCK
60 70 80 90 100 110
40 50 60 70 80 90
pF1KE0 GFFRRSQQNNASYSCPRQRNCLIDRTNRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRD
::::::::.::.::::::.:::::::.::::::::::::::.::::::::::::::::::
CCDS10 GFFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQRD
120 130 140 150 160 170
100 110 120 130 140 150
pF1KE0 SLYAEVQKHQ-QRLQEQRQQQSGEAEALARVYSSSISNGLSNLNNETSGTYANGHVIDLP
:::::::::. :. :...::: :::: :. .:. : .:::..:... :. : .::. .
CCDS10 SLYAEVQKHRMQQQQRDHQQQPGEAEPLTPTYNIS-ANGLTELHDDLSN-YIDGHTPEGS
180 190 200 210 220 230
160 170 180 190 200
pF1KE0 KSEGY---YNVDSGQPSPDQSGLDMTGIKQIKQEPIYDLTSVPNLFTYSSFNNGQLAPGI
:... . .: ::::::::::..::: ::: : : . ..: : ::.::. .: .
CCDS10 KADSAVSSFYLDI-QPSPDQSGLDINGIKP---EPICDYTPASGFFPYCSFTNGETSPTV
240 250 260 270 280 290
210 220 230 240 250 260
pF1KE0 TMTEIDRIAQNIIKSHLETCQYTMEELHQLAWQTHTYEEIKAYQSKSREALWQQCAIQIT
.:.:....:::: ::::::::: :::.:..::: :::. ::.:.::..:: :::.::
CCDS10 SMAELEHLAQNISKSHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKIT
300 310 320 330 340 350
270 280 290 300 310 320
pF1KE0 HAIQYVVEFAKRITGFMELCQNDQILLLKSGCLEVVLVRMCRAFNPLNNTVLFEGKYGGM
.:::::::::::: :::::::::::.:::.: ::::..::::::. :::: :.:::..
CCDS10 EAIQYVVEFAKRIDGFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYASP
360 370 380 390 400 410
330 340 350 360 370 380
pF1KE0 QMFKALGSDDLVNEAFDFAKNLCSLQLTEEEIALFSSAVLISPDRAWLIEPRKVQKLQEK
..::.:: .:... .:.:.:.:::..:::.::::::. ::.: ::.:: : :..:::.:
CCDS10 DVFKSLGCEDFISFVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQK
420 430 440 450 460 470
390 400 410 420 430 440
pF1KE0 IYFALQHVIQKNHLDDETLAKLIAKIPTITAVCNLHGEKLQVFKQSHPEIVNTLFPPLYK
: .:::::.:::: .: :.::: :. :. :.:. : :::..:: .:.:: ::::::
CCDS10 IQLALQHVLQKNHREDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLYK
480 490 500 510 520 530
450
pF1KE0 ELFNPDCATGCK
:::. .
CCDS10 ELFTSEFEPAMQIDG
540
>>CCDS10177.1 RORA gene_id:6095|Hs108|chr15 (523 aa)
initn: 1819 init1: 1137 opt: 1957 Z-score: 1968.4 bits: 373.7 E(32554): 2.5e-103
Smith-Waterman score: 1957; 63.7% identity (85.1% similar) in 455 aa overlap (3-453:66-514)
10 20 30
pF1KE0 MRAQIEVIPCKICGDKSSGIHYGVITCEGCKG
.:::.:::::::::::::::::::::::::
CCDS10 ARKSEPPAPVRRQSYSSTSRGISVTKKTHTSQIEIIPCKICGDKSSGIHYGVITCEGCKG
40 50 60 70 80 90
40 50 60 70 80 90
pF1KE0 FFRRSQQNNASYSCPRQRNCLIDRTNRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDS
:::::::.::.::::::.:::::::.::::::::::::::.:::::::::::::::::::
CCDS10 FFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQRDS
100 110 120 130 140 150
100 110 120 130 140 150
pF1KE0 LYAEVQKHQ-QRLQEQRQQQSGEAEALARVYSSSISNGLSNLNNETSGTYANGHVIDLPK
::::::::. :. :...::: :::: :. .:. : .:::..:... :. : .::. . :
CCDS10 LYAEVQKHRMQQQQRDHQQQPGEAEPLTPTYNIS-ANGLTELHDDLSN-YIDGHTPEGSK
160 170 180 190 200 210
160 170 180 190 200
pF1KE0 SEGY---YNVDSGQPSPDQSGLDMTGIKQIKQEPIYDLTSVPNLFTYSSFNNGQLAPGIT
... . .: ::::::::::..::: ::: : : . ..: : ::.::. .: ..
CCDS10 ADSAVSSFYLDI-QPSPDQSGLDINGIKP---EPICDYTPASGFFPYCSFTNGETSPTVS
220 230 240 250 260
210 220 230 240 250 260
pF1KE0 MTEIDRIAQNIIKSHLETCQYTMEELHQLAWQTHTYEEIKAYQSKSREALWQQCAIQITH
:.:....:::: ::::::::: :::.:..::: :::. ::.:.::..:: :::.::.
CCDS10 MAELEHLAQNISKSHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKITE
270 280 290 300 310 320
270 280 290 300 310 320
pF1KE0 AIQYVVEFAKRITGFMELCQNDQILLLKSGCLEVVLVRMCRAFNPLNNTVLFEGKYGGMQ
:::::::::::: :::::::::::.:::.: ::::..::::::. :::: :.:::.. .
CCDS10 AIQYVVEFAKRIDGFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYASPD
330 340 350 360 370 380
330 340 350 360 370 380
pF1KE0 MFKALGSDDLVNEAFDFAKNLCSLQLTEEEIALFSSAVLISPDRAWLIEPRKVQKLQEKI
.::.:: .:... .:.:.:.:::..:::.::::::. ::.: ::.:: : :..:::.::
CCDS10 VFKSLGCEDFISFVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQKI
390 400 410 420 430 440
390 400 410 420 430 440
pF1KE0 YFALQHVIQKNHLDDETLAKLIAKIPTITAVCNLHGEKLQVFKQSHPEIVNTLFPPLYKE
.:::::.:::: .: :.::: :. :. :.:. : :::..:: .:.:: :::::::
CCDS10 QLALQHVLQKNHREDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLYKE
450 460 470 480 490 500
450
pF1KE0 LFNPDCATGCK
::. .
CCDS10 LFTSEFEPAMQIDG
510 520
>>CCDS30856.1 RORC gene_id:6097|Hs108|chr1 (497 aa)
initn: 1484 init1: 692 opt: 877 Z-score: 886.0 bits: 173.3 E(32554): 5e-43
Smith-Waterman score: 1458; 49.1% identity (72.2% similar) in 489 aa overlap (6-453:6-488)
10 20 30 40 50 60
pF1KE0 MRAQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQQNNASYSCPRQRNCLIDRTNRN
:::::::::::::::::::::::::::::::::. ::.::: ::.:: ::::.::
CCDS30 MRTQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQRCNAAYSCTRQQNCPIDRTSRN
10 20 30 40 50 60
70 80 90 100 110
pF1KE0 RCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLYAEVQKHQQRLQEQRQQQ------SGE
:::::::::::::::::::::::::::::::::.:::::. :. :.:.:. .:
CCDS30 RCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLHAEVQKQLQQRQQQQQEPVVKTPPAGA
70 80 90 100 110 120
120 130 140
pF1KE0 AEALARVYSSSISNGLSNLNN---------------ETSGT---YANG-----------H
: . .:. .. .: :.. ..::. :.:. :
CCDS30 QGADTLTYTLGLPDGQLPLGSSPDLPEASACPPGLLKASGSGPSYSNNLAKAGLNGASCH
130 140 150 160 170 180
150 160 170 180 190
pF1KE0 VIDLP---KSEG---YYNVDSGQPSPDQSGLDMTGIKQIKQEPIYDLTSVPNLFTYSSFN
. : :.:: .:.. : : .::. :: . .. .. . .: . :. . ::
CCDS30 LEYSPERGKAEGRESFYSTGS-QLTPDRCGLRF---EEHRHPGLGELGQGPDSYGSPSFR
190 200 210 220 230
200 210 220 230 240 250
pF1KE0 NGQLAPGITMTEIDRIAQNIIKSHLETCQYTMEELHQLAWQTHTYEEIKAYQSKSREALW
. :: ..:::....:.. ::. :::: .:.: . . . ::. .:: :: .:
CCDS30 STPEAPYASLTEIEHLVQSVCKSYRETCQLRLEDLLRQRSNIFSREEVTGYQRKSMWEMW
240 250 260 270 280 290
260 270 280 290 300 310
pF1KE0 QQCAIQITHAIQYVVEFAKRITGFMELCQNDQILLLKSGCLEVVLVRMCRAFNPLNNTVL
..:: ..:.:::::::::::..:::::::::::.:::.: .::::::::::.: : ::.
CCDS30 ERCAHHLTEAIQYVVEFAKRLSGFMELCQNDQIVLLKAGAMEVVLVRMCRAYNADNRTVF
300 310 320 330 340 350
320 330 340 350 360 370
pF1KE0 FEGKYGGMQMFKALGSDDLVNEAFDFAKNLCSLQLTEEEIALFSSAVLISPDRAWLIEPR
::::::::..:.::: ..:.. :::...: .:...:.::::... :::. : : : :
CCDS30 FEGKYGGMELFRALGCSELISSIFDFSHSLSALHFSEDEIALYTALVLINAHRPGLQEKR
360 370 380 390 400 410
380 390 400 410 420 430
pF1KE0 KVQKLQEKIYFALQHVIQKNHLDDETLAKLIAKIPTITAVCNLHGEKLQVFKQSHPEIVN
::..:: .. .:..: . :.: . :::: : . ..:. : :.::.:.. :: .:.
CCDS30 KVEQLQYNLELAFHHHLCKTH-RQSILAKLPPK-GKLRSLCSQHVERLQIFQHLHPIVVQ
420 430 440 450 460 470
440 450
pF1KE0 TLFPPLYKELFNPDCATGCK
. :::::::::. .
CCDS30 AAFPPLYKELFSTETESPVGLSK
480 490
>>CCDS1004.1 RORC gene_id:6097|Hs108|chr1 (518 aa)
initn: 1471 init1: 692 opt: 877 Z-score: 885.7 bits: 173.3 E(32554): 5.1e-43
Smith-Waterman score: 1458; 49.1% identity (72.2% similar) in 489 aa overlap (6-453:27-509)
10 20 30
pF1KE0 MRAQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQQ
:::::::::::::::::::::::::::::::::.
CCDS10 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQR
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE0 NNASYSCPRQRNCLIDRTNRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLYAEVQK
::.::: ::.:: ::::.:::::::::::::::::::::::::::::::::::.:::::
CCDS10 CNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLHAEVQK
70 80 90 100 110 120
100 110 120 130
pF1KE0 HQQRLQEQRQQQ------SGEAEALARVYSSSISNGLSNLNN---------------ETS
. :. :.:.:. .: : . .:. .. .: :.. ..:
CCDS10 QLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLPDGQLPLGSSPDLPEASACPPGLLKAS
130 140 150 160 170 180
140 150 160 170
pF1KE0 GT---YANG-----------HVIDLP---KSEG---YYNVDSGQPSPDQSGLDMTGIKQI
:. :.:. :. : :.:: .:.. : : .::. :: . ..
CCDS10 GSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGRESFYSTGS-QLTPDRCGLRF---EEH
190 200 210 220 230
180 190 200 210 220 230
pF1KE0 KQEPIYDLTSVPNLFTYSSFNNGQLAPGITMTEIDRIAQNIIKSHLETCQYTMEELHQLA
.. . .: . :. . :: . :: ..:::....:.. ::. :::: .:.: .
CCDS10 RHPGLGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLVQSVCKSYRETCQLRLEDLLRQR
240 250 260 270 280 290
240 250 260 270 280 290
pF1KE0 WQTHTYEEIKAYQSKSREALWQQCAIQITHAIQYVVEFAKRITGFMELCQNDQILLLKSG
. . ::. .:: :: .:..:: ..:.:::::::::::..:::::::::::.:::.:
CCDS10 SNIFSREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEFAKRLSGFMELCQNDQIVLLKAG
300 310 320 330 340 350
300 310 320 330 340 350
pF1KE0 CLEVVLVRMCRAFNPLNNTVLFEGKYGGMQMFKALGSDDLVNEAFDFAKNLCSLQLTEEE
.::::::::::.: : ::.::::::::..:.::: ..:.. :::...: .:...:.:
CCDS10 AMEVVLVRMCRAYNADNRTVFFEGKYGGMELFRALGCSELISSIFDFSHSLSALHFSEDE
360 370 380 390 400 410
360 370 380 390 400 410
pF1KE0 IALFSSAVLISPDRAWLIEPRKVQKLQEKIYFALQHVIQKNHLDDETLAKLIAKIPTITA
:::... :::. : : : :::..:: .. .:..: . :.: . :::: : . .
CCDS10 IALYTALVLINAHRPGLQEKRKVEQLQYNLELAFHHHLCKTH-RQSILAKLPPK-GKLRS
420 430 440 450 460 470
420 430 440 450
pF1KE0 VCNLHGEKLQVFKQSHPEIVNTLFPPLYKELFNPDCATGCK
.:. : :.::.:.. :: .:.. :::::::::. .
CCDS10 LCSQHVERLQIFQHLHPIVVQAAFPPLYKELFSTETESPVGLSK
480 490 500 510
>>CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 (614 aa)
initn: 802 init1: 252 opt: 432 Z-score: 438.4 bits: 90.8 E(32554): 4.2e-18
Smith-Waterman score: 754; 32.7% identity (60.6% similar) in 492 aa overlap (7-431:129-610)
10 20 30
pF1KE0 MRAQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRR
:. ::.::: .::.:::: .::::::::::
CCDS11 PPGSLQVAMEDSSRVSPSKSTSNITKLNGMVLLCKVCGDVASGFHYGVHACEGCKGFFRR
100 110 120 130 140 150
40 50 60 70 80 90
pF1KE0 SQQNNASYS-CPRQRNCLIDRTNRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLYA
: :.: .:. : ...:: : : ::::::.::..:::..:::::::.:::. :.... . :
CCDS11 SIQQNIQYKRCLKNENCSIVRINRNRCQQCRFKKCLSVGMSRDAVRFGRIPKREKQRMLA
160 170 180 190 200 210
100 110 120 130
pF1KE0 EVQKHQQRLQEQRQQQS---------------GEAEALARVYSSSISNGLSNLNNETS--
:.:. .. ..: ..: : . : : : . :.:.. .. .
CCDS11 EMQSAMNLANNQLSSQCPLETSPTQHPTPGPMGPSPPPAPVPSPLV--GFSQFPQQLTPP
220 230 240 250 260 270
140 150 160
pF1KE0 -------------GTYANGH------VID-LPKSEGYYNVD--SGQPS------------
. : .: . : : .: : .:.. ::.:
CCDS11 RSPSPEPTVEDVISQVARAHREIFTYAHDKLGSSPGNFNANHASGSPPATTPHRWENQGC
280 290 300 310 320 330
170 180 190 200 210
pF1KE0 PDQSGLDMTGIKQIKQEPIYDLTSVPNLFT------------YSSFNNGQ-LAPGITMTE
: . . : : ..: . : ..:. . ..: .::. : : :.
CCDS11 PPAPNDNNTLAAQRHNEALNGLRQAPSSYPPTWPPGPAHHSCHQSNSNGHRLCP----TH
340 350 360 370 380 390
220 230 240 250 260 270
pF1KE0 IDRIAQNIIKSHLETCQYTMEELHQLAWQTHTYEEIKAYQSKSREALWQQCAIQITHAIQ
. .. :. .. . . :: . : . .. ... . .:.. ....: :..
CCDS11 VYAAPEG--KAPANSPRQGNSKNVLLACPMNMYPHGRS--GRTVQEIWEDFSMSFTPAVR
400 410 420 430 440
280 290 300 310 320 330
pF1KE0 YVVEFAKRITGFMELCQNDQILLLKSGCLEVVLVRMCRAFNPLNNTVLFEGKYG-GMQMF
::::::.: :: .: :.::. :::.: .::..::. :: ..::.: .. ..: .
CCDS11 EVVEFAKHIPGFRDLSQHDQVTLLKAGTFEVLMVRFASLFNVKDQTVMFLSRTTYSLQEL
450 460 470 480 490 500
340 350 360 370 380 390
pF1KE0 KALGSDDLVNEAFDFAKNLCSLQLTEEEIALFSSAVLISPDRAWLIEPRKVQKLQEKIYF
:.: ::.. :::...: :: :::::..::...::.: ::. . . .:..::: .
CCDS11 GAMGMGDLLSAMFDFSEKLNSLALTEEELGLFTAVVLVSADRSGMENSASVEQLQETLLR
510 520 530 540 550 560
400 410 420 430 440
pF1KE0 ALQHVIQKNH-LDDETLAKLIAKIPTITAVCNLHGEKLQVFKQSHPEIVNTLFPPLYKEL
::. .. ::. :. ..::. :.: . .. :.:.::: :.
CCDS11 ALRALVLKNRPLETSRFTKLLLKLPDLRTLNNMHSEKLLSFRVDAQ
570 580 590 600 610
450
pF1KE0 FNPDCATGCK
>>CCDS33718.1 NR1D2 gene_id:9975|Hs108|chr3 (579 aa)
initn: 446 init1: 258 opt: 426 Z-score: 432.8 bits: 89.7 E(32554): 8.7e-18
Smith-Waterman score: 791; 33.7% identity (62.1% similar) in 483 aa overlap (7-435:100-579)
10 20 30
pF1KE0 MRAQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRR
:. ::.::: .::.:::: .::::::::::
CCDS33 DRIDCSMKTSKSSAPGMTKSHSGVTKFSGMVLLCKVCGDVASGFHYGVHACEGCKGFFRR
70 80 90 100 110 120
40 50 60 70 80 90
pF1KE0 SQQNNASYS-CPRQRNCLIDRTNRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLYA
: :.: .:. : ...:: : : ::::::.::..:::..:::::::.:::. :.... .
CCDS33 SIQQNIQYKKCLKNENCSIMRMNRNRCQQCRFKKCLSVGMSRDAVRFGRIPKREKQRMLI
130 140 150 160 170 180
100 110 120 130 140
pF1KE0 EVQK------------HQQR--LQEQRQQQSGEAEALARVYSSSISNGLSNLNNETSGTY
:.:. : : : :...: . :. : . ...... .. :. .
CCDS33 EMQSAMKTMMNSQFSGHLQNDTLVEHHEQTALPAQEQLRPKPQLEQENIKS-SSPPSSDF
190 200 210 220 230 240
150 160 170 180 190
pF1KE0 ANGHVIDL----PKSEGYYNVDSGQPSPDQSGLDMTGIKQIKQEPIYDLT------SVPN
:. .:: . :. .:: .. : . .: . : . :. :.:. .. .
CCDS33 AKEEVIGMVTRAHKDTFMYNQEQ-QENSAESMQPQRGERIPKNMEQYNLNHDHCGNGLSS
250 260 270 280 290 300
200 210 220 230 240
pF1KE0 LFTYSSFN---NGQLAPGITMTEIDRIAQNIIKSHLE--TCQYTMEELHQLAWQTHTYEE
: : . :::. : . : : ..: . ::.. .. . . .:
CCDS33 HFPCSESQQHLNGQFKGRNIMHYPNGHAICIANGHCMNFSNAYTQRVCDRVPIDGFSQNE
310 320 330 340 350 360
250 260 270 280
pF1KE0 IK-AY---------------------QSKSREALWQQCAIQITHAIQYVVEFAKRITGFM
: .: :: . .:.. ....: :.. :::::::: ::
CCDS33 NKNSYLCNTGGRMHLVCPMSKSPYVDPHKSGHEIWEEFSMSFTPAVKEVVEFAKRIPGFR
370 380 390 400 410 420
290 300 310 320 330 340
pF1KE0 ELCQNDQILLLKSGCLEVVLVRMCRAFNPLNNTVLF-EGKYGGMQMFKALGSDDLVNEAF
.: :.::. :::.: .::..::. :. . :: : :: ... ....:. ::.: :
CCDS33 DLSQHDQVNLLKAGTFEVLMVRFASLFDAKERTVTFLSGKKYSVDDLHSMGAGDLLNSMF
430 440 450 460 470 480
350 360 370 380 390 400
pF1KE0 DFAKNLCSLQLTEEEIALFSSAVLISPDRAWLIEPRKVQKLQEKIYFALQHVIQKNHLDD
.:...: .:::..::..::...::.: ::. . . .:. ::: . ::. .:.::: ..
CCDS33 EFSEKLNALQLSDEEMSLFTAVVLVSADRSGIENVNSVEALQETLIRALRTLIMKNHPNE
490 500 510 520 530 540
410 420 430 440 450
pF1KE0 ETL-AKLIAKIPTITAVCNLHGEKLQVFKQSHPEIVNTLFPPLYKELFNPDCATGCK
.. .::. :.: . .. :.:.:.: .:: ::
CCDS33 ASIFTKLLLKLPDLRSLNNMHSEELLAFK-VHP
550 560 570
>>CCDS60383.1 NR5A2 gene_id:2494|Hs108|chr1 (469 aa)
initn: 457 init1: 364 opt: 415 Z-score: 423.2 bits: 87.6 E(32554): 3e-17
Smith-Waterman score: 493; 27.4% identity (59.8% similar) in 460 aa overlap (10-437:14-454)
10 20 30 40 50
pF1KE0 MRAQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQQNNASYSCPRQRNCLIDR
: .:::: :: :::..:::.:::::.:. ::: :.: ...:: ::.
CCDS60 MVNYSYDEDLEELCPVCGDKVSGYHYGLLTCESCKGFFKRTVQNNKRYTCIENQNCQIDK
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE0 TNRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLYAEVQKHQQRLQEQRQ---QQSG
:.:.:: .::.::::..::. .::. :: . :.. .. . :... :..:.. . .:
CCDS60 TQRKRCPYCRFQKCLSVGMKLEAVRADRM-RGGRNK-FGPMYKRDRALKQQKKALIRANG
70 80 90 100 110
120 130 140 150 160
pF1KE0 -EAEALARVYSS-----SISNGLSNLNNETSGTYANGHVI---DLPKSEGYYNVDSGQPS
. ::...: .. .::....:... ..: : .. : .: . :
CCDS60 LKLEAMSQVIQAMPSDLTISSAIQNIHSASKGLPLNHAALPPTDYDRSPFVTSPISMTMP
120 130 140 150 160 170
170 180 190 200 210
pF1KE0 PDQS--GLDMTG---IKQIKQEPIYDLTSVP-NLFTYSSFNNGQLAPGITMTEIDRIAQN
: : : . : . ::.: :: : ... :: ... : . . . : .. .
CCDS60 PHGSLQGYQTYGHFPSRAIKSEYPDPYTSSPESIMGYSYMDSYQTS---SPASIPHLILE
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE0 IIKSHLETCQYTMEELHQLAWQTHTYEEIKAYQSKSREALWQQCAIQITHAIQYVVEFAK
..: . . : . . .:. . . . ... : .: . : : .: ::.:.
CCDS60 LLKCEPDEPQV---QAKIMAYLQQEQANRSKHEKLSTFGLMCKMADQTLFSI---VEWAR
240 250 260 270 280
280 290 300 310 320 330
pF1KE0 RITGFMELCQNDQILLLKSGCLEVVLVRMCRAFNPLNNTVLFEGKYG------GMQM-FK
: :: .::. ::.. : .:. .. . :. .:: : :.:. ..
CCDS60 SSIFFRELKVDDQMKLLQN-CWSELLI-----LDHIYRQVV-HGKEGSIFLVTGQQVDYS
290 300 310 320 330 340
340 350 360 370 380
pF1KE0 ALGS------DDLVNEAFDFAKNLCSLQLTEEEIALFSSAVLISPDRAWLIEPRKVQKLQ
..: ..:...: ... .: :::. ..:.. .. ::.: : : . . :. .:
CCDS60 IIASQAGATLNNLMSHAQELVAKLRSLQFDQREFVCLKFLVLFSLDVKNLENFQLVEGVQ
350 360 370 380 390 400
390 400 410 420 430 440
pF1KE0 EKIYFALQHVIQKNH-LDDETLAKLIAKIPTITAVCNLHGEKLQVFKQSHPEIVNTLFPP
:.. :: . :. . : ...:. ..: : :. ....:. .:. . ..
CCDS60 EQVNAALLDYTMCNYPQQTEKFGQLLLRLPEIRAI-SMQAEEYLYYKHLNGDVPYNNLLI
410 420 430 440 450 460
450
pF1KE0 LYKELFNPDCATGCK
CCDS60 EMLHAKRA
459 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 17:36:05 2016 done: Tue Nov 8 17:36:05 2016
Total Scan time: 2.130 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]