FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE1384, 598 aa
1>>>pF1KE1384 598 - 598 aa - 598 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.9819+/-0.000912; mu= -0.4462+/- 0.055
mean_var=305.8623+/-61.960, 0's: 0 Z-trim(115.8): 116 B-trim: 0 in 0/55
Lambda= 0.073335
statistics sampled from 16215 (16331) to 16215 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.803), E-opt: 0.2 (0.502), width: 16
Scan time: 4.110
The best scores are: opt bits E(32554)
CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 ( 598) 4124 449.9 4.3e-126
CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 ( 611) 4124 449.9 4.4e-126
CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12 ( 652) 4124 449.9 4.6e-126
CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 ( 598) 1922 216.9 5.8e-56
CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 ( 626) 1544 176.9 6.6e-44
CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 ( 637) 1544 177.0 6.7e-44
CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 ( 443) 727 90.4 5.4e-18
CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 725 90.2 6.3e-18
CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 720 89.6 8.1e-18
CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 720 89.6 9e-18
CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 693 86.8 6.6e-17
CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 ( 533) 691 86.6 8.6e-17
CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 678 85.2 2e-16
CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 677 85.1 2.2e-16
CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 ( 537) 677 85.2 2.4e-16
CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 674 84.8 2.7e-16
CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 ( 423) 644 81.6 2.3e-15
CCDS1517.1 ESRRG gene_id:2104|Hs108|chr1 ( 435) 635 80.6 4.5e-15
CCDS41468.1 ESRRG gene_id:2104|Hs108|chr1 ( 458) 635 80.7 4.7e-15
CCDS9850.2 ESRRB gene_id:2103|Hs108|chr14 ( 508) 635 80.7 5.1e-15
CCDS58237.1 RARG gene_id:5916|Hs108|chr12 ( 432) 628 79.9 7.5e-15
CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 ( 414) 595 76.4 8.2e-14
CCDS58061.1 ESRRG gene_id:2104|Hs108|chr1 ( 470) 550 71.7 2.4e-12
CCDS46775.1 RARB gene_id:5915|Hs108|chr3 ( 336) 521 68.5 1.6e-11
CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 ( 463) 524 68.9 1.6e-11
CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 ( 340) 509 67.2 3.9e-11
>>CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 (598 aa)
initn: 4124 init1: 4124 opt: 4124 Z-score: 2377.2 bits: 449.9 E(32554): 4.3e-126
Smith-Waterman score: 4124; 100.0% identity (100.0% similar) in 598 aa overlap (1-598:1-598)
10 20 30 40 50 60
pF1KE1 MPCIQAQYGTPAPSPGPRDHLASDPLTPEFIKPTMDLASPEAAPAAPTALPSFSTFMDGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 MPCIQAQYGTPAPSPGPRDHLASDPLTPEFIKPTMDLASPEAAPAAPTALPSFSTFMDGY
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 TGEFDTFLYQLPGTVQPCSSASSSASSTSSSSATSPASASFKFEDFQVYGCYPGPLSGPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 TGEFDTFLYQLPGTVQPCSSASSSASSTSSSSATSPASASFKFEDFQVYGCYPGPLSGPV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 DEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSPWDGSFGHFSPSQTYEGLRAWTEQLPKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 DEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSPWDGSFGHFSPSQTYEGLRAWTEQLPKA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 SGPPQPPAFFSFSPPTGPSPSLAQSPLKLFPSQATHQLGEGESYSMPTAFPGLAPTSPHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 SGPPQPPAFFSFSPPTGPSPSLAQSPLKLFPSQATHQLGEGESYSMPTAFPGLAPTSPHL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE1 EGSGILDTPVTSTKARSGAPGGSEGRCAVCGDNASCQHYGVRTCEGCKGFFKRTVQKNAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 EGSGILDTPVTSTKARSGAPGGSEGRCAVCGDNASCQHYGVRTCEGCKGFFKRTVQKNAK
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE1 YICLANKDCPVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQPPDAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 YICLANKDCPVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQPPDAS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE1 PANLLTSLVRAHLDSGPSTAKLDYSKFQELVLPHFGKEDAGDVQQFYDLLSGSLEVIRKW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 PANLLTSLVRAHLDSGPSTAKLDYSKFQELVLPHFGKEDAGDVQQFYDLLSGSLEVIRKW
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE1 AEKIPGFAELSPADQDLLLESAFLELFILRLAYRSKPGEGKLIFCSGLVLHRLQCARGFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 AEKIPGFAELSPADQDLLLESAFLELFILRLAYRSKPGEGKLIFCSGLVLHRLQCARGFG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE1 DWIDSILAFSRSLHSLLVDVPAFACLSALVLITDRHGLQEPRRVEELQNRIASCLKEHVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 DWIDSILAFSRSLHSLLVDVPAFACLSALVLITDRHGLQEPRRVEELQNRIASCLKEHVA
490 500 510 520 530 540
550 560 570 580 590
pF1KE1 AVAGEPQPASCLSRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPIIDKIFMDTLPF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 AVAGEPQPASCLSRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPIIDKIFMDTLPF
550 560 570 580 590
>>CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 (611 aa)
initn: 4124 init1: 4124 opt: 4124 Z-score: 2377.1 bits: 449.9 E(32554): 4.4e-126
Smith-Waterman score: 4124; 100.0% identity (100.0% similar) in 598 aa overlap (1-598:14-611)
10 20 30 40
pF1KE1 MPCIQAQYGTPAPSPGPRDHLASDPLTPEFIKPTMDLASPEAAPAAP
:::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MWLAKACWSIQSEMPCIQAQYGTPAPSPGPRDHLASDPLTPEFIKPTMDLASPEAAPAAP
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE1 TALPSFSTFMDGYTGEFDTFLYQLPGTVQPCSSASSSASSTSSSSATSPASASFKFEDFQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 TALPSFSTFMDGYTGEFDTFLYQLPGTVQPCSSASSSASSTSSSSATSPASASFKFEDFQ
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE1 VYGCYPGPLSGPVDEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSPWDGSFGHFSPSQTY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VYGCYPGPLSGPVDEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSPWDGSFGHFSPSQTY
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE1 EGLRAWTEQLPKASGPPQPPAFFSFSPPTGPSPSLAQSPLKLFPSQATHQLGEGESYSMP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 EGLRAWTEQLPKASGPPQPPAFFSFSPPTGPSPSLAQSPLKLFPSQATHQLGEGESYSMP
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE1 TAFPGLAPTSPHLEGSGILDTPVTSTKARSGAPGGSEGRCAVCGDNASCQHYGVRTCEGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 TAFPGLAPTSPHLEGSGILDTPVTSTKARSGAPGGSEGRCAVCGDNASCQHYGVRTCEGC
250 260 270 280 290 300
290 300 310 320 330 340
pF1KE1 KGFFKRTVQKNAKYICLANKDCPVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 KGFFKRTVQKNAKYICLANKDCPVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRG
310 320 330 340 350 360
350 360 370 380 390 400
pF1KE1 RLPSKPKQPPDASPANLLTSLVRAHLDSGPSTAKLDYSKFQELVLPHFGKEDAGDVQQFY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 RLPSKPKQPPDASPANLLTSLVRAHLDSGPSTAKLDYSKFQELVLPHFGKEDAGDVQQFY
370 380 390 400 410 420
410 420 430 440 450 460
pF1KE1 DLLSGSLEVIRKWAEKIPGFAELSPADQDLLLESAFLELFILRLAYRSKPGEGKLIFCSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 DLLSGSLEVIRKWAEKIPGFAELSPADQDLLLESAFLELFILRLAYRSKPGEGKLIFCSG
430 440 450 460 470 480
470 480 490 500 510 520
pF1KE1 LVLHRLQCARGFGDWIDSILAFSRSLHSLLVDVPAFACLSALVLITDRHGLQEPRRVEEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LVLHRLQCARGFGDWIDSILAFSRSLHSLLVDVPAFACLSALVLITDRHGLQEPRRVEEL
490 500 510 520 530 540
530 540 550 560 570 580
pF1KE1 QNRIASCLKEHVAAVAGEPQPASCLSRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 QNRIASCLKEHVAAVAGEPQPASCLSRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPI
550 560 570 580 590 600
590
pF1KE1 IDKIFMDTLPF
:::::::::::
CCDS55 IDKIFMDTLPF
610
>>CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12 (652 aa)
initn: 4124 init1: 4124 opt: 4124 Z-score: 2376.7 bits: 449.9 E(32554): 4.6e-126
Smith-Waterman score: 4124; 100.0% identity (100.0% similar) in 598 aa overlap (1-598:55-652)
10 20 30
pF1KE1 MPCIQAQYGTPAPSPGPRDHLASDPLTPEF
::::::::::::::::::::::::::::::
CCDS73 PPRQPGSFCWALKADGIMWLAKACWSIQSEMPCIQAQYGTPAPSPGPRDHLASDPLTPEF
30 40 50 60 70 80
40 50 60 70 80 90
pF1KE1 IKPTMDLASPEAAPAAPTALPSFSTFMDGYTGEFDTFLYQLPGTVQPCSSASSSASSTSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 IKPTMDLASPEAAPAAPTALPSFSTFMDGYTGEFDTFLYQLPGTVQPCSSASSSASSTSS
90 100 110 120 130 140
100 110 120 130 140 150
pF1KE1 SSATSPASASFKFEDFQVYGCYPGPLSGPVDEALSSSGSDYYGSPCSAPSPSTPSFQPPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 SSATSPASASFKFEDFQVYGCYPGPLSGPVDEALSSSGSDYYGSPCSAPSPSTPSFQPPQ
150 160 170 180 190 200
160 170 180 190 200 210
pF1KE1 LSPWDGSFGHFSPSQTYEGLRAWTEQLPKASGPPQPPAFFSFSPPTGPSPSLAQSPLKLF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 LSPWDGSFGHFSPSQTYEGLRAWTEQLPKASGPPQPPAFFSFSPPTGPSPSLAQSPLKLF
210 220 230 240 250 260
220 230 240 250 260 270
pF1KE1 PSQATHQLGEGESYSMPTAFPGLAPTSPHLEGSGILDTPVTSTKARSGAPGGSEGRCAVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 PSQATHQLGEGESYSMPTAFPGLAPTSPHLEGSGILDTPVTSTKARSGAPGGSEGRCAVC
270 280 290 300 310 320
280 290 300 310 320 330
pF1KE1 GDNASCQHYGVRTCEGCKGFFKRTVQKNAKYICLANKDCPVDKRRRNRCQFCRFQKCLAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 GDNASCQHYGVRTCEGCKGFFKRTVQKNAKYICLANKDCPVDKRRRNRCQFCRFQKCLAV
330 340 350 360 370 380
340 350 360 370 380 390
pF1KE1 GMVKEVVRTDSLKGRRGRLPSKPKQPPDASPANLLTSLVRAHLDSGPSTAKLDYSKFQEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 GMVKEVVRTDSLKGRRGRLPSKPKQPPDASPANLLTSLVRAHLDSGPSTAKLDYSKFQEL
390 400 410 420 430 440
400 410 420 430 440 450
pF1KE1 VLPHFGKEDAGDVQQFYDLLSGSLEVIRKWAEKIPGFAELSPADQDLLLESAFLELFILR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 VLPHFGKEDAGDVQQFYDLLSGSLEVIRKWAEKIPGFAELSPADQDLLLESAFLELFILR
450 460 470 480 490 500
460 470 480 490 500 510
pF1KE1 LAYRSKPGEGKLIFCSGLVLHRLQCARGFGDWIDSILAFSRSLHSLLVDVPAFACLSALV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 LAYRSKPGEGKLIFCSGLVLHRLQCARGFGDWIDSILAFSRSLHSLLVDVPAFACLSALV
510 520 530 540 550 560
520 530 540 550 560 570
pF1KE1 LITDRHGLQEPRRVEELQNRIASCLKEHVAAVAGEPQPASCLSRLLGKLPELRTLCTQGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 LITDRHGLQEPRRVEELQNRIASCLKEHVAAVAGEPQPASCLSRLLGKLPELRTLCTQGL
570 580 590 600 610 620
580 590
pF1KE1 QRIFYLKLEDLVPPPPIIDKIFMDTLPF
::::::::::::::::::::::::::::
CCDS73 QRIFYLKLEDLVPPPPIIDKIFMDTLPF
630 640 650
>>CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 (598 aa)
initn: 1349 init1: 1124 opt: 1922 Z-score: 1118.1 bits: 216.9 E(32554): 5.8e-56
Smith-Waterman score: 2117; 55.2% identity (75.2% similar) in 632 aa overlap (1-598:1-598)
10 20 30 40 50
pF1KE1 MPCIQAQYGT-P-APSPGPRDH-------LASDPLTPEFIKPTMDLASPEAAPAAPTALP
:::.:::::. : . ::. ... .:: :::::.: .:::.. : . : :.::
CCDS22 MPCVQAQYGSSPQGASPASQSYSYHSSGEYSSDFLTPEFVKFSMDLTNTEIT--ATTSLP
10 20 30 40 50
60 70 80 90 100
pF1KE1 SFSTFMDGYTGEFDT---FLYQLPGTVQPCSSASSSASSTSSSSATSPASASFKFEDFQV
:::::::.:. .:. :::.: . : ..:.: ::.:.
CCDS22 SFSTFMDNYSTGYDVKPPCLYQMPLSGQ---------------------QSSIKVEDIQM
60 70 80 90
110 120 130 140 150 160
pF1KE1 YGCYPGPLSGP-VDEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSP-WD--GSFGHFSPS
.. : .: . ::: :: .: : :.:.::.:: : :: :: ::. .:
CCDS22 HNYQQHSHLPPQSEEMMPHSGSVYY-KPSSPPTPTTPGFQV-QHSPMWDDPGSLHNFH--
100 110 120 130 140 150
170 180 190 200 210
pF1KE1 QTYEGLRAWTEQLPKASGPPQPPAFFSF--SPPTGPSPSLAQ---SPLK--LFPSQA-TH
:.: : :... . . : . ..::: ::: : : . .::. . : : .:
CCDS22 QNYV---ATTHMIEQRKTPVSRLSLFSFKQSPPGTPVSSCQMRFDGPLHVPMNPEPAGSH
160 170 180 190 200 210
220 230 240 250 260 270
pF1KE1 QLGEGESYSMPTAFPGLAPTS---PHLE---GSGILDTPVTSTKARSGAPGGSEGRCAVC
.. .:.....:. : :.: : :. .: .::: : : .: :.:. .:: ::::
CCDS22 HVVDGQTFAVPN--PIRKPASMGFPGLQIGHASQLLDTQVPSPPSR-GSPS-NEGLCAVC
220 230 240 250 260
280 290 300 310 320 330
pF1KE1 GDNASCQHYGVRTCEGCKGFFKRTVQKNAKYICLANKDCPVDKRRRNRCQFCRFQKCLAV
::::.::::::::::::::::::::::::::.:::::.::::::::::::.:::::::::
CCDS22 GDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQKCLAV
270 280 290 300 310 320
340 350 360 370 380
pF1KE1 GMVKEVVRTDSLKGRRGRLPSKPKQP----PDASPANLLTSLVRAHLDSGPSTAKLDYSK
::::::::::::::::::::::::.: : . :..:...:::::.::.:. ..::::.
CCDS22 GMVKEVVRTDSLKGRRGRLPSKPKSPQEPSPPSPPVSLISALVRAHVDSNPAMTSLDYSR
330 340 350 360 370 380
390 400 410 420 430 440
pF1KE1 FQELVLPHFGKEDAGDVQQFYDLLSGSLEVIRKWAEKIPGFAELSPADQDLLLESAFLEL
:: ... .:. .:::::::.::.:.:: :::::::::.: ::::::.:::::::
CCDS22 FQANPDYQMSGDDTQHIQQFYDLLTGSMEIIRGWAEKIPGFADLPKADQDLLFESAFLEL
390 400 410 420 430 440
450 460 470 480 490 500
pF1KE1 FILRLAYRSKPGEGKLIFCSGLVLHRLQCARGFGDWIDSILAFSRSLHSLLVDVPAFACL
:.:::::::.: :::::::.:.:::::::.::::.:::::. :: .:... .:. ::.:.
CCDS22 FVLRLAYRSNPVEGKLIFCNGVVLHRLQCVRGFGEWIDSIVEFSSNLQNMNIDISAFSCI
450 460 470 480 490 500
510 520 530 540 550 560
pF1KE1 SALVLITDRHGLQEPRRVEELQNRIASCLKEHVAAVAGEPQPASCLSRLLGKLPELRTLC
.::...:.::::.::.:::::::.:..:::.::. : . . ::.::::::::::::
CCDS22 AALAMVTERHGLKEPKRVEELQNKIVNCLKDHVTFNNGGLNRPNYLSKLLGKLPELRTLC
510 520 530 540 550 560
570 580 590
pF1KE1 TQGLQRIFYLKLEDLVPPPPIIDKIFMDTLPF
::::::::::::::::::: ::::.:.:::::
CCDS22 TQGLQRIFYLKLEDLVPPPAIIDKLFLDTLPF
570 580 590
>>CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 (626 aa)
initn: 1692 init1: 655 opt: 1544 Z-score: 901.7 bits: 176.9 E(32554): 6.6e-44
Smith-Waterman score: 1798; 48.9% identity (68.1% similar) in 648 aa overlap (1-598:1-626)
10 20 30 40 50
pF1KE1 MPCIQAQYGTPAPSPGPR-------DHLASDPLTPEFIKPTMDLASPEAAPAAPTALPSF
:::.:::: .:.: :: .. ... ..:.. : ::::.: : . .: :.:::.
CCDS67 MPCVQAQY-SPSP-PGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEITATATTSLPSI
10 20 30 40 50
60 70 80 90 100 110
pF1KE1 STFMDGYTGEFD---TFLYQLPGTVQPCSSASSSASSTSSSSATSPASASFKFEDFQVYG
:::..::..... . .::. .: .. . . . . .. .
CCDS67 STFVEGYSSNYELKPSCVYQMQ---RPLIKVEEGRAPSYHHHHHHHHHHHHHHQQQHQQP
60 70 80 90 100 110
120 130 140 150 160
pF1KE1 CYPGPLSGPVDEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSP-WDGSFGHFSPSQTYEG
: : :.: ::.: :.. . :: : .:.::.: ::: . :: .. .:. :
CCDS67 SIP-PASSPEDEVLPSTSMYFKQSPPS--TPTTPAF-PPQAGALWDEALPS-APGCIAPG
120 130 140 150 160 170
170 180 190 200 210
pF1KE1 --LRAWTEQLPKASGPPQPPAFFSFSPPTGPSPS------LAQSPLKL----FPSQATHQ
: . .: ..: : :. ::: :.:: :. .: .: :.
CCDS67 PLLDPPMKAVPTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAAA
180 190 200 210 220 230
220 230 240 250 260
pF1KE1 LG------EGESYSMPTA-------FP--GLAPTSPHLEGSGIL-DTP-VTSTKARSGAP
: :.. :..: : :: ::.: :: .:..: ..: . : .::..
CCDS67 AGSQAAALESHPYGLPLAKRAAPLAFPPLGLTP-SP--TASSLLGESPSLPSPPSRSSSS
240 250 260 270 280
270 280 290 300 310 320
pF1KE1 GGSEGRCAVCGDNASCQHYGVRTCEGCKGFFKRTVQKNAKYICLANKDCPVDKRRRNRCQ
: :: ::::::::.::::::::::::::::::::::::::.:::::.::::::::::::
CCDS67 G--EGTCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQ
290 300 310 320 330 340
330 340 350 360 370
pF1KE1 FCRFQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQP---------PDASPANLLTSLVRA
.:::::::.:::::::::::::::::::::::::.: : . : ....::::
CCDS67 YCRFQKCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRA
350 360 370 380 390 400
380 390 400 410 420 430
pF1KE1 HLDSGPSTAKLDYSKFQELVLPHFGKEDAGDVQQFYDLLSGSLEVIRKWAEKIPGFAELS
:: : ::::.. : :: :::::.::..:..: :.::::::::..:
CCDS67 LTDSTPRD--LDYSRYCPTDQAAAGT-DAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLP
410 420 430 440 450 460
440 450 460 470 480 490
pF1KE1 PADQDLLLESAFLELFILRLAYRSKPGEGKLIFCSGLVLHRLQCARGFGDWIDSILAFSR
:: ::.::::::::.:::. ::. .: :..::.::::::::: ::::.:.::: ::
CCDS67 KEDQTLLIESAFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQCLRGFGEWLDSIKDFSL
470 480 490 500 510 520
500 510 520 530 540 550
pF1KE1 SLHSLLVDVPAFACLSALVLITDRHGLQEPRRVEELQNRIASCLKEHVA-AVAGEPQPAS
.:.:: .:. :.:::::: .::.::::.::.::::: :.:.: ::.: . . : ::
CCDS67 NLQSLNLDIQALACLSALSMITERHGLKEPKRVEELCNKITSSLKDHQSKGQALEPTE--
530 540 550 560 570 580
560 570 580 590
pF1KE1 CLSRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPIIDKIFMDTLPF
:..:: : ::: .:: :::::::::::::: :: ::::.:.:::::
CCDS67 --SKVLGALVELRKICTLGLQRIFYLKLEDLVSPPSIIDKLFLDTLPF
590 600 610 620
>>CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 (637 aa)
initn: 1692 init1: 655 opt: 1544 Z-score: 901.6 bits: 177.0 E(32554): 6.7e-44
Smith-Waterman score: 1798; 48.9% identity (68.1% similar) in 648 aa overlap (1-598:12-637)
10 20 30 40
pF1KE1 MPCIQAQYGTPAPSPGPR-------DHLASDPLTPEFIKPTMDLASPEA
:::.:::: .:.: :: .. ... ..:.. : ::::.: :
CCDS67 MHDSIRFGNVDMPCVQAQY-SPSP-PGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEI
10 20 30 40 50
50 60 70 80 90
pF1KE1 APAAPTALPSFSTFMDGYTGEFD---TFLYQLPGTVQPCSSASSSASSTSSSSATSPASA
. .: :.:::.:::..::..... . .::. .: .. . . .
CCDS67 TATATTSLPSISTFVEGYSSNYELKPSCVYQMQ---RPLIKVEEGRAPSYHHHHHHHHHH
60 70 80 90 100 110
100 110 120 130 140 150
pF1KE1 SFKFEDFQVYGCYPGPLSGPVDEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSP-WDGSF
. .. . : : :.: ::.: :.. . :: : .:.::.: ::: . :: ..
CCDS67 HHHHQQQHQQPSIP-PASSPEDEVLPSTSMYFKQSPPS--TPTTPAF-PPQAGALWDEAL
120 130 140 150 160 170
160 170 180 190 200
pF1KE1 GHFSPSQTYEG--LRAWTEQLPKASGPPQPPAFFSFSPPTGPSPS------LAQSPLKL-
.:. : : . .: ..: : :. ::: :.:: :. .:
CCDS67 PS-APGCIAPGPLLDPPMKAVPTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAA
180 190 200 210 220 230
210 220 230 240
pF1KE1 ---FPSQATHQLG------EGESYSMPTA-------FP--GLAPTSPHLEGSGIL-DTP-
.: :. : :.. :..: : :: ::.: :: .:..: ..:
CCDS67 ALSLPLGAAAAAGSQAAALESHPYGLPLAKRAAPLAFPPLGLTP-SP--TASSLLGESPS
240 250 260 270 280
250 260 270 280 290 300
pF1KE1 VTSTKARSGAPGGSEGRCAVCGDNASCQHYGVRTCEGCKGFFKRTVQKNAKYICLANKDC
. : .::.. : :: ::::::::.::::::::::::::::::::::::::.:::::.:
CCDS67 LPSPPSRSSSSG--EGTCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNC
290 300 310 320 330 340
310 320 330 340 350 360
pF1KE1 PVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQP---------PDAS
:::::::::::.:::::::.:::::::::::::::::::::::::.: : .
CCDS67 PVDKRRRNRCQYCRFQKCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSP
350 360 370 380 390 400
370 380 390 400 410 420
pF1KE1 PANLLTSLVRAHLDSGPSTAKLDYSKFQELVLPHFGKEDAGDVQQFYDLLSGSLEVIRKW
: ....:::: :: : ::::.. : :: :::::.::..:..: :.:
CCDS67 PICMMNALVRALTDSTPRD--LDYSRYCPTDQAAAGT-DAEHVQQFYNLLTASIDVSRSW
410 420 430 440 450 460
430 440 450 460 470 480
pF1KE1 AEKIPGFAELSPADQDLLLESAFLELFILRLAYRSKPGEGKLIFCSGLVLHRLQCARGFG
:::::::..: :: ::.::::::::.:::. ::. .: :..::.::::::::: ::::
CCDS67 AEKIPGFTDLPKEDQTLLIESAFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQCLRGFG
470 480 490 500 510 520
490 500 510 520 530 540
pF1KE1 DWIDSILAFSRSLHSLLVDVPAFACLSALVLITDRHGLQEPRRVEELQNRIASCLKEHVA
.:.::: :: .:.:: .:. :.:::::: .::.::::.::.::::: :.:.: ::.: .
CCDS67 EWLDSIKDFSLNLQSLNLDIQALACLSALSMITERHGLKEPKRVEELCNKITSSLKDHQS
530 540 550 560 570 580
550 560 570 580 590
pF1KE1 -AVAGEPQPASCLSRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPIIDKIFMDTLPF
. : :: :..:: : ::: .:: :::::::::::::: :: ::::.:.:::::
CCDS67 KGQALEPTE----SKVLGALVELRKICTLGLQRIFYLKLEDLVSPPSIIDKLFLDTLPF
590 600 610 620 630
>>CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 (443 aa)
initn: 852 init1: 648 opt: 727 Z-score: 436.5 bits: 90.4 E(32554): 5.4e-18
Smith-Waterman score: 981; 41.6% identity (61.5% similar) in 447 aa overlap (1-401:1-432)
10 20 30 40 50
pF1KE1 MPCIQAQYGTPAPSPGPR-------DHLASDPLTPEFIKPTMDLASPEAAPAAPTALPSF
:::.:::: .:.: :: .. ... ..:.. : ::::.: : . .: :.:::.
CCDS67 MPCVQAQY-SPSP-PGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEITATATTSLPSI
10 20 30 40 50
60 70 80 90 100 110
pF1KE1 STFMDGYTGEFD---TFLYQLPGTVQPCSSASSSASSTSSSSATSPASASFKFEDFQVYG
:::..::..... . .::. .: .. . . . . .. .
CCDS67 STFVEGYSSNYELKPSCVYQMQ---RPLIKVEEGRAPSYHHHHHHHHHHHHHHQQQHQQP
60 70 80 90 100 110
120 130 140 150 160
pF1KE1 CYPGPLSGPVDEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSP-WDGSFGHFSPSQTYEG
: : :.: ::.: :.. . :: : .:.::.: ::: . :: .. .:. :
CCDS67 SIP-PASSPEDEVLPSTSMYFKQSPPS--TPTTPAF-PPQAGALWDEALPS-APGCIAPG
120 130 140 150 160 170
170 180 190 200 210
pF1KE1 --LRAWTEQLPKASGPPQPPAFFSFSPPTGPSPS------LAQSPLKL----FPSQATHQ
: . .: ..: : :. ::: :.:: :. .: .: :.
CCDS67 PLLDPPMKAVPTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAAA
180 190 200 210 220 230
220 230 240 250 260
pF1KE1 LG------EGESYSMPTA-------FPGLAPTSPHLEGSGILDTP-VTSTKARSGAPGGS
: :.. :..: : :: :. : .: . ..: . : .::.. :
CCDS67 AGSQAAALESHPYGLPLAKRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSG--
240 250 260 270 280
270 280 290 300 310 320
pF1KE1 EGRCAVCGDNASCQHYGVRTCEGCKGFFKRTVQKNAKYICLANKDCPVDKRRRNRCQFCR
:: ::::::::.::::::::::::::::::::::::::.:::::.::::::::::::.::
CCDS67 EGTCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCR
290 300 310 320 330 340
330 340 350 360 370
pF1KE1 FQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQP---------PDASPANLLTSLVRAHLD
:::::.:::::::::::::::::::::::::.: : . : ....:::: :
CCDS67 FQKCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRALTD
350 360 370 380 390 400
380 390 400 410 420 430
pF1KE1 SGPSTAKLDYSKFQELVLPHFGKEDAGDVQQFYDLLSGSLEVIRKWAEKIPGFAELSPAD
: : ::::. . .. : .: :
CCDS67 STPRD--LDYSRVSFMI-SCFQMNDQGLYLWLLVIRVD
410 420 430 440
>>CCDS8850.1 RARG gene_id:5916|Hs108|chr12 (454 aa)
initn: 637 init1: 362 opt: 725 Z-score: 435.3 bits: 90.2 E(32554): 6.3e-18
Smith-Waterman score: 744; 35.0% identity (59.0% similar) in 432 aa overlap (202-598:1-422)
180 190 200 210 220
pF1KE1 AWTEQLPKASGPPQPPAFFSFSPPTGPSPSLAQSPLKLFPSQATHQLGEGESY---SMPT
.: . .:: . : :: : .: ..:
CCDS88 MATNKERLFAAGA---LGPGSGYPGAGFPF
10 20
230 240 250 260
pF1KE1 AFPGL---APT----SPHLEGSGILDTP---------VTSTKARSGAPGGSEGR------
:::: .: :: ..: : : : . ::... .:..
CCDS88 AFPGALRGSPPFEMLSPSFRGLGQPDLPKEMASLSVETQSTSSEEMVPSSPSPPPPPRVY
30 40 50 60 70 80
270 280 290 300 310 320
pF1KE1 --CAVCGDNASCQHYGVRTCEGCKGFFKRTVQKNAKYICLANKDCPVDKRRRNRCQFCRF
: ::.:..: :::: .::::::::.:..::: : : .:.: ..: :::::.::.
CCDS88 KPCFVCNDKSSGYHYGVSSCEGCKGFFRRSIQKNMVYTCHRDKNCIINKVTRNRCQYCRL
90 100 110 120 130 140
330 340 350 360 370
pF1KE1 QKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQPPDA---SPA--NLLTSLVRAHLDSGPST
:::. ::: ::.::.: : .. : . ::. :: .:.:.. .:: .. ::
CCDS88 QKCFEVGMSKEAVRNDRNKKKK---EVKEEGSPDSYELSPQLEELITKVSKAHQETFPSL
150 160 170 180 190 200
380 390 400 410 420 430
pF1KE1 AKLDYSKFQ-ELVLPHFGKEDAGDVQQFYDLLSGSLEVIRKWAEKIPGFAELSPADQDLL
.: .:. . : . : : ..: .: . . : ..:...:::. :: ::: :
CCDS88 CQL--GKYTTNSSADHRVQLDLGLWDKFSELATKCIIKIVEFAKRLPGFTGLSIADQITL
210 220 230 240 250 260
440 450 460 470 480 490
pF1KE1 LESAFLELFILRLAYRSKPGEGKLIFCSGLVLHRLQCAR-GFGDWIDSILAFSRSLHSLL
:..: :....::. : : . . : .::.:.: : ::: : ..::. .: :
CCDS88 LKAACLDILMLRICTRYTPEQDTMTFSDGLTLNRTQMHNAGFGPLTDLVFAFAGQLLPLE
270 280 290 300 310 320
500 510 520 530 540 550
pF1KE1 VDVPAFACLSALVLIT-DRHGLQEPRRVEELQNRIASCLKEHVAAVAGEPQPASCLSRLL
.: . :::. :: :: :.::..:..::. . :. . : .:. . :.:
CCDS88 MDDTETGLLSAICLICGDRMDLEEPEKVDKLQEPLLEALRLY--ARRRRPSQPYMFPRML
330 340 350 360 370 380
560 570 580 590
pF1KE1 GKLPELRTLCTQGLQRIFYLKLEDLVPPPPIIDKIFMDTLPF
:. .:: . :.: .: . ::.: : ::.: ... . :
CCDS88 MKITDLRGISTKGAERAITLKMEIPGPMPPLIREMLENPEMFEDDSSQPGPHPNASSEDE
390 400 410 420 430 440
CCDS88 VPGGQGKGGLKSPA
450
>>CCDS58236.1 RARG gene_id:5916|Hs108|chr12 (382 aa)
initn: 660 init1: 362 opt: 720 Z-score: 433.4 bits: 89.6 E(32554): 8.1e-18
Smith-Waterman score: 720; 37.6% identity (63.2% similar) in 340 aa overlap (267-598:18-350)
240 250 260 270 280 290
pF1KE1 SPHLEGSGILDTPVTSTKARSGAPGGSEGRCAVCGDNASCQHYGVRTCEGCKGFFKRTVQ
: ::.:..: :::: .::::::::.:..:
CCDS58 MVPSSPSPPPPPRVYKPCFVCNDKSSGYHYGVSSCEGCKGFFRRSIQ
10 20 30 40
300 310 320 330 340 350
pF1KE1 KNAKYICLANKDCPVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQP
:: : : .:.: ..: :::::.::.:::. ::: ::.::.: : .. : .
CCDS58 KNMVYTCHRDKNCIINKVTRNRCQYCRLQKCFEVGMSKEAVRNDRNKKKK---EVKEEGS
50 60 70 80 90 100
360 370 380 390 400 410
pF1KE1 PDA---SPA--NLLTSLVRAHLDSGPSTAKLDYSKFQ-ELVLPHFGKEDAGDVQQFYDLL
::. :: .:.:.. .:: .. :: .: .:. . : . : : ..: .:
CCDS58 PDSYELSPQLEELITKVSKAHQETFPSLCQL--GKYTTNSSADHRVQLDLGLWDKFSELA
110 120 130 140 150 160
420 430 440 450 460 470
pF1KE1 SGSLEVIRKWAEKIPGFAELSPADQDLLLESAFLELFILRLAYRSKPGEGKLIFCSGLVL
. . : ..:...:::. :: ::: ::..: :....::. : : . . : .::.:
CCDS58 TKCIIKIVEFAKRLPGFTGLSIADQITLLKAACLDILMLRICTRYTPEQDTMTFSDGLTL
170 180 190 200 210 220
480 490 500 510 520
pF1KE1 HRLQCAR-GFGDWIDSILAFSRSLHSLLVDVPAFACLSALVLIT-DRHGLQEPRRVEELQ
.: : ::: : ..::. .: : .: . :::. :: :: :.::..:..::
CCDS58 NRTQMHNAGFGPLTDLVFAFAGQLLPLEMDDTETGLLSAICLICGDRMDLEEPEKVDKLQ
230 240 250 260 270 280
530 540 550 560 570 580
pF1KE1 NRIASCLKEHVAAVAGEPQPASCLSRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPII
. . :. . : .:. . :.: :. .:: . :.: .: . ::.: : ::.:
CCDS58 EPLLEALRLY--ARRRRPSQPYMFPRMLMKITDLRGISTKGAERAITLKMEIPGPMPPLI
290 300 310 320 330 340
590
pF1KE1 DKIFMDTLPF
... . :
CCDS58 REMLENPEMFEDDSSQPGPHPNASSEDEVPGGQGKGGLKSPA
350 360 370 380
>>CCDS41790.1 RARG gene_id:5916|Hs108|chr12 (443 aa)
initn: 682 init1: 362 opt: 720 Z-score: 432.5 bits: 89.6 E(32554): 9e-18
Smith-Waterman score: 720; 37.6% identity (63.2% similar) in 340 aa overlap (267-598:79-411)
240 250 260 270 280 290
pF1KE1 SPHLEGSGILDTPVTSTKARSGAPGGSEGRCAVCGDNASCQHYGVRTCEGCKGFFKRTVQ
: ::.:..: :::: .::::::::.:..:
CCDS41 LQSVETQSTSSEEMVPSSPSPPPPPRVYKPCFVCNDKSSGYHYGVSSCEGCKGFFRRSIQ
50 60 70 80 90 100
300 310 320 330 340 350
pF1KE1 KNAKYICLANKDCPVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQP
:: : : .:.: ..: :::::.::.:::. ::: ::.::.: : .. : .
CCDS41 KNMVYTCHRDKNCIINKVTRNRCQYCRLQKCFEVGMSKEAVRNDRNKKKK---EVKEEGS
110 120 130 140 150 160
360 370 380 390 400 410
pF1KE1 PDA---SPA--NLLTSLVRAHLDSGPSTAKLDYSKFQ-ELVLPHFGKEDAGDVQQFYDLL
::. :: .:.:.. .:: .. :: .: .:. . : . : : ..: .:
CCDS41 PDSYELSPQLEELITKVSKAHQETFPSLCQL--GKYTTNSSADHRVQLDLGLWDKFSELA
170 180 190 200 210 220
420 430 440 450 460 470
pF1KE1 SGSLEVIRKWAEKIPGFAELSPADQDLLLESAFLELFILRLAYRSKPGEGKLIFCSGLVL
. . : ..:...:::. :: ::: ::..: :....::. : : . . : .::.:
CCDS41 TKCIIKIVEFAKRLPGFTGLSIADQITLLKAACLDILMLRICTRYTPEQDTMTFSDGLTL
230 240 250 260 270 280
480 490 500 510 520
pF1KE1 HRLQCAR-GFGDWIDSILAFSRSLHSLLVDVPAFACLSALVLIT-DRHGLQEPRRVEELQ
.: : ::: : ..::. .: : .: . :::. :: :: :.::..:..::
CCDS41 NRTQMHNAGFGPLTDLVFAFAGQLLPLEMDDTETGLLSAICLICGDRMDLEEPEKVDKLQ
290 300 310 320 330 340
530 540 550 560 570 580
pF1KE1 NRIASCLKEHVAAVAGEPQPASCLSRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPII
. . :. . : .:. . :.: :. .:: . :.: .: . ::.: : ::.:
CCDS41 EPLLEALRLY--ARRRRPSQPYMFPRMLMKITDLRGISTKGAERAITLKMEIPGPMPPLI
350 360 370 380 390 400
590
pF1KE1 DKIFMDTLPF
... . :
CCDS41 REMLENPEMFEDDSSQPGPHPNASSEDEVPGGQGKGGLKSPA
410 420 430 440
598 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 01:13:50 2016 done: Mon Nov 7 01:13:50 2016
Total Scan time: 4.110 Total Display time: 0.130
Function used was FASTA [36.3.4 Apr, 2011]