FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3311, 626 aa
1>>>pF1KB3311 626 - 626 aa - 626 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.1505+/-0.00101; mu= 0.3586+/- 0.061
mean_var=384.2439+/-78.615, 0's: 0 Z-trim(115.5): 132 B-trim: 113 in 1/54
Lambda= 0.065429
statistics sampled from 15959 (16092) to 15959 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.782), E-opt: 0.2 (0.494), width: 16
Scan time: 3.100
The best scores are: opt bits E(32554)
CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 ( 626) 4298 419.9 4.9e-117
CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 ( 637) 4298 419.9 5e-117
CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 ( 443) 2942 291.8 1.3e-78
CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 ( 598) 1830 186.9 6.5e-47
CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 ( 598) 1545 160.0 8.1e-39
CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 ( 611) 1545 160.1 8.2e-39
CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12 ( 652) 1545 160.1 8.6e-39
CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 680 78.3 2.6e-14
CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 674 77.7 3.8e-14
CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 663 76.6 7.7e-14
CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 657 76.1 1.1e-13
CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 654 75.8 1.4e-13
CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 644 74.8 2.4e-13
CCDS1517.1 ESRRG gene_id:2104|Hs108|chr1 ( 435) 643 74.7 2.8e-13
CCDS41468.1 ESRRG gene_id:2104|Hs108|chr1 ( 458) 643 74.8 2.9e-13
CCDS58061.1 ESRRG gene_id:2104|Hs108|chr1 ( 470) 637 74.2 4.4e-13
CCDS9850.2 ESRRB gene_id:2103|Hs108|chr14 ( 508) 589 69.7 1.1e-11
>>CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 (626 aa)
initn: 4298 init1: 4298 opt: 4298 Z-score: 2214.6 bits: 419.9 E(32554): 4.9e-117
Smith-Waterman score: 4298; 99.8% identity (100.0% similar) in 626 aa overlap (1-626:1-626)
10 20 30 40 50 60
pF1KB3 MPCVQAQYSPSPPGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEITATATTSLPSIST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 MPCVQAQYSPSPPGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEITATATTSLPSIST
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 FVEGYSSNYELKPSCVYQMQRPLIKVEEGRAPSYHHHHHHHHHHHHHHQQQHQQPSIPPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 FVEGYSSNYELKPSCVYQMQRPLIKVEEGRAPSYHHHHHHHHHHHHHHQQQHQQPSIPPA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 SSPEDEVLPSTSMYFKQSPPSTPTTPAFPPQAGALWDEALPSAPGCIAPGPLLDPPMKAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 SSPEDEVLPSTSMYFKQSPPSTPTTPAFPPQAGALWDEALPSAPGCIAPGPLLDPPMKAV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 PTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAAAAGSQAAALEG
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::.
CCDS67 PTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAAAAGSQAAALES
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 HPYGLPLAKRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSGEGTCAVCGDNAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 HPYGLPLAKRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSGEGTCAVCGDNAA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 CQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQKCLSVGMVKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 CQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQKCLSVGMVKE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB3 VVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRALTDSTPRDLDYSRYC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 VVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRALTDSTPRDLDYSRYC
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB3 PTDQAAAGTDAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLPKEDQTLLIESAFLELFVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 PTDQAAAGTDAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLPKEDQTLLIESAFLELFVL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB3 RLSIRSNTAEDKFVFCNGLVLHRLQCLRGFGEWLDSIKDFSLNLQSLNLDIQALACLSAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 RLSIRSNTAEDKFVFCNGLVLHRLQCLRGFGEWLDSIKDFSLNLQSLNLDIQALACLSAL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB3 SMITERHGLKEPKRVEELCNKITSSLKDHQSKGQALEPTESKVLGALVELRKICTLGLQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 SMITERHGLKEPKRVEELCNKITSSLKDHQSKGQALEPTESKVLGALVELRKICTLGLQR
550 560 570 580 590 600
610 620
pF1KB3 IFYLKLEDLVSPPSIIDKLFLDTLPF
::::::::::::::::::::::::::
CCDS67 IFYLKLEDLVSPPSIIDKLFLDTLPF
610 620
>>CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 (637 aa)
initn: 4298 init1: 4298 opt: 4298 Z-score: 2214.5 bits: 419.9 E(32554): 5e-117
Smith-Waterman score: 4298; 99.8% identity (100.0% similar) in 626 aa overlap (1-626:12-637)
10 20 30 40
pF1KB3 MPCVQAQYSPSPPGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEITA
:::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 MHDSIRFGNVDMPCVQAQYSPSPPGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEITA
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB3 TATTSLPSISTFVEGYSSNYELKPSCVYQMQRPLIKVEEGRAPSYHHHHHHHHHHHHHHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 TATTSLPSISTFVEGYSSNYELKPSCVYQMQRPLIKVEEGRAPSYHHHHHHHHHHHHHHQ
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB3 QQHQQPSIPPASSPEDEVLPSTSMYFKQSPPSTPTTPAFPPQAGALWDEALPSAPGCIAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 QQHQQPSIPPASSPEDEVLPSTSMYFKQSPPSTPTTPAFPPQAGALWDEALPSAPGCIAP
130 140 150 160 170 180
170 180 190 200 210 220
pF1KB3 GPLLDPPMKAVPTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 GPLLDPPMKAVPTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAA
190 200 210 220 230 240
230 240 250 260 270 280
pF1KB3 AAGSQAAALEGHPYGLPLAKRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSGE
::::::::::.:::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 AAGSQAAALESHPYGLPLAKRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSGE
250 260 270 280 290 300
290 300 310 320 330 340
pF1KB3 GTCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 GTCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRF
310 320 330 340 350 360
350 360 370 380 390 400
pF1KB3 QKCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRALTDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 QKCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRALTDS
370 380 390 400 410 420
410 420 430 440 450 460
pF1KB3 TPRDLDYSRYCPTDQAAAGTDAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLPKEDQTLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 TPRDLDYSRYCPTDQAAAGTDAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLPKEDQTLL
430 440 450 460 470 480
470 480 490 500 510 520
pF1KB3 IESAFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQCLRGFGEWLDSIKDFSLNLQSLNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 IESAFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQCLRGFGEWLDSIKDFSLNLQSLNL
490 500 510 520 530 540
530 540 550 560 570 580
pF1KB3 DIQALACLSALSMITERHGLKEPKRVEELCNKITSSLKDHQSKGQALEPTESKVLGALVE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 DIQALACLSALSMITERHGLKEPKRVEELCNKITSSLKDHQSKGQALEPTESKVLGALVE
550 560 570 580 590 600
590 600 610 620
pF1KB3 LRKICTLGLQRIFYLKLEDLVSPPSIIDKLFLDTLPF
:::::::::::::::::::::::::::::::::::::
CCDS67 LRKICTLGLQRIFYLKLEDLVSPPSIIDKLFLDTLPF
610 620 630
>>CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 (443 aa)
initn: 2942 init1: 2942 opt: 2942 Z-score: 1524.6 bits: 291.8 E(32554): 1.3e-78
Smith-Waterman score: 2942; 99.8% identity (100.0% similar) in 418 aa overlap (1-418:1-418)
10 20 30 40 50 60
pF1KB3 MPCVQAQYSPSPPGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEITATATTSLPSIST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 MPCVQAQYSPSPPGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEITATATTSLPSIST
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 FVEGYSSNYELKPSCVYQMQRPLIKVEEGRAPSYHHHHHHHHHHHHHHQQQHQQPSIPPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 FVEGYSSNYELKPSCVYQMQRPLIKVEEGRAPSYHHHHHHHHHHHHHHQQQHQQPSIPPA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 SSPEDEVLPSTSMYFKQSPPSTPTTPAFPPQAGALWDEALPSAPGCIAPGPLLDPPMKAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 SSPEDEVLPSTSMYFKQSPPSTPTTPAFPPQAGALWDEALPSAPGCIAPGPLLDPPMKAV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 PTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAAAAGSQAAALEG
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::.
CCDS67 PTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAAAAGSQAAALES
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 HPYGLPLAKRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSGEGTCAVCGDNAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 HPYGLPLAKRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSGEGTCAVCGDNAA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 CQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQKCLSVGMVKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 CQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQKCLSVGMVKE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB3 VVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRALTDSTPRDLDYSRYC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 VVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRALTDSTPRDLDYSRVS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB3 PTDQAAAGTDAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLPKEDQTLLIESAFLELFVL
CCDS67 FMISCFQMNDQGLYLWLLVIRVD
430 440
>>CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 (598 aa)
initn: 1363 init1: 741 opt: 1830 Z-score: 955.8 bits: 186.9 E(32554): 6.5e-47
Smith-Waterman score: 2254; 56.7% identity (76.3% similar) in 642 aa overlap (1-626:1-598)
10 20 30 40 50
pF1KB3 MPCVQAQYSPSPPGSSYAAQTYS----SEYTTEIMNPDYTKLTMDLGSTEITATATTSLP
::::::::. :: :.: :.:.:: .::......:...:..::: .:::::: ::::
CCDS22 MPCVQAQYGSSPQGASPASQSYSYHSSGEYSSDFLTPEFVKFSMDLTNTEITAT--TSLP
10 20 30 40 50
60 70 80 90 100 110
pF1KB3 SISTFVEGYSSNYELKPSCVYQM----QRPLIKVEEGRAPSYHHHHHHHHHHHHHHQQQH
:.:::...::..:..:: :.::: :. ::::. . .:..: :
CCDS22 SFSTFMDNYSTGYDVKPPCLYQMPLSGQQSSIKVEDIQMHNYQQHSH-------------
60 70 80 90 100
120 130 140 150 160 170
pF1KB3 QQPSIPPASSPEDEVLP-STSMYFKQSPPSTPTTPAFPPQAGALWDEALPSAPGCIAPGP
.:: : .:..: : :.:.: : : :::::.: : . .::. :.. . .
CCDS22 ----LPPQS---EEMMPHSGSVYYKPSSPPTPTTPGFQVQHSPMWDD--PGSLHNFHQNY
110 120 130 140 150
180 190 200 210 220 230
pF1KB3 LLDPPMKAVPTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAAAA
. : . .:. :: :: ::: :. : .. .: . : .:.. :
CCDS22 VATTHMIEQRKTPVSRLSLFSFKQSPPGTPVSS----CQMRFD----GPLHVPMNPEPA-
160 170 180 190 200
240 250 260 270 280 290
pF1KB3 GSQAAALEGHPYGLPLA-KRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSGEG
::. . ..:. ...: .. : ..:: : . ::.:: . ..::::::.: :.::
CCDS22 GSHHV-VDGQTFAVPNPIRKPASMGFPGLQIGH---ASQLL--DTQVPSPPSRGSPSNEG
210 220 230 240 250 260
300 310 320 330 340 350
pF1KB3 TCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQ
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS22 LCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQ
270 280 290 300 310 320
360 370 380 390 400 410
pF1KB3 KCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRALTDST
:::.::::::::::::::::::::::::::: :::: :::::. ...::::: .::.
CCDS22 KCLAVGMVKEVVRTDSLKGRRGRLPSKPKSP--QEPS---PPSPPVSLISALVRAHVDSN
330 340 350 360 370
420 430 440 450 460
pF1KB3 P--RDLDYSRYCPT-DQAAAGTDAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLPKEDQT
: .:::::. . : .: :..:.::::.:::.:... :.::::::::.:::: ::
CCDS22 PAMTSLDYSRFQANPDYQMSGDDTQHIQQFYDLLTGSMEIIRGWAEKIPGFADLPKADQD
380 390 400 410 420 430
470 480 490 500 510 520
pF1KB3 LLIESAFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQCLRGFGEWLDSIKDFSLNLQSL
::.::::::::::::. ::: .: :..::::.:::::::.::::::.::: .:: :::..
CCDS22 LLFESAFLELFVLRLAYRSNPVEGKLIFCNGVVLHRLQCVRGFGEWIDSIVEFSSNLQNM
440 450 460 470 480 490
530 540 550 560 570 580
pF1KB3 NLDIQALACLSALSMITERHGLKEPKRVEELCNKITSSLKDHQS--KGQALEPTE-SKVL
:.::.:..:..::.:.::::::::::::::: :::.. :::: . .: .:. ::.:
CCDS22 NIDISAFSCIAALAMVTERHGLKEPKRVEELQNKIVNCLKDHVTFNNGGLNRPNYLSKLL
500 510 520 530 540 550
590 600 610 620
pF1KB3 GALVELRKICTLGLQRIFYLKLEDLVSPPSIIDKLFLDTLPF
: : ::: .:: :::::::::::::: ::.::::::::::::
CCDS22 GKLPELRTLCTQGLQRIFYLKLEDLVPPPAIIDKLFLDTLPF
560 570 580 590
>>CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 (598 aa)
initn: 1721 init1: 655 opt: 1545 Z-score: 810.4 bits: 160.0 E(32554): 8.1e-39
Smith-Waterman score: 1806; 48.8% identity (67.6% similar) in 646 aa overlap (1-626:1-598)
10 20 30 40 50
pF1KB3 MPCVQAQY-SPSP-PGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEITATATTSLPSI
:::.:::: .:.: :: .. ... ..:.. : ::::.: : . .: :.:::.
CCDS88 MPCIQAQYGTPAPSPGPR-------DHLASDPLTPEFIKPTMDLASPEAAPAAPTALPSF
10 20 30 40 50
60 70 80 90 100 110
pF1KB3 STFVEGYSSNYELKPSCVYQMQ---RPLIKVEEGRAPSYHHHHHHHHHHHHHHQQQHQQP
:::..::..... . .::. .: .. . . . . .. .
CCDS88 STFMDGYTGEFD---TFLYQLPGTVQPCSSASSSASSTSSSSATSPASASFKFEDFQVYG
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB3 SIP-PASSPEDEVLPSTSMYFKQSPPS--TPTTPAFPPQAGALWDEALPS-APGCIAPGP
: : :.: ::.: :.. . :: : .:.::.: : . :: .. .:. :
CCDS88 CYPGPLSGPVDEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSPWDGSFGHFSPSQTYEG-
120 130 140 150 160
180 190 200 210 220 230
pF1KB3 LLDPPMKAVPTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAAAA
: . .: ..: : :. ::: :.:: :. .: .: :.
CCDS88 -LRAWTEQLPKASGPPQPPAFFSFSPPTGPSPS------LAQSPLKL----FPSQATHQL
170 180 190 200 210
240 250 260 270 280
pF1KB3 GSQAAALEGHPYGLPLAKRAAPLAFPPLGLTP-SP-TASSLLGESPSLPSPPSRSSSSG-
: ::. :..: ::: ::.: :: .: . ..: . : .::.. :
CCDS88 G------EGESYSMPT-------AFP--GLAPTSPHLEGSGILDTP-VTSTKARSGAPGG
220 230 240 250 260
290 300 310 320 330 340
pF1KB3 -EGTCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYC
:: ::::::::.::::::::::::::::::::::::::.:::::.::::::::::::.:
CCDS88 SEGRCAVCGDNASCQHYGVRTCEGCKGFFKRTVQKNAKYICLANKDCPVDKRRRNRCQFC
270 280 290 300 310 320
350 360 370 380 390 400
pF1KB3 RFQKCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRALT
::::::.:::::::::::::::::::::::::.: : . : ....::::
CCDS88 RFQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQP---------PDASPANLLTSLVRAHL
330 340 350 360 370
410 420 430 440 450 460
pF1KB3 DSTPRD--LDYSRYCPTDQAAAGT-DAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLPKE
:: : ::::.. : :: :::::.::..:..: :.::::::::..:
CCDS88 DSGPSTAKLDYSKFQELVLPHFGKEDAGDVQQFYDLLSGSLEVIRKWAEKIPGFAELSPA
380 390 400 410 420 430
470 480 490 500 510 520
pF1KB3 DQTLLIESAFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQCLRGFGEWLDSIKDFSLNL
:: ::.::::::::.:::. ::. .: :..::.::::::::: ::::.:.::: :: .:
CCDS88 DQDLLLESAFLELFILRLAYRSKPGEGKLIFCSGLVLHRLQCARGFGDWIDSILAFSRSL
440 450 460 470 480 490
530 540 550 560 570 580
pF1KB3 QSLNLDIQALACLSALSMITERHGLKEPKRVEELCNKITSSLKDHQSKGQALEPTE----
.:: .:. :.:::::: .::.::::.::.::::: :.:.: ::.: . . : ::
CCDS88 HSLLVDVPAFACLSALVLITDRHGLQEPRRVEELQNRIASCLKEHVA-AVAGEPQPASCL
500 510 520 530 540 550
590 600 610 620
pF1KB3 SKVLGALVELRKICTLGLQRIFYLKLEDLVSPPSIIDKLFLDTLPF
:..:: : ::: .:: :::::::::::::: :: ::::.:.:::::
CCDS88 SRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPIIDKIFMDTLPF
560 570 580 590
>>CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 (611 aa)
initn: 1721 init1: 655 opt: 1545 Z-score: 810.3 bits: 160.1 E(32554): 8.2e-39
Smith-Waterman score: 1806; 48.8% identity (67.6% similar) in 646 aa overlap (1-626:14-611)
10 20 30 40
pF1KB3 MPCVQAQY-SPSP-PGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGST
:::.:::: .:.: :: .. ... ..:.. : ::::.:
CCDS55 MWLAKACWSIQSEMPCIQAQYGTPAPSPGPR-------DHLASDPLTPEFIKPTMDLASP
10 20 30 40 50
50 60 70 80 90 100
pF1KB3 EITATATTSLPSISTFVEGYSSNYELKPSCVYQMQ---RPLIKVEEGRAPSYHHHHHHHH
: . .: :.:::.:::..::..... . .::. .: .. . . .
CCDS55 EAAPAAPTALPSFSTFMDGYTGEFD---TFLYQLPGTVQPCSSASSSASSTSSSSATSPA
60 70 80 90 100 110
110 120 130 140 150
pF1KB3 HHHHHHQQQHQQPSIP-PASSPEDEVLPSTSMYFKQSPPS--TPTTPAFPPQAGALWDEA
. .. . : : :.: ::.: :.. . :: : .:.::.: : . :: .
CCDS55 SASFKFEDFQVYGCYPGPLSGPVDEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSPWDGS
120 130 140 150 160 170
160 170 180 190 200 210
pF1KB3 LPS-APGCIAPGPLLDPPMKAVPTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAA
. .:. : : . .: ..: : :. ::: :.:: :. .:
CCDS55 FGHFSPSQTYEG--LRAWTEQLPKASGPPQPPAFFSFSPPTGPSPS------LAQSPLKL
180 190 200 210 220
220 230 240 250 260 270
pF1KB3 AALSLPLGAAAAAGSQAAALEGHPYGLPLAKRAAPLAFPPLGLTP-SP-TASSLLGESPS
.: :. : ::. :..: ::: ::.: :: .: . ..:
CCDS55 ----FPSQATHQLG------EGESYSMPT-------AFP--GLAPTSPHLEGSGILDTP-
230 240 250 260
280 290 300 310 320 330
pF1KB3 LPSPPSRSSSSG--EGTCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNC
. : .::.. : :: ::::::::.::::::::::::::::::::::::::.:::::.:
CCDS55 VTSTKARSGAPGGSEGRCAVCGDNASCQHYGVRTCEGCKGFFKRTVQKNAKYICLANKDC
270 280 290 300 310 320
340 350 360 370 380 390
pF1KB3 PVDKRRRNRCQYCRFQKCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSP
:::::::::::.:::::::.:::::::::::::::::::::::::.: : .
CCDS55 PVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQP---------PDAS
330 340 350 360 370
400 410 420 430 440 450
pF1KB3 PICMMNALVRALTDSTPRD--LDYSRYCPTDQAAAGT-DAEHVQQFYNLLTASIDVSRSW
: ....:::: :: : ::::.. : :: :::::.::..:..: :.:
CCDS55 PANLLTSLVRAHLDSGPSTAKLDYSKFQELVLPHFGKEDAGDVQQFYDLLSGSLEVIRKW
380 390 400 410 420 430
460 470 480 490 500 510
pF1KB3 AEKIPGFTDLPKEDQTLLIESAFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQCLRGFG
:::::::..: :: ::.::::::::.:::. ::. .: :..::.::::::::: ::::
CCDS55 AEKIPGFAELSPADQDLLLESAFLELFILRLAYRSKPGEGKLIFCSGLVLHRLQCARGFG
440 450 460 470 480 490
520 530 540 550 560 570
pF1KB3 EWLDSIKDFSLNLQSLNLDIQALACLSALSMITERHGLKEPKRVEELCNKITSSLKDHQS
.:.::: :: .:.:: .:. :.:::::: .::.::::.::.::::: :.:.: ::.: .
CCDS55 DWIDSILAFSRSLHSLLVDVPAFACLSALVLITDRHGLQEPRRVEELQNRIASCLKEHVA
500 510 520 530 540 550
580 590 600 610 620
pF1KB3 KGQALEPTE----SKVLGALVELRKICTLGLQRIFYLKLEDLVSPPSIIDKLFLDTLPF
. : :: :..:: : ::: .:: :::::::::::::: :: ::::.:.:::::
CCDS55 -AVAGEPQPASCLSRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPIIDKIFMDTLPF
560 570 580 590 600 610
>>CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12 (652 aa)
initn: 1721 init1: 655 opt: 1545 Z-score: 809.9 bits: 160.1 E(32554): 8.6e-39
Smith-Waterman score: 1806; 48.8% identity (67.6% similar) in 646 aa overlap (1-626:55-652)
10 20
pF1KB3 MPCVQAQY-SPSP-PGSSYAAQTYSSEYTT
:::.:::: .:.: :: .. ..
CCDS73 PPRQPGSFCWALKADGIMWLAKACWSIQSEMPCIQAQYGTPAPSPGPR-------DHLAS
30 40 50 60 70
30 40 50 60 70 80
pF1KB3 EIMNPDYTKLTMDLGSTEITATATTSLPSISTFVEGYSSNYELKPSCVYQMQ---RPLIK
. ..:.. : ::::.: : . .: :.:::.:::..::..... . .::. .: .
CCDS73 DPLTPEFIKPTMDLASPEAAPAAPTALPSFSTFMDGYTGEFD---TFLYQLPGTVQPCSS
80 90 100 110 120 130
90 100 110 120 130 140
pF1KB3 VEEGRAPSYHHHHHHHHHHHHHHQQQHQQPSIP-PASSPEDEVLPSTSMYFKQSPPS--T
. . . . . .. . : : :.: ::.: :.. . :: : .
CCDS73 ASSSASSTSSSSATSPASASFKFEDFQVYGCYPGPLSGPVDEALSSSGSDYYGSPCSAPS
140 150 160 170 180 190
150 160 170 180 190 200
pF1KB3 PTTPAFPPQAGALWDEALPS-APGCIAPGPLLDPPMKAVPTVAGARFPLFHFKPSPPHPP
:.::.: : . :: .. .:. : : . .: ..: : :. ::: :
CCDS73 PSTPSFQPPQLSPWDGSFGHFSPSQTYEG--LRAWTEQLPKASGPPQPPAFFSFSPPTGP
200 210 220 230 240 250
210 220 230 240 250 260
pF1KB3 APSPAGGHHLGYDPTAAAALSLPLGAAAAAGSQAAALEGHPYGLPLAKRAAPLAFPPLGL
.:: :. .: .: :. : ::. :..: ::: ::
CCDS73 SPS------LAQSPLKL----FPSQATHQLG------EGESYSMPT-------AFP--GL
260 270 280
270 280 290 300 310
pF1KB3 TP-SP-TASSLLGESPSLPSPPSRSSSSG--EGTCAVCGDNAACQHYGVRTCEGCKGFFK
.: :: .: . ..: . : .::.. : :: ::::::::.:::::::::::::::::
CCDS73 APTSPHLEGSGILDTP-VTSTKARSGAPGGSEGRCAVCGDNASCQHYGVRTCEGCKGFFK
290 300 310 320 330 340
320 330 340 350 360 370
pF1KB3 RTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQKCLSVGMVKEVVRTDSLKGRRGRLPSK
:::::::::.:::::.::::::::::::.:::::::.:::::::::::::::::::::::
CCDS73 RTVQKNAKYICLANKDCPVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRGRLPSK
350 360 370 380 390 400
380 390 400 410 420 430
pF1KB3 PKSPLQQEPSQPSPPSPPICMMNALVRALTDSTPRD--LDYSRYCPTDQAAAGT-DAEHV
::.: : . : ....:::: :: : ::::.. : :: :
CCDS73 PKQP---------PDASPANLLTSLVRAHLDSGPSTAKLDYSKFQELVLPHFGKEDAGDV
410 420 430 440 450
440 450 460 470 480 490
pF1KB3 QQFYNLLTASIDVSRSWAEKIPGFTDLPKEDQTLLIESAFLELFVLRLSIRSNTAEDKFV
::::.::..:..: :.::::::::..: :: ::.::::::::.:::. ::. .: :..
CCDS73 QQFYDLLSGSLEVIRKWAEKIPGFAELSPADQDLLLESAFLELFILRLAYRSKPGEGKLI
460 470 480 490 500 510
500 510 520 530 540 550
pF1KB3 FCNGLVLHRLQCLRGFGEWLDSIKDFSLNLQSLNLDIQALACLSALSMITERHGLKEPKR
::.::::::::: ::::.:.::: :: .:.:: .:. :.:::::: .::.::::.::.:
CCDS73 FCSGLVLHRLQCARGFGDWIDSILAFSRSLHSLLVDVPAFACLSALVLITDRHGLQEPRR
520 530 540 550 560 570
560 570 580 590 600 610
pF1KB3 VEELCNKITSSLKDHQSKGQALEPTE----SKVLGALVELRKICTLGLQRIFYLKLEDLV
:::: :.:.: ::.: . . : :: :..:: : ::: .:: ::::::::::::::
CCDS73 VEELQNRIASCLKEHVA-AVAGEPQPASCLSRLLGKLPELRTLCTQGLQRIFYLKLEDLV
580 590 600 610 620 630
620
pF1KB3 SPPSIIDKLFLDTLPF
:: ::::.:.:::::
CCDS73 PPPPIIDKIFMDTLPF
640 650
>>CCDS11366.1 RARA gene_id:5914|Hs108|chr17 (462 aa)
initn: 522 init1: 362 opt: 680 Z-score: 370.4 bits: 78.3 E(32554): 2.6e-14
Smith-Waterman score: 728; 34.3% identity (58.9% similar) in 435 aa overlap (203-624:9-423)
180 190 200 210 220 230
pF1KB3 LDPPMKAVPTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLP--LGAAAA
:.:.::: :: :. :. .: ::. .
CCDS11 MASNSSSCPTPGGGHLNGY-PVPPYAFFFPPMLGGLSP
10 20 30
240 250 260 270 280 290
pF1KB3 AGSQAAALEGHPYGLPLAKRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSGEG
: :: . ::.. ..: : : : .. .. :: ::::
CCDS11 PG----ALTTLQHQLPVSGYSTPS--PATIETQSSSSEEIV---PSPPSPPPLPRIYKP-
40 50 60 70 80
300 310 320 330 340 350
pF1KB3 TCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQ
: :: :... :::: .::::::::.:..::: :.: .::: ..: ::::::::.:
CCDS11 -CFVCQDKSSGYHYGVSACEGCKGFFRRSIQKNMVYTCHRDKNCIINKVTRNRCQYCRLQ
90 100 110 120 130 140
360 370 380 390 400
pF1KB3 KCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVR-ALTDS
::. ::: :: ::.: : .. ..: :: : :. .: . . :: : ..
CCDS11 KCFEVGMSKESVRNDRNK-KKKEVP-KP------ECSESYTLTPEVGELIEKVRKAHQET
150 160 170 180 190
410 420 430 440 450 460
pF1KB3 TPRDLDYSRYCPTDQAA--AGTDAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLPKEDQT
: . ..: .... .. : . ..: .: : : . .:...:::: : ::
CCDS11 FPALCQLGKYTTNNSSEQRVSLDIDLWDKFSELSTKCIIKTVEFAKQLPGFTTLTIADQI
200 210 220 230 240 250
470 480 490 500 510 520
pF1KB3 LLIESAFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQCLR-GFGEWLDSIKDFSLNLQS
:...: :....::. : . .: ..: .::.:.: : ::: : . :. .:
CCDS11 TLLKAACLDILILRICTRYTPEQDTMTFSDGLTLNRTQMHNAGFGPLTDLVFAFANQLLP
260 270 280 290 300 310
530 540 550 560 570 580
pF1KB3 LNLDIQALACLSALSMIT-ERHGLKEPKRVEELCNKITSSLKDHQSKGQALEPTE-SKVL
:..: . :::. .: .:. :..: ::. : . . .:: . : . .: :.:
CCDS11 LEMDDAETGLLSAICLICGDRQDLEQPDRVDMLQEPLLEALKVYVRKRRPSRPHMFPKML
320 330 340 350 360 370
590 600 610 620
pF1KB3 GALVELRKICTLGLQRIFYLKLEDLVSPPSIIDKLF-----LDTLPF
...::.: . : .:.. ::.: : : .:.... ::::
CCDS11 MKITDLRSISAKGAERVITLKMEIPGSMPPLIQEMLENSEGLDTLSGQPGGGGRDGGGLA
380 390 400 410 420 430
CCDS11 PPPGSCSPSLSPSSNRSSPATHSP
440 450 460
>>CCDS42317.1 RARA gene_id:5914|Hs108|chr17 (457 aa)
initn: 482 init1: 362 opt: 674 Z-score: 367.4 bits: 77.7 E(32554): 3.8e-14
Smith-Waterman score: 674; 34.8% identity (59.6% similar) in 396 aa overlap (244-624:33-418)
220 230 240 250 260 270
pF1KB3 DPTAAAALSLPLGAAAAAGSQAAALEGHPYGLPL-AKRAAPLAFPPL-GLTPSPTASSLL
::: . ..:: : : . : ..:
CCDS42 ESVEVGGPTPNPFLVVDFYNQNRACLLPEKGLPAPGPYSTPLRTPLWNGSNHSIETQSSS
10 20 30 40 50 60
280 290 300 310 320
pF1KB3 GES--PSLPSPPSRSSSSGEGTCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCL
.: :: :::: : :: :... :::: .::::::::.:..::: :.:
CCDS42 SEEIVPSPPSPPPLPRIYK--PCFVCQDKSSGYHYGVSACEGCKGFFRRSIQKNMVYTCH
70 80 90 100 110 120
330 340 350 360 370 380
pF1KB3 ANKNCPVDKRRRNRCQYCRFQKCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQP
.::: ..: ::::::::.:::. ::: :: ::.: : .. ..: :: : :.
CCDS42 RDKNCIINKVTRNRCQYCRLQKCFEVGMSKESVRNDRNK-KKKEVP-KP------ECSES
130 140 150 160 170
390 400 410 420 430 440
pF1KB3 SPPSPPICMMNALVR-ALTDSTPRDLDYSRYCPTDQAA--AGTDAEHVQQFYNLLTASID
.: . . :: : .. : . ..: .... .. : . ..: .: : :
CCDS42 YTLTPEVGELIEKVRKAHQETFPALCQLGKYTTNNSSEQRVSLDIDLWDKFSELSTKCII
180 190 200 210 220 230
450 460 470 480 490 500
pF1KB3 VSRSWAEKIPGFTDLPKEDQTLLIESAFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQC
. .:...:::: : :: :...: :....::. : . .: ..: .::.:.: :
CCDS42 KTVEFAKQLPGFTTLTIADQITLLKAACLDILILRICTRYTPEQDTMTFSDGLTLNRTQM
240 250 260 270 280 290
510 520 530 540 550 560
pF1KB3 LR-GFGEWLDSIKDFSLNLQSLNLDIQALACLSALSMIT-ERHGLKEPKRVEELCNKITS
::: : . :. .: :..: . :::. .: .:. :..: ::. : . .
CCDS42 HNAGFGPLTDLVFAFANQLLPLEMDDAETGLLSAICLICGDRQDLEQPDRVDMLQEPLLE
300 310 320 330 340 350
570 580 590 600 610 620
pF1KB3 SLKDHQSKGQALEPTE-SKVLGALVELRKICTLGLQRIFYLKLEDLVSPPSIIDKLF---
.:: . : . .: :.: ...::.: . : .:.. ::.: : : .:....
CCDS42 ALKVYVRKRRPSRPHMFPKMLMKITDLRSISAKGAERVITLKMEIPGSMPPLIQEMLENS
360 370 380 390 400 410
pF1KB3 --LDTLPF
::::
CCDS42 EGLDTLSGQPGGGGRDGGGLAPPPGSCSPSLSPSSNRSSPATHSP
420 430 440 450
>>CCDS2642.1 RARB gene_id:5915|Hs108|chr3 (448 aa)
initn: 494 init1: 347 opt: 663 Z-score: 361.9 bits: 76.6 E(32554): 7.7e-14
Smith-Waterman score: 663; 34.3% identity (59.6% similar) in 364 aa overlap (266-623:59-410)
240 250 260 270 280 290
pF1KB3 AALEGHPYGLPLAKRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSGEGTCAVC
:.: : :: : :: : . : ::
CCDS26 QEKALKACFSGLTQTEWQHRHTAQSIETQSTSSEELVPSPPSPLPPPRVYKP----CFVC
30 40 50 60 70 80
300 310 320 330 340 350
pF1KB3 GDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQKCLSV
:... :::: .::::::::.:..::: :.: .::: ..: ::::::::.:::. :
CCDS26 QDKSSGYHYGVSACEGCKGFFRRSIQKNMIYTCHRDKNCVINKVTRNRCQYCRLQKCFEV
90 100 110 120 130 140
360 370 380 390 400 410
pF1KB3 GMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVR-ALTDSTPRDL
:: :: ::.: : : : .:: .. . . .. .: : .. :
CCDS26 GMSKESVRNDRNK--------KKKETSKQECTESYEMTAELDDLTEKIRKAHQETFPSLC
150 160 170 180 190
420 430 440 450 460 470
pF1KB3 DYSRYCPTDQAA--AGTDAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLPKEDQTLLIES
. ..: ...: . : ..: .: : : .:...:::: : :: :...
CCDS26 QLGKYTTNSSADHRVRLDLGLWDKFSELATKCIIKIVEFAKRLPGFTGLTIADQITLLKA
200 210 220 230 240 250
480 490 500 510 520 530
pF1KB3 AFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQCLR-GFGEWLDSIKDFSLNLQSLNLDI
: :....::. : . .: ..: .::.:.: : ::: : . :. .: :..:
CCDS26 ACLDILILRICTRYTPEQDTMTFSDGLTLNRTQMHNAGFGPLTDLVFTFANQLLPLEMDD
260 270 280 290 300 310
540 550 560 570 580
pF1KB3 QALACLSALSMIT-ERHGLKEPKRVEELCNKITSSLKDHQSKGQALEPTE-SKVLGALVE
. :::. .: .:. :.:: .:..: . . .:: . : . .: :.: ...
CCDS26 TETGLLSAICLICGDRQDLEEPTKVDKLQEPLLEALKIYIRKRRPSKPHMFPKILMKITD
320 330 340 350 360 370
590 600 610 620
pF1KB3 LRKICTLGLQRIFYLKLEDLVSPPSIIDKLFLDTLPF
::.: . : .:.. ::.: : : .:.... ..
CCDS26 LRSISAKGAERVITLKMEIPGSMPPLIQEMLENSEGHEPLTPSSSGNTAEHSPSISPSSV
380 390 400 410 420 430
CCDS26 ENSGVSQSPLVQ
440
626 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 12:47:34 2016 done: Thu Nov 3 12:47:34 2016
Total Scan time: 3.100 Total Display time: 0.110
Function used was FASTA [36.3.4 Apr, 2011]