FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1384, 598 aa 1>>>pF1KE1384 598 - 598 aa - 598 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.9819+/-0.000912; mu= -0.4462+/- 0.055 mean_var=305.8623+/-61.960, 0's: 0 Z-trim(115.8): 116 B-trim: 0 in 0/55 Lambda= 0.073335 statistics sampled from 16215 (16331) to 16215 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.803), E-opt: 0.2 (0.502), width: 16 Scan time: 4.110 The best scores are: opt bits E(32554) CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 ( 598) 4124 449.9 4.3e-126 CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 ( 611) 4124 449.9 4.4e-126 CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12 ( 652) 4124 449.9 4.6e-126 CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 ( 598) 1922 216.9 5.8e-56 CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 ( 626) 1544 176.9 6.6e-44 CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 ( 637) 1544 177.0 6.7e-44 CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 ( 443) 727 90.4 5.4e-18 CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 725 90.2 6.3e-18 CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 720 89.6 8.1e-18 CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 720 89.6 9e-18 CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 693 86.8 6.6e-17 CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 ( 533) 691 86.6 8.6e-17 CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 678 85.2 2e-16 CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 677 85.1 2.2e-16 CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 ( 537) 677 85.2 2.4e-16 CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 674 84.8 2.7e-16 CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 ( 423) 644 81.6 2.3e-15 CCDS1517.1 ESRRG gene_id:2104|Hs108|chr1 ( 435) 635 80.6 4.5e-15 CCDS41468.1 ESRRG gene_id:2104|Hs108|chr1 ( 458) 635 80.7 4.7e-15 CCDS9850.2 ESRRB gene_id:2103|Hs108|chr14 ( 508) 635 80.7 5.1e-15 CCDS58237.1 RARG gene_id:5916|Hs108|chr12 ( 432) 628 79.9 7.5e-15 CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 ( 414) 595 76.4 8.2e-14 CCDS58061.1 ESRRG gene_id:2104|Hs108|chr1 ( 470) 550 71.7 2.4e-12 CCDS46775.1 RARB gene_id:5915|Hs108|chr3 ( 336) 521 68.5 1.6e-11 CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 ( 463) 524 68.9 1.6e-11 CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 ( 340) 509 67.2 3.9e-11 >>CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 (598 aa) initn: 4124 init1: 4124 opt: 4124 Z-score: 2377.2 bits: 449.9 E(32554): 4.3e-126 Smith-Waterman score: 4124; 100.0% identity (100.0% similar) in 598 aa overlap (1-598:1-598) 10 20 30 40 50 60 pF1KE1 MPCIQAQYGTPAPSPGPRDHLASDPLTPEFIKPTMDLASPEAAPAAPTALPSFSTFMDGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 MPCIQAQYGTPAPSPGPRDHLASDPLTPEFIKPTMDLASPEAAPAAPTALPSFSTFMDGY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 TGEFDTFLYQLPGTVQPCSSASSSASSTSSSSATSPASASFKFEDFQVYGCYPGPLSGPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 TGEFDTFLYQLPGTVQPCSSASSSASSTSSSSATSPASASFKFEDFQVYGCYPGPLSGPV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 DEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSPWDGSFGHFSPSQTYEGLRAWTEQLPKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 DEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSPWDGSFGHFSPSQTYEGLRAWTEQLPKA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 SGPPQPPAFFSFSPPTGPSPSLAQSPLKLFPSQATHQLGEGESYSMPTAFPGLAPTSPHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 SGPPQPPAFFSFSPPTGPSPSLAQSPLKLFPSQATHQLGEGESYSMPTAFPGLAPTSPHL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 EGSGILDTPVTSTKARSGAPGGSEGRCAVCGDNASCQHYGVRTCEGCKGFFKRTVQKNAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 EGSGILDTPVTSTKARSGAPGGSEGRCAVCGDNASCQHYGVRTCEGCKGFFKRTVQKNAK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 YICLANKDCPVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQPPDAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 YICLANKDCPVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQPPDAS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 PANLLTSLVRAHLDSGPSTAKLDYSKFQELVLPHFGKEDAGDVQQFYDLLSGSLEVIRKW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 PANLLTSLVRAHLDSGPSTAKLDYSKFQELVLPHFGKEDAGDVQQFYDLLSGSLEVIRKW 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE1 AEKIPGFAELSPADQDLLLESAFLELFILRLAYRSKPGEGKLIFCSGLVLHRLQCARGFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 AEKIPGFAELSPADQDLLLESAFLELFILRLAYRSKPGEGKLIFCSGLVLHRLQCARGFG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE1 DWIDSILAFSRSLHSLLVDVPAFACLSALVLITDRHGLQEPRRVEELQNRIASCLKEHVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 DWIDSILAFSRSLHSLLVDVPAFACLSALVLITDRHGLQEPRRVEELQNRIASCLKEHVA 490 500 510 520 530 540 550 560 570 580 590 pF1KE1 AVAGEPQPASCLSRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPIIDKIFMDTLPF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 AVAGEPQPASCLSRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPIIDKIFMDTLPF 550 560 570 580 590 >>CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 (611 aa) initn: 4124 init1: 4124 opt: 4124 Z-score: 2377.1 bits: 449.9 E(32554): 4.4e-126 Smith-Waterman score: 4124; 100.0% identity (100.0% similar) in 598 aa overlap (1-598:14-611) 10 20 30 40 pF1KE1 MPCIQAQYGTPAPSPGPRDHLASDPLTPEFIKPTMDLASPEAAPAAP ::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MWLAKACWSIQSEMPCIQAQYGTPAPSPGPRDHLASDPLTPEFIKPTMDLASPEAAPAAP 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE1 TALPSFSTFMDGYTGEFDTFLYQLPGTVQPCSSASSSASSTSSSSATSPASASFKFEDFQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 TALPSFSTFMDGYTGEFDTFLYQLPGTVQPCSSASSSASSTSSSSATSPASASFKFEDFQ 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE1 VYGCYPGPLSGPVDEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSPWDGSFGHFSPSQTY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VYGCYPGPLSGPVDEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSPWDGSFGHFSPSQTY 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE1 EGLRAWTEQLPKASGPPQPPAFFSFSPPTGPSPSLAQSPLKLFPSQATHQLGEGESYSMP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 EGLRAWTEQLPKASGPPQPPAFFSFSPPTGPSPSLAQSPLKLFPSQATHQLGEGESYSMP 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE1 TAFPGLAPTSPHLEGSGILDTPVTSTKARSGAPGGSEGRCAVCGDNASCQHYGVRTCEGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 TAFPGLAPTSPHLEGSGILDTPVTSTKARSGAPGGSEGRCAVCGDNASCQHYGVRTCEGC 250 260 270 280 290 300 290 300 310 320 330 340 pF1KE1 KGFFKRTVQKNAKYICLANKDCPVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 KGFFKRTVQKNAKYICLANKDCPVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRG 310 320 330 340 350 360 350 360 370 380 390 400 pF1KE1 RLPSKPKQPPDASPANLLTSLVRAHLDSGPSTAKLDYSKFQELVLPHFGKEDAGDVQQFY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RLPSKPKQPPDASPANLLTSLVRAHLDSGPSTAKLDYSKFQELVLPHFGKEDAGDVQQFY 370 380 390 400 410 420 410 420 430 440 450 460 pF1KE1 DLLSGSLEVIRKWAEKIPGFAELSPADQDLLLESAFLELFILRLAYRSKPGEGKLIFCSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 DLLSGSLEVIRKWAEKIPGFAELSPADQDLLLESAFLELFILRLAYRSKPGEGKLIFCSG 430 440 450 460 470 480 470 480 490 500 510 520 pF1KE1 LVLHRLQCARGFGDWIDSILAFSRSLHSLLVDVPAFACLSALVLITDRHGLQEPRRVEEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LVLHRLQCARGFGDWIDSILAFSRSLHSLLVDVPAFACLSALVLITDRHGLQEPRRVEEL 490 500 510 520 530 540 530 540 550 560 570 580 pF1KE1 QNRIASCLKEHVAAVAGEPQPASCLSRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 QNRIASCLKEHVAAVAGEPQPASCLSRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPI 550 560 570 580 590 600 590 pF1KE1 IDKIFMDTLPF ::::::::::: CCDS55 IDKIFMDTLPF 610 >>CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12 (652 aa) initn: 4124 init1: 4124 opt: 4124 Z-score: 2376.7 bits: 449.9 E(32554): 4.6e-126 Smith-Waterman score: 4124; 100.0% identity (100.0% similar) in 598 aa overlap (1-598:55-652) 10 20 30 pF1KE1 MPCIQAQYGTPAPSPGPRDHLASDPLTPEF :::::::::::::::::::::::::::::: CCDS73 PPRQPGSFCWALKADGIMWLAKACWSIQSEMPCIQAQYGTPAPSPGPRDHLASDPLTPEF 30 40 50 60 70 80 40 50 60 70 80 90 pF1KE1 IKPTMDLASPEAAPAAPTALPSFSTFMDGYTGEFDTFLYQLPGTVQPCSSASSSASSTSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 IKPTMDLASPEAAPAAPTALPSFSTFMDGYTGEFDTFLYQLPGTVQPCSSASSSASSTSS 90 100 110 120 130 140 100 110 120 130 140 150 pF1KE1 SSATSPASASFKFEDFQVYGCYPGPLSGPVDEALSSSGSDYYGSPCSAPSPSTPSFQPPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 SSATSPASASFKFEDFQVYGCYPGPLSGPVDEALSSSGSDYYGSPCSAPSPSTPSFQPPQ 150 160 170 180 190 200 160 170 180 190 200 210 pF1KE1 LSPWDGSFGHFSPSQTYEGLRAWTEQLPKASGPPQPPAFFSFSPPTGPSPSLAQSPLKLF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 LSPWDGSFGHFSPSQTYEGLRAWTEQLPKASGPPQPPAFFSFSPPTGPSPSLAQSPLKLF 210 220 230 240 250 260 220 230 240 250 260 270 pF1KE1 PSQATHQLGEGESYSMPTAFPGLAPTSPHLEGSGILDTPVTSTKARSGAPGGSEGRCAVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 PSQATHQLGEGESYSMPTAFPGLAPTSPHLEGSGILDTPVTSTKARSGAPGGSEGRCAVC 270 280 290 300 310 320 280 290 300 310 320 330 pF1KE1 GDNASCQHYGVRTCEGCKGFFKRTVQKNAKYICLANKDCPVDKRRRNRCQFCRFQKCLAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 GDNASCQHYGVRTCEGCKGFFKRTVQKNAKYICLANKDCPVDKRRRNRCQFCRFQKCLAV 330 340 350 360 370 380 340 350 360 370 380 390 pF1KE1 GMVKEVVRTDSLKGRRGRLPSKPKQPPDASPANLLTSLVRAHLDSGPSTAKLDYSKFQEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 GMVKEVVRTDSLKGRRGRLPSKPKQPPDASPANLLTSLVRAHLDSGPSTAKLDYSKFQEL 390 400 410 420 430 440 400 410 420 430 440 450 pF1KE1 VLPHFGKEDAGDVQQFYDLLSGSLEVIRKWAEKIPGFAELSPADQDLLLESAFLELFILR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 VLPHFGKEDAGDVQQFYDLLSGSLEVIRKWAEKIPGFAELSPADQDLLLESAFLELFILR 450 460 470 480 490 500 460 470 480 490 500 510 pF1KE1 LAYRSKPGEGKLIFCSGLVLHRLQCARGFGDWIDSILAFSRSLHSLLVDVPAFACLSALV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 LAYRSKPGEGKLIFCSGLVLHRLQCARGFGDWIDSILAFSRSLHSLLVDVPAFACLSALV 510 520 530 540 550 560 520 530 540 550 560 570 pF1KE1 LITDRHGLQEPRRVEELQNRIASCLKEHVAAVAGEPQPASCLSRLLGKLPELRTLCTQGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 LITDRHGLQEPRRVEELQNRIASCLKEHVAAVAGEPQPASCLSRLLGKLPELRTLCTQGL 570 580 590 600 610 620 580 590 pF1KE1 QRIFYLKLEDLVPPPPIIDKIFMDTLPF :::::::::::::::::::::::::::: CCDS73 QRIFYLKLEDLVPPPPIIDKIFMDTLPF 630 640 650 >>CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 (598 aa) initn: 1349 init1: 1124 opt: 1922 Z-score: 1118.1 bits: 216.9 E(32554): 5.8e-56 Smith-Waterman score: 2117; 55.2% identity (75.2% similar) in 632 aa overlap (1-598:1-598) 10 20 30 40 50 pF1KE1 MPCIQAQYGT-P-APSPGPRDH-------LASDPLTPEFIKPTMDLASPEAAPAAPTALP :::.:::::. : . ::. ... .:: :::::.: .:::.. : . : :.:: CCDS22 MPCVQAQYGSSPQGASPASQSYSYHSSGEYSSDFLTPEFVKFSMDLTNTEIT--ATTSLP 10 20 30 40 50 60 70 80 90 100 pF1KE1 SFSTFMDGYTGEFDT---FLYQLPGTVQPCSSASSSASSTSSSSATSPASASFKFEDFQV :::::::.:. .:. :::.: . : ..:.: ::.:. CCDS22 SFSTFMDNYSTGYDVKPPCLYQMPLSGQ---------------------QSSIKVEDIQM 60 70 80 90 110 120 130 140 150 160 pF1KE1 YGCYPGPLSGP-VDEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSP-WD--GSFGHFSPS .. : .: . ::: :: .: : :.:.::.:: : :: :: ::. .: CCDS22 HNYQQHSHLPPQSEEMMPHSGSVYY-KPSSPPTPTTPGFQV-QHSPMWDDPGSLHNFH-- 100 110 120 130 140 150 170 180 190 200 210 pF1KE1 QTYEGLRAWTEQLPKASGPPQPPAFFSF--SPPTGPSPSLAQ---SPLK--LFPSQA-TH :.: : :... . . : . ..::: ::: : : . .::. . : : .: CCDS22 QNYV---ATTHMIEQRKTPVSRLSLFSFKQSPPGTPVSSCQMRFDGPLHVPMNPEPAGSH 160 170 180 190 200 210 220 230 240 250 260 270 pF1KE1 QLGEGESYSMPTAFPGLAPTS---PHLE---GSGILDTPVTSTKARSGAPGGSEGRCAVC .. .:.....:. : :.: : :. .: .::: : : .: :.:. .:: :::: CCDS22 HVVDGQTFAVPN--PIRKPASMGFPGLQIGHASQLLDTQVPSPPSR-GSPS-NEGLCAVC 220 230 240 250 260 280 290 300 310 320 330 pF1KE1 GDNASCQHYGVRTCEGCKGFFKRTVQKNAKYICLANKDCPVDKRRRNRCQFCRFQKCLAV ::::.::::::::::::::::::::::::::.:::::.::::::::::::.::::::::: CCDS22 GDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQKCLAV 270 280 290 300 310 320 340 350 360 370 380 pF1KE1 GMVKEVVRTDSLKGRRGRLPSKPKQP----PDASPANLLTSLVRAHLDSGPSTAKLDYSK ::::::::::::::::::::::::.: : . :..:...:::::.::.:. ..::::. CCDS22 GMVKEVVRTDSLKGRRGRLPSKPKSPQEPSPPSPPVSLISALVRAHVDSNPAMTSLDYSR 330 340 350 360 370 380 390 400 410 420 430 440 pF1KE1 FQELVLPHFGKEDAGDVQQFYDLLSGSLEVIRKWAEKIPGFAELSPADQDLLLESAFLEL :: ... .:. .:::::::.::.:.:: :::::::::.: ::::::.::::::: CCDS22 FQANPDYQMSGDDTQHIQQFYDLLTGSMEIIRGWAEKIPGFADLPKADQDLLFESAFLEL 390 400 410 420 430 440 450 460 470 480 490 500 pF1KE1 FILRLAYRSKPGEGKLIFCSGLVLHRLQCARGFGDWIDSILAFSRSLHSLLVDVPAFACL :.:::::::.: :::::::.:.:::::::.::::.:::::. :: .:... .:. ::.:. CCDS22 FVLRLAYRSNPVEGKLIFCNGVVLHRLQCVRGFGEWIDSIVEFSSNLQNMNIDISAFSCI 450 460 470 480 490 500 510 520 530 540 550 560 pF1KE1 SALVLITDRHGLQEPRRVEELQNRIASCLKEHVAAVAGEPQPASCLSRLLGKLPELRTLC .::...:.::::.::.:::::::.:..:::.::. : . . ::.:::::::::::: CCDS22 AALAMVTERHGLKEPKRVEELQNKIVNCLKDHVTFNNGGLNRPNYLSKLLGKLPELRTLC 510 520 530 540 550 560 570 580 590 pF1KE1 TQGLQRIFYLKLEDLVPPPPIIDKIFMDTLPF ::::::::::::::::::: ::::.:.::::: CCDS22 TQGLQRIFYLKLEDLVPPPAIIDKLFLDTLPF 570 580 590 >>CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 (626 aa) initn: 1692 init1: 655 opt: 1544 Z-score: 901.7 bits: 176.9 E(32554): 6.6e-44 Smith-Waterman score: 1798; 48.9% identity (68.1% similar) in 648 aa overlap (1-598:1-626) 10 20 30 40 50 pF1KE1 MPCIQAQYGTPAPSPGPR-------DHLASDPLTPEFIKPTMDLASPEAAPAAPTALPSF :::.:::: .:.: :: .. ... ..:.. : ::::.: : . .: :.:::. CCDS67 MPCVQAQY-SPSP-PGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEITATATTSLPSI 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 STFMDGYTGEFD---TFLYQLPGTVQPCSSASSSASSTSSSSATSPASASFKFEDFQVYG :::..::..... . .::. .: .. . . . . .. . CCDS67 STFVEGYSSNYELKPSCVYQMQ---RPLIKVEEGRAPSYHHHHHHHHHHHHHHQQQHQQP 60 70 80 90 100 110 120 130 140 150 160 pF1KE1 CYPGPLSGPVDEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSP-WDGSFGHFSPSQTYEG : : :.: ::.: :.. . :: : .:.::.: ::: . :: .. .:. : CCDS67 SIP-PASSPEDEVLPSTSMYFKQSPPS--TPTTPAF-PPQAGALWDEALPS-APGCIAPG 120 130 140 150 160 170 170 180 190 200 210 pF1KE1 --LRAWTEQLPKASGPPQPPAFFSFSPPTGPSPS------LAQSPLKL----FPSQATHQ : . .: ..: : :. ::: :.:: :. .: .: :. CCDS67 PLLDPPMKAVPTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAAA 180 190 200 210 220 230 220 230 240 250 260 pF1KE1 LG------EGESYSMPTA-------FP--GLAPTSPHLEGSGIL-DTP-VTSTKARSGAP : :.. :..: : :: ::.: :: .:..: ..: . : .::.. CCDS67 AGSQAAALESHPYGLPLAKRAAPLAFPPLGLTP-SP--TASSLLGESPSLPSPPSRSSSS 240 250 260 270 280 270 280 290 300 310 320 pF1KE1 GGSEGRCAVCGDNASCQHYGVRTCEGCKGFFKRTVQKNAKYICLANKDCPVDKRRRNRCQ : :: ::::::::.::::::::::::::::::::::::::.:::::.:::::::::::: CCDS67 G--EGTCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQ 290 300 310 320 330 340 330 340 350 360 370 pF1KE1 FCRFQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQP---------PDASPANLLTSLVRA .:::::::.:::::::::::::::::::::::::.: : . : ....:::: CCDS67 YCRFQKCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRA 350 360 370 380 390 400 380 390 400 410 420 430 pF1KE1 HLDSGPSTAKLDYSKFQELVLPHFGKEDAGDVQQFYDLLSGSLEVIRKWAEKIPGFAELS :: : ::::.. : :: :::::.::..:..: :.::::::::..: CCDS67 LTDSTPRD--LDYSRYCPTDQAAAGT-DAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLP 410 420 430 440 450 460 440 450 460 470 480 490 pF1KE1 PADQDLLLESAFLELFILRLAYRSKPGEGKLIFCSGLVLHRLQCARGFGDWIDSILAFSR :: ::.::::::::.:::. ::. .: :..::.::::::::: ::::.:.::: :: CCDS67 KEDQTLLIESAFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQCLRGFGEWLDSIKDFSL 470 480 490 500 510 520 500 510 520 530 540 550 pF1KE1 SLHSLLVDVPAFACLSALVLITDRHGLQEPRRVEELQNRIASCLKEHVA-AVAGEPQPAS .:.:: .:. :.:::::: .::.::::.::.::::: :.:.: ::.: . . : :: CCDS67 NLQSLNLDIQALACLSALSMITERHGLKEPKRVEELCNKITSSLKDHQSKGQALEPTE-- 530 540 550 560 570 580 560 570 580 590 pF1KE1 CLSRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPIIDKIFMDTLPF :..:: : ::: .:: :::::::::::::: :: ::::.:.::::: CCDS67 --SKVLGALVELRKICTLGLQRIFYLKLEDLVSPPSIIDKLFLDTLPF 590 600 610 620 >>CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 (637 aa) initn: 1692 init1: 655 opt: 1544 Z-score: 901.6 bits: 177.0 E(32554): 6.7e-44 Smith-Waterman score: 1798; 48.9% identity (68.1% similar) in 648 aa overlap (1-598:12-637) 10 20 30 40 pF1KE1 MPCIQAQYGTPAPSPGPR-------DHLASDPLTPEFIKPTMDLASPEA :::.:::: .:.: :: .. ... ..:.. : ::::.: : CCDS67 MHDSIRFGNVDMPCVQAQY-SPSP-PGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEI 10 20 30 40 50 50 60 70 80 90 pF1KE1 APAAPTALPSFSTFMDGYTGEFD---TFLYQLPGTVQPCSSASSSASSTSSSSATSPASA . .: :.:::.:::..::..... . .::. .: .. . . . CCDS67 TATATTSLPSISTFVEGYSSNYELKPSCVYQMQ---RPLIKVEEGRAPSYHHHHHHHHHH 60 70 80 90 100 110 100 110 120 130 140 150 pF1KE1 SFKFEDFQVYGCYPGPLSGPVDEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSP-WDGSF . .. . : : :.: ::.: :.. . :: : .:.::.: ::: . :: .. CCDS67 HHHHQQQHQQPSIP-PASSPEDEVLPSTSMYFKQSPPS--TPTTPAF-PPQAGALWDEAL 120 130 140 150 160 170 160 170 180 190 200 pF1KE1 GHFSPSQTYEG--LRAWTEQLPKASGPPQPPAFFSFSPPTGPSPS------LAQSPLKL- .:. : : . .: ..: : :. ::: :.:: :. .: CCDS67 PS-APGCIAPGPLLDPPMKAVPTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAA 180 190 200 210 220 230 210 220 230 240 pF1KE1 ---FPSQATHQLG------EGESYSMPTA-------FP--GLAPTSPHLEGSGIL-DTP- .: :. : :.. :..: : :: ::.: :: .:..: ..: CCDS67 ALSLPLGAAAAAGSQAAALESHPYGLPLAKRAAPLAFPPLGLTP-SP--TASSLLGESPS 240 250 260 270 280 250 260 270 280 290 300 pF1KE1 VTSTKARSGAPGGSEGRCAVCGDNASCQHYGVRTCEGCKGFFKRTVQKNAKYICLANKDC . : .::.. : :: ::::::::.::::::::::::::::::::::::::.:::::.: CCDS67 LPSPPSRSSSSG--EGTCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNC 290 300 310 320 330 340 310 320 330 340 350 360 pF1KE1 PVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQP---------PDAS :::::::::::.:::::::.:::::::::::::::::::::::::.: : . CCDS67 PVDKRRRNRCQYCRFQKCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSP 350 360 370 380 390 400 370 380 390 400 410 420 pF1KE1 PANLLTSLVRAHLDSGPSTAKLDYSKFQELVLPHFGKEDAGDVQQFYDLLSGSLEVIRKW : ....:::: :: : ::::.. : :: :::::.::..:..: :.: CCDS67 PICMMNALVRALTDSTPRD--LDYSRYCPTDQAAAGT-DAEHVQQFYNLLTASIDVSRSW 410 420 430 440 450 460 430 440 450 460 470 480 pF1KE1 AEKIPGFAELSPADQDLLLESAFLELFILRLAYRSKPGEGKLIFCSGLVLHRLQCARGFG :::::::..: :: ::.::::::::.:::. ::. .: :..::.::::::::: :::: CCDS67 AEKIPGFTDLPKEDQTLLIESAFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQCLRGFG 470 480 490 500 510 520 490 500 510 520 530 540 pF1KE1 DWIDSILAFSRSLHSLLVDVPAFACLSALVLITDRHGLQEPRRVEELQNRIASCLKEHVA .:.::: :: .:.:: .:. :.:::::: .::.::::.::.::::: :.:.: ::.: . CCDS67 EWLDSIKDFSLNLQSLNLDIQALACLSALSMITERHGLKEPKRVEELCNKITSSLKDHQS 530 540 550 560 570 580 550 560 570 580 590 pF1KE1 -AVAGEPQPASCLSRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPIIDKIFMDTLPF . : :: :..:: : ::: .:: :::::::::::::: :: ::::.:.::::: CCDS67 KGQALEPTE----SKVLGALVELRKICTLGLQRIFYLKLEDLVSPPSIIDKLFLDTLPF 590 600 610 620 630 >>CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 (443 aa) initn: 852 init1: 648 opt: 727 Z-score: 436.5 bits: 90.4 E(32554): 5.4e-18 Smith-Waterman score: 981; 41.6% identity (61.5% similar) in 447 aa overlap (1-401:1-432) 10 20 30 40 50 pF1KE1 MPCIQAQYGTPAPSPGPR-------DHLASDPLTPEFIKPTMDLASPEAAPAAPTALPSF :::.:::: .:.: :: .. ... ..:.. : ::::.: : . .: :.:::. CCDS67 MPCVQAQY-SPSP-PGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEITATATTSLPSI 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 STFMDGYTGEFD---TFLYQLPGTVQPCSSASSSASSTSSSSATSPASASFKFEDFQVYG :::..::..... . .::. .: .. . . . . .. . CCDS67 STFVEGYSSNYELKPSCVYQMQ---RPLIKVEEGRAPSYHHHHHHHHHHHHHHQQQHQQP 60 70 80 90 100 110 120 130 140 150 160 pF1KE1 CYPGPLSGPVDEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSP-WDGSFGHFSPSQTYEG : : :.: ::.: :.. . :: : .:.::.: ::: . :: .. .:. : CCDS67 SIP-PASSPEDEVLPSTSMYFKQSPPS--TPTTPAF-PPQAGALWDEALPS-APGCIAPG 120 130 140 150 160 170 170 180 190 200 210 pF1KE1 --LRAWTEQLPKASGPPQPPAFFSFSPPTGPSPS------LAQSPLKL----FPSQATHQ : . .: ..: : :. ::: :.:: :. .: .: :. CCDS67 PLLDPPMKAVPTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAAA 180 190 200 210 220 230 220 230 240 250 260 pF1KE1 LG------EGESYSMPTA-------FPGLAPTSPHLEGSGILDTP-VTSTKARSGAPGGS : :.. :..: : :: :. : .: . ..: . : .::.. : CCDS67 AGSQAAALESHPYGLPLAKRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSG-- 240 250 260 270 280 270 280 290 300 310 320 pF1KE1 EGRCAVCGDNASCQHYGVRTCEGCKGFFKRTVQKNAKYICLANKDCPVDKRRRNRCQFCR :: ::::::::.::::::::::::::::::::::::::.:::::.::::::::::::.:: CCDS67 EGTCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCR 290 300 310 320 330 340 330 340 350 360 370 pF1KE1 FQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQP---------PDASPANLLTSLVRAHLD :::::.:::::::::::::::::::::::::.: : . : ....:::: : CCDS67 FQKCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRALTD 350 360 370 380 390 400 380 390 400 410 420 430 pF1KE1 SGPSTAKLDYSKFQELVLPHFGKEDAGDVQQFYDLLSGSLEVIRKWAEKIPGFAELSPAD : : ::::. . .. : .: : CCDS67 STPRD--LDYSRVSFMI-SCFQMNDQGLYLWLLVIRVD 410 420 430 440 >>CCDS8850.1 RARG gene_id:5916|Hs108|chr12 (454 aa) initn: 637 init1: 362 opt: 725 Z-score: 435.3 bits: 90.2 E(32554): 6.3e-18 Smith-Waterman score: 744; 35.0% identity (59.0% similar) in 432 aa overlap (202-598:1-422) 180 190 200 210 220 pF1KE1 AWTEQLPKASGPPQPPAFFSFSPPTGPSPSLAQSPLKLFPSQATHQLGEGESY---SMPT .: . .:: . : :: : .: ..: CCDS88 MATNKERLFAAGA---LGPGSGYPGAGFPF 10 20 230 240 250 260 pF1KE1 AFPGL---APT----SPHLEGSGILDTP---------VTSTKARSGAPGGSEGR------ :::: .: :: ..: : : : . ::... .:.. CCDS88 AFPGALRGSPPFEMLSPSFRGLGQPDLPKEMASLSVETQSTSSEEMVPSSPSPPPPPRVY 30 40 50 60 70 80 270 280 290 300 310 320 pF1KE1 --CAVCGDNASCQHYGVRTCEGCKGFFKRTVQKNAKYICLANKDCPVDKRRRNRCQFCRF : ::.:..: :::: .::::::::.:..::: : : .:.: ..: :::::.::. CCDS88 KPCFVCNDKSSGYHYGVSSCEGCKGFFRRSIQKNMVYTCHRDKNCIINKVTRNRCQYCRL 90 100 110 120 130 140 330 340 350 360 370 pF1KE1 QKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQPPDA---SPA--NLLTSLVRAHLDSGPST :::. ::: ::.::.: : .. : . ::. :: .:.:.. .:: .. :: CCDS88 QKCFEVGMSKEAVRNDRNKKKK---EVKEEGSPDSYELSPQLEELITKVSKAHQETFPSL 150 160 170 180 190 200 380 390 400 410 420 430 pF1KE1 AKLDYSKFQ-ELVLPHFGKEDAGDVQQFYDLLSGSLEVIRKWAEKIPGFAELSPADQDLL .: .:. . : . : : ..: .: . . : ..:...:::. :: ::: : CCDS88 CQL--GKYTTNSSADHRVQLDLGLWDKFSELATKCIIKIVEFAKRLPGFTGLSIADQITL 210 220 230 240 250 260 440 450 460 470 480 490 pF1KE1 LESAFLELFILRLAYRSKPGEGKLIFCSGLVLHRLQCAR-GFGDWIDSILAFSRSLHSLL :..: :....::. : : . . : .::.:.: : ::: : ..::. .: : CCDS88 LKAACLDILMLRICTRYTPEQDTMTFSDGLTLNRTQMHNAGFGPLTDLVFAFAGQLLPLE 270 280 290 300 310 320 500 510 520 530 540 550 pF1KE1 VDVPAFACLSALVLIT-DRHGLQEPRRVEELQNRIASCLKEHVAAVAGEPQPASCLSRLL .: . :::. :: :: :.::..:..::. . :. . : .:. . :.: CCDS88 MDDTETGLLSAICLICGDRMDLEEPEKVDKLQEPLLEALRLY--ARRRRPSQPYMFPRML 330 340 350 360 370 380 560 570 580 590 pF1KE1 GKLPELRTLCTQGLQRIFYLKLEDLVPPPPIIDKIFMDTLPF :. .:: . :.: .: . ::.: : ::.: ... . : CCDS88 MKITDLRGISTKGAERAITLKMEIPGPMPPLIREMLENPEMFEDDSSQPGPHPNASSEDE 390 400 410 420 430 440 CCDS88 VPGGQGKGGLKSPA 450 >>CCDS58236.1 RARG gene_id:5916|Hs108|chr12 (382 aa) initn: 660 init1: 362 opt: 720 Z-score: 433.4 bits: 89.6 E(32554): 8.1e-18 Smith-Waterman score: 720; 37.6% identity (63.2% similar) in 340 aa overlap (267-598:18-350) 240 250 260 270 280 290 pF1KE1 SPHLEGSGILDTPVTSTKARSGAPGGSEGRCAVCGDNASCQHYGVRTCEGCKGFFKRTVQ : ::.:..: :::: .::::::::.:..: CCDS58 MVPSSPSPPPPPRVYKPCFVCNDKSSGYHYGVSSCEGCKGFFRRSIQ 10 20 30 40 300 310 320 330 340 350 pF1KE1 KNAKYICLANKDCPVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQP :: : : .:.: ..: :::::.::.:::. ::: ::.::.: : .. : . CCDS58 KNMVYTCHRDKNCIINKVTRNRCQYCRLQKCFEVGMSKEAVRNDRNKKKK---EVKEEGS 50 60 70 80 90 100 360 370 380 390 400 410 pF1KE1 PDA---SPA--NLLTSLVRAHLDSGPSTAKLDYSKFQ-ELVLPHFGKEDAGDVQQFYDLL ::. :: .:.:.. .:: .. :: .: .:. . : . : : ..: .: CCDS58 PDSYELSPQLEELITKVSKAHQETFPSLCQL--GKYTTNSSADHRVQLDLGLWDKFSELA 110 120 130 140 150 160 420 430 440 450 460 470 pF1KE1 SGSLEVIRKWAEKIPGFAELSPADQDLLLESAFLELFILRLAYRSKPGEGKLIFCSGLVL . . : ..:...:::. :: ::: ::..: :....::. : : . . : .::.: CCDS58 TKCIIKIVEFAKRLPGFTGLSIADQITLLKAACLDILMLRICTRYTPEQDTMTFSDGLTL 170 180 190 200 210 220 480 490 500 510 520 pF1KE1 HRLQCAR-GFGDWIDSILAFSRSLHSLLVDVPAFACLSALVLIT-DRHGLQEPRRVEELQ .: : ::: : ..::. .: : .: . :::. :: :: :.::..:..:: CCDS58 NRTQMHNAGFGPLTDLVFAFAGQLLPLEMDDTETGLLSAICLICGDRMDLEEPEKVDKLQ 230 240 250 260 270 280 530 540 550 560 570 580 pF1KE1 NRIASCLKEHVAAVAGEPQPASCLSRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPII . . :. . : .:. . :.: :. .:: . :.: .: . ::.: : ::.: CCDS58 EPLLEALRLY--ARRRRPSQPYMFPRMLMKITDLRGISTKGAERAITLKMEIPGPMPPLI 290 300 310 320 330 340 590 pF1KE1 DKIFMDTLPF ... . : CCDS58 REMLENPEMFEDDSSQPGPHPNASSEDEVPGGQGKGGLKSPA 350 360 370 380 >>CCDS41790.1 RARG gene_id:5916|Hs108|chr12 (443 aa) initn: 682 init1: 362 opt: 720 Z-score: 432.5 bits: 89.6 E(32554): 9e-18 Smith-Waterman score: 720; 37.6% identity (63.2% similar) in 340 aa overlap (267-598:79-411) 240 250 260 270 280 290 pF1KE1 SPHLEGSGILDTPVTSTKARSGAPGGSEGRCAVCGDNASCQHYGVRTCEGCKGFFKRTVQ : ::.:..: :::: .::::::::.:..: CCDS41 LQSVETQSTSSEEMVPSSPSPPPPPRVYKPCFVCNDKSSGYHYGVSSCEGCKGFFRRSIQ 50 60 70 80 90 100 300 310 320 330 340 350 pF1KE1 KNAKYICLANKDCPVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQP :: : : .:.: ..: :::::.::.:::. ::: ::.::.: : .. : . CCDS41 KNMVYTCHRDKNCIINKVTRNRCQYCRLQKCFEVGMSKEAVRNDRNKKKK---EVKEEGS 110 120 130 140 150 160 360 370 380 390 400 410 pF1KE1 PDA---SPA--NLLTSLVRAHLDSGPSTAKLDYSKFQ-ELVLPHFGKEDAGDVQQFYDLL ::. :: .:.:.. .:: .. :: .: .:. . : . : : ..: .: CCDS41 PDSYELSPQLEELITKVSKAHQETFPSLCQL--GKYTTNSSADHRVQLDLGLWDKFSELA 170 180 190 200 210 220 420 430 440 450 460 470 pF1KE1 SGSLEVIRKWAEKIPGFAELSPADQDLLLESAFLELFILRLAYRSKPGEGKLIFCSGLVL . . : ..:...:::. :: ::: ::..: :....::. : : . . : .::.: CCDS41 TKCIIKIVEFAKRLPGFTGLSIADQITLLKAACLDILMLRICTRYTPEQDTMTFSDGLTL 230 240 250 260 270 280 480 490 500 510 520 pF1KE1 HRLQCAR-GFGDWIDSILAFSRSLHSLLVDVPAFACLSALVLIT-DRHGLQEPRRVEELQ .: : ::: : ..::. .: : .: . :::. :: :: :.::..:..:: CCDS41 NRTQMHNAGFGPLTDLVFAFAGQLLPLEMDDTETGLLSAICLICGDRMDLEEPEKVDKLQ 290 300 310 320 330 340 530 540 550 560 570 580 pF1KE1 NRIASCLKEHVAAVAGEPQPASCLSRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPII . . :. . : .:. . :.: :. .:: . :.: .: . ::.: : ::.: CCDS41 EPLLEALRLY--ARRRRPSQPYMFPRMLMKITDLRGISTKGAERAITLKMEIPGPMPPLI 350 360 370 380 390 400 590 pF1KE1 DKIFMDTLPF ... . : CCDS41 REMLENPEMFEDDSSQPGPHPNASSEDEVPGGQGKGGLKSPA 410 420 430 440 598 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 01:13:50 2016 done: Mon Nov 7 01:13:50 2016 Total Scan time: 4.110 Total Display time: 0.130 Function used was FASTA [36.3.4 Apr, 2011]