FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6166, 603 aa 1>>>pF1KB6166 603 - 603 aa - 603 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8970+/-0.00123; mu= 16.3980+/- 0.074 mean_var=83.9593+/-16.997, 0's: 0 Z-trim(102.8): 125 B-trim: 230 in 1/48 Lambda= 0.139972 statistics sampled from 7011 (7136) to 7011 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.584), E-opt: 0.2 (0.219), width: 16 Scan time: 3.070 The best scores are: opt bits E(32554) CCDS9051.1 NR2C1 gene_id:7181|Hs108|chr12 ( 603) 3977 813.7 0 CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 ( 483) 3075 631.5 7.7e-181 CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 ( 467) 3067 629.8 2.3e-180 CCDS74905.1 NR2C2 gene_id:7182|Hs108|chr3 ( 596) 1488 311.0 2.7e-84 CCDS2621.1 NR2C2 gene_id:7182|Hs108|chr3 ( 615) 1470 307.4 3.5e-83 CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 ( 463) 470 105.4 1.7e-22 CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 ( 340) 465 104.3 2.6e-22 CCDS45359.1 NR2F2 gene_id:7026|Hs108|chr15 ( 261) 442 99.6 5.3e-21 CCDS45358.1 NR2F2 gene_id:7026|Hs108|chr15 ( 281) 442 99.6 5.7e-21 CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 ( 533) 439 99.2 1.5e-20 CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 ( 537) 439 99.2 1.5e-20 CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 436 98.5 2e-20 CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20 ( 417) 431 97.5 3.6e-20 CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20 ( 464) 431 97.5 4e-20 CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20 ( 474) 431 97.5 4.1e-20 CCDS6220.2 HNF4G gene_id:3174|Hs108|chr8 ( 445) 424 96.1 1e-19 CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19 ( 404) 422 95.7 1.3e-19 CCDS68131.1 HNF4A gene_id:3172|Hs108|chr20 ( 395) 421 95.5 1.4e-19 CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 ( 423) 421 95.5 1.5e-19 CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20 ( 442) 421 95.5 1.6e-19 CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20 ( 449) 421 95.5 1.6e-19 CCDS42876.1 HNF4A gene_id:3172|Hs108|chr20 ( 452) 421 95.5 1.6e-19 CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 ( 414) 411 93.5 6e-19 CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 411 93.5 6.5e-19 CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 411 93.5 6.5e-19 CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 410 93.3 7.4e-19 CCDS83303.1 HNF4G gene_id:3174|Hs108|chr8 ( 408) 409 93.1 7.8e-19 CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 409 93.1 8.3e-19 CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 408 92.8 8.5e-19 CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 404 92.1 1.7e-18 CCDS45271.1 RORA gene_id:6095|Hs108|chr15 ( 468) 399 91.1 3.5e-18 CCDS10177.1 RORA gene_id:6095|Hs108|chr15 ( 523) 399 91.1 3.9e-18 CCDS10178.1 RORA gene_id:6095|Hs108|chr15 ( 548) 399 91.1 4e-18 CCDS10179.1 RORA gene_id:6095|Hs108|chr15 ( 556) 399 91.1 4.1e-18 CCDS30856.1 RORC gene_id:6097|Hs108|chr1 ( 497) 393 89.9 8.6e-18 CCDS1004.1 RORC gene_id:6097|Hs108|chr1 ( 518) 393 89.9 8.9e-18 CCDS73751.1 NR2E3 gene_id:10002|Hs108|chr15 ( 367) 367 84.5 2.6e-16 CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 ( 598) 369 85.1 2.9e-16 CCDS6646.1 RORB gene_id:6096|Hs108|chr9 ( 459) 367 84.6 3.1e-16 CCDS2610.2 PPARG gene_id:5468|Hs108|chr3 ( 477) 357 82.6 1.3e-15 CCDS2609.1 PPARG gene_id:5468|Hs108|chr3 ( 505) 357 82.6 1.3e-15 CCDS5063.1 NR2E1 gene_id:7101|Hs108|chr6 ( 385) 355 82.1 1.4e-15 CCDS9078.1 NR1H4 gene_id:9971|Hs108|chr12 ( 472) 353 81.8 2.2e-15 CCDS55875.1 NR1H4 gene_id:9971|Hs108|chr12 ( 482) 353 81.8 2.3e-15 CCDS42316.1 THRA gene_id:7067|Hs108|chr17 ( 410) 349 80.9 3.5e-15 CCDS58546.1 THRA gene_id:7067|Hs108|chr17 ( 451) 349 81.0 3.8e-15 CCDS11360.1 THRA gene_id:7067|Hs108|chr17 ( 490) 349 81.0 4e-15 CCDS69165.1 NR2E1 gene_id:7101|Hs108|chr6 ( 422) 348 80.7 4.1e-15 CCDS2641.1 THRB gene_id:7068|Hs108|chr3 ( 461) 348 80.8 4.4e-15 CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 ( 598) 349 81.0 4.7e-15 >>CCDS9051.1 NR2C1 gene_id:7181|Hs108|chr12 (603 aa) initn: 3977 init1: 3977 opt: 3977 Z-score: 4343.1 bits: 813.7 E(32554): 0 Smith-Waterman score: 3977; 100.0% identity (100.0% similar) in 603 aa overlap (1-603:1-603) 10 20 30 40 50 60 pF1KB6 MATIEEIAHQIIEQQMGEIVTEQQTGQKIQIVTALDHNTQGKQFILTNHDGSTPSKVILA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 MATIEEIAHQIIEQQMGEIVTEQQTGQKIQIVTALDHNTQGKQFILTNHDGSTPSKVILA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 RQDSTPGKVFLTTPDAAGVNQLFFTTPDLSAQHLQLLTDNSPDQGPNKVFDLCVVCGDKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 RQDSTPGKVFLTTPDAAGVNQLFFTTPDLSAQHLQLLTDNSPDQGPNKVFDLCVVCGDKA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 SGRHYGAVTCEGCKGFFKRSIRKNLVYSCRGSKDCIINKHHRNRCQYCRLQRCIAFGMKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 SGRHYGAVTCEGCKGFFKRSIRKNLVYSCRGSKDCIINKHHRNRCQYCRLQRCIAFGMKQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 DSVQCERKPIEVSREKSSNCAASTEKIYIRKDLRSPLTATPTFVTDSESTRSTGLLDSGM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 DSVQCERKPIEVSREKSSNCAASTEKIYIRKDLRSPLTATPTFVTDSESTRSTGLLDSGM 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 FMNIHPSGVKTESAVLMTSDKAESCQGDLSTLANVVTSLANLGKTKDLSQNSNEMSMIES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 FMNIHPSGVKTESAVLMTSDKAESCQGDLSTLANVVTSLANLGKTKDLSQNSNEMSMIES 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 LSNDDTSLCEFQEMQTNGDVSRAFDTLAKALNPGESTACQSSVAGMEGSVHLITGDSSIN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 LSNDDTSLCEFQEMQTNGDVSRAFDTLAKALNPGESTACQSSVAGMEGSVHLITGDSSIN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB6 YTEKEGPLLSDSHVAFRLTMPSPMPEYLNVHYIGESASRLLFLSMHWALSIPSFQALGQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 YTEKEGPLLSDSHVAFRLTMPSPMPEYLNVHYIGESASRLLFLSMHWALSIPSFQALGQE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB6 NSISLVKAYWNELFTLGLAQCWQVMNVATILATFVNCLHNSLQQDKMSTERRKLLMEHIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 NSISLVKAYWNELFTLGLAQCWQVMNVATILATFVNCLHNSLQQDKMSTERRKLLMEHIF 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB6 KLQEFCNSMVKLCIDGYEYAYLKAIVLFSPDHPSLENMEQIEKFQEKAYVEFQDYITKTY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 KLQEFCNSMVKLCIDGYEYAYLKAIVLFSPDHPSLENMEQIEKFQEKAYVEFQDYITKTY 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB6 PDDTYRLSRLLLRLPALRLMNATITEELFFKGLIGNIRIDSVIPHILKMEPADYNSQIIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 PDDTYRLSRLLLRLPALRLMNATITEELFFKGLIGNIRIDSVIPHILKMEPADYNSQIIG 550 560 570 580 590 600 pF1KB6 HSI ::: CCDS90 HSI >>CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 (483 aa) initn: 3075 init1: 3075 opt: 3075 Z-score: 3360.1 bits: 631.5 E(32554): 7.7e-181 Smith-Waterman score: 3075; 100.0% identity (100.0% similar) in 465 aa overlap (1-465:1-465) 10 20 30 40 50 60 pF1KB6 MATIEEIAHQIIEQQMGEIVTEQQTGQKIQIVTALDHNTQGKQFILTNHDGSTPSKVILA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MATIEEIAHQIIEQQMGEIVTEQQTGQKIQIVTALDHNTQGKQFILTNHDGSTPSKVILA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 RQDSTPGKVFLTTPDAAGVNQLFFTTPDLSAQHLQLLTDNSPDQGPNKVFDLCVVCGDKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 RQDSTPGKVFLTTPDAAGVNQLFFTTPDLSAQHLQLLTDNSPDQGPNKVFDLCVVCGDKA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 SGRHYGAVTCEGCKGFFKRSIRKNLVYSCRGSKDCIINKHHRNRCQYCRLQRCIAFGMKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 SGRHYGAVTCEGCKGFFKRSIRKNLVYSCRGSKDCIINKHHRNRCQYCRLQRCIAFGMKQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 DSVQCERKPIEVSREKSSNCAASTEKIYIRKDLRSPLTATPTFVTDSESTRSTGLLDSGM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 DSVQCERKPIEVSREKSSNCAASTEKIYIRKDLRSPLTATPTFVTDSESTRSTGLLDSGM 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 FMNIHPSGVKTESAVLMTSDKAESCQGDLSTLANVVTSLANLGKTKDLSQNSNEMSMIES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 FMNIHPSGVKTESAVLMTSDKAESCQGDLSTLANVVTSLANLGKTKDLSQNSNEMSMIES 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 LSNDDTSLCEFQEMQTNGDVSRAFDTLAKALNPGESTACQSSVAGMEGSVHLITGDSSIN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 LSNDDTSLCEFQEMQTNGDVSRAFDTLAKALNPGESTACQSSVAGMEGSVHLITGDSSIN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB6 YTEKEGPLLSDSHVAFRLTMPSPMPEYLNVHYIGESASRLLFLSMHWALSIPSFQALGQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 YTEKEGPLLSDSHVAFRLTMPSPMPEYLNVHYIGESASRLLFLSMHWALSIPSFQALGQE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB6 NSISLVKAYWNELFTLGLAQCWQVMNVATILATFVNCLHNSLQQDKMSTERRKLLMEHIF ::::::::::::::::::::::::::::::::::::::::::::: CCDS44 NSISLVKAYWNELFTLGLAQCWQVMNVATILATFVNCLHNSLQQDAKVIAALIHFTRRAI 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB6 KLQEFCNSMVKLCIDGYEYAYLKAIVLFSPDHPSLENMEQIEKFQEKAYVEFQDYITKTY CCDS44 TDL >>CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 (467 aa) initn: 3067 init1: 3067 opt: 3067 Z-score: 3351.6 bits: 629.8 E(32554): 2.3e-180 Smith-Waterman score: 3067; 100.0% identity (100.0% similar) in 464 aa overlap (1-464:1-464) 10 20 30 40 50 60 pF1KB6 MATIEEIAHQIIEQQMGEIVTEQQTGQKIQIVTALDHNTQGKQFILTNHDGSTPSKVILA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 MATIEEIAHQIIEQQMGEIVTEQQTGQKIQIVTALDHNTQGKQFILTNHDGSTPSKVILA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 RQDSTPGKVFLTTPDAAGVNQLFFTTPDLSAQHLQLLTDNSPDQGPNKVFDLCVVCGDKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 RQDSTPGKVFLTTPDAAGVNQLFFTTPDLSAQHLQLLTDNSPDQGPNKVFDLCVVCGDKA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 SGRHYGAVTCEGCKGFFKRSIRKNLVYSCRGSKDCIINKHHRNRCQYCRLQRCIAFGMKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 SGRHYGAVTCEGCKGFFKRSIRKNLVYSCRGSKDCIINKHHRNRCQYCRLQRCIAFGMKQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 DSVQCERKPIEVSREKSSNCAASTEKIYIRKDLRSPLTATPTFVTDSESTRSTGLLDSGM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 DSVQCERKPIEVSREKSSNCAASTEKIYIRKDLRSPLTATPTFVTDSESTRSTGLLDSGM 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 FMNIHPSGVKTESAVLMTSDKAESCQGDLSTLANVVTSLANLGKTKDLSQNSNEMSMIES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 FMNIHPSGVKTESAVLMTSDKAESCQGDLSTLANVVTSLANLGKTKDLSQNSNEMSMIES 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 LSNDDTSLCEFQEMQTNGDVSRAFDTLAKALNPGESTACQSSVAGMEGSVHLITGDSSIN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 LSNDDTSLCEFQEMQTNGDVSRAFDTLAKALNPGESTACQSSVAGMEGSVHLITGDSSIN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB6 YTEKEGPLLSDSHVAFRLTMPSPMPEYLNVHYIGESASRLLFLSMHWALSIPSFQALGQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 YTEKEGPLLSDSHVAFRLTMPSPMPEYLNVHYIGESASRLLFLSMHWALSIPSFQALGQE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB6 NSISLVKAYWNELFTLGLAQCWQVMNVATILATFVNCLHNSLQQDKMSTERRKLLMEHIF :::::::::::::::::::::::::::::::::::::::::::: CCDS41 NSISLVKAYWNELFTLGLAQCWQVMNVATILATFVNCLHNSLQQAEG 430 440 450 460 490 500 510 520 530 540 pF1KB6 KLQEFCNSMVKLCIDGYEYAYLKAIVLFSPDHPSLENMEQIEKFQEKAYVEFQDYITKTY >>CCDS74905.1 NR2C2 gene_id:7182|Hs108|chr3 (596 aa) initn: 2447 init1: 1238 opt: 1488 Z-score: 1626.7 bits: 311.0 E(32554): 2.7e-84 Smith-Waterman score: 2357; 62.7% identity (82.4% similar) in 601 aa overlap (11-603:17-596) 10 20 30 40 50 pF1KB6 MATIEEIAHQIIEQQMGEIVTEQQTGQKIQIVTALDHNTQGKQ-FILTNHDGST . : .:::.::::::::::::.: . . :: ::::. ::. CCDS74 MTSPSPRIQIISTDSAVASPQRIQIVTDQQTGQKIQIVTAVDASGSPKQQFILTSPDGAG 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB6 PSKVILARQDSTPGK-VFLTTPDAAGVNQLFFTTPDLSAQHLQLLTDNSPDQGPNKVFDL .::::: ... .: ...:: : ... ..: . :...: :: : : .: . CCDS74 TGKVILASPETSSAKQLIFTTSDNLVPGRIQIVTDSASVERLLGKTDV---QRP-QVVEY 70 80 90 100 110 120 130 140 150 160 170 pF1KB6 CVVCGDKASGRHYGAVTCEGCKGFFKRSIRKNLVYSCRGSKDCIINKHHRNRCQYCRLQR ::::::::::::::::.:::::::::::.::::.::::...:::::::::::::.:::.. CCDS74 CVVCGDKASGRHYGAVSCEGCKGFFKRSVRKNLTYSCRSNQDCIINKHHRNRCQFCRLKK 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB6 CIAFGMKQDSVQCERKPIEVSREKSSNCAASTEKIYIRKDLRSPLTATPTFVTDSESTRS :. .:::..::: ::::..:.::: :::::::::::::::::::: ::::::.:....:. CCDS74 CLEMGMKMESVQSERKPFDVQREKPSNCAASTEKIYIRKDLRSPLIATPTFVADKDGARQ 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB6 TGLLDSGMFMNIHPSGVKTESAVLMTSD-KAESCQGDLSTLANVVTSLANLGKTKDLSQN ::::: ::..::. .. ...::...: :::. :: :.::::::::::::. CCDS74 TGLLDPGMLVNIQQPLIREDGTVLLATDSKAETSQGALGTLANVVTSLANLS-------- 240 250 260 270 280 300 310 320 330 340 pF1KB6 SNEMSMIESLSNDDTSLCEFQ-EMQTNGDVSRAFDTLAKALNPGESTACQSSVAGME--- :::.: ::: :.: : :. ....::::::::::: .:.. : . :.. CCDS74 -------ESLNNGDTS--EIQPEDQSASEITRAFDTLAKALNTTDSSSSPSLADGIDTSG 290 300 310 320 330 350 360 370 380 390 400 pF1KB6 -GSVHLITGDSSINYTEKEGPLLSDSHVAFRLTMPSPMPEYLNVHYIGESASRLLFLSMH ::.:.:. :.: : :::::::.::.:.:::::::::::::::: :::::::::::: CCDS74 GGSIHVISRDQSTPIIEVEGPLLSDTHVTFKLTMPSPMPEYLNVHYICESASRLLFLSMH 340 350 360 370 380 390 410 420 430 440 450 460 pF1KB6 WALSIPSFQALGQENSISLVKAYWNELFTLGLAQCWQVMNVATILATFVNCLHNSLQQDK :: :::.::::::. . :::.: :::::::::::: :::...::::..:: :.::.:.:: CCDS74 WARSIPAFQALGQDCNTSLVRACWNELFTLGLAQCAQVMSLSTILAAIVNHLQNSIQEDK 400 410 420 430 440 450 470 480 490 500 510 520 pF1KB6 MSTERRKLLMEHIFKLQEFCNSMVKLCIDGYEYAYLKAIVLFSPDHPSLENMEQIEKFQE .: .: : .::::.:::::::::.:: ::::::::::::::::::::.: . ::::::: CCDS74 LSGDRIKQVMEHIWKLQEFCNSMAKLDIDGYEYAYLKAIVLFSPDHPGLTSTSQIEKFQE 460 470 480 490 500 510 530 540 550 560 570 580 pF1KB6 KAYVEFQDYITKTYPDDTYRLSRLLLRLPALRLMNATITEELFFKGLIGNIRIDSVIPHI :: .:.:::. ::: .:::::.:.:.::::::::...::::::: :::::. :::.::.: CCDS74 KAQMELQDYVQKTYSEDTYRLARILVRLPALRLMSSNITEELFFTGLIGNVSIDSIIPYI 520 530 540 550 560 570 590 600 pF1KB6 LKMEPADYNSQIIGHSI :::: :.::.:: : :. CCDS74 LKMETAEYNGQITGASL 580 590 >>CCDS2621.1 NR2C2 gene_id:7182|Hs108|chr3 (615 aa) initn: 2419 init1: 1238 opt: 1470 Z-score: 1606.9 bits: 307.4 E(32554): 3.5e-83 Smith-Waterman score: 2354; 63.3% identity (83.0% similar) in 594 aa overlap (18-603:43-615) 10 20 30 40 pF1KB6 MATIEEIAHQIIEQQMGEIVTEQQTGQKIQIVTALDHNTQGKQ-FIL .:::.::::::::::::.: . . :: ::: CCDS26 TDSAVASPQRIQGSEPASGPLSVFTSLNKEKIVTDQQTGQKIQIVTAVDASGSPKQQFIL 20 30 40 50 60 70 50 60 70 80 90 100 pF1KB6 TNHDGSTPSKVILARQDSTPGK-VFLTTPDAAGVNQLFFTTPDLSAQHLQLLTDNSPDQG :. ::. .::::: ... .: ...:: : ... ..: . :...: :: : CCDS26 TSPDGAGTGKVILASPETSSAKQLIFTTSDNLVPGRIQIVTDSASVERLLGKTDV---QR 80 90 100 110 120 110 120 130 140 150 160 pF1KB6 PNKVFDLCVVCGDKASGRHYGAVTCEGCKGFFKRSIRKNLVYSCRGSKDCIINKHHRNRC : .: . ::::::::::::::::.:::::::::::.::::.::::...:::::::::::: CCDS26 P-QVVEYCVVCGDKASGRHYGAVSCEGCKGFFKRSVRKNLTYSCRSNQDCIINKHHRNRC 130 140 150 160 170 180 170 180 190 200 210 220 pF1KB6 QYCRLQRCIAFGMKQDSVQCERKPIEVSREKSSNCAASTEKIYIRKDLRSPLTATPTFVT :.:::..:. .:::..::: ::::..:.::: :::::::::::::::::::: ::::::. CCDS26 QFCRLKKCLEMGMKMESVQSERKPFDVQREKPSNCAASTEKIYIRKDLRSPLIATPTFVA 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB6 DSESTRSTGLLDSGMFMNIHPSGVKTESAVLMTSD-KAESCQGDLSTLANVVTSLANLGK :....:.::::: ::..::. .. ...::...: :::. :: :.::::::::::::. CCDS26 DKDGARQTGLLDPGMLVNIQQPLIREDGTVLLATDSKAETSQGALGTLANVVTSLANLS- 250 260 270 280 290 300 290 300 310 320 330 340 pF1KB6 TKDLSQNSNEMSMIESLSNDDTSLCEFQ-EMQTNGDVSRAFDTLAKALNPGESTACQSSV :::.: ::: :.: : :. ....::::::::::: .:.. : . CCDS26 --------------ESLNNGDTS--EIQPEDQSASEITRAFDTLAKALNTTDSSSSPSLA 310 320 330 340 350 350 360 370 380 390 pF1KB6 AGME----GSVHLITGDSSINYTEKEGPLLSDSHVAFRLTMPSPMPEYLNVHYIGESASR :.. ::.:.:. :.: : :::::::.::.:.:::::::::::::::: ::::: CCDS26 DGIDTSGGGSIHVISRDQSTPIIEVEGPLLSDTHVTFKLTMPSPMPEYLNVHYICESASR 360 370 380 390 400 410 400 410 420 430 440 450 pF1KB6 LLFLSMHWALSIPSFQALGQENSISLVKAYWNELFTLGLAQCWQVMNVATILATFVNCLH ::::::::: :::.::::::. . :::.: :::::::::::: :::...::::..:: :. CCDS26 LLFLSMHWARSIPAFQALGQDCNTSLVRACWNELFTLGLAQCAQVMSLSTILAAIVNHLQ 420 430 440 450 460 470 460 470 480 490 500 510 pF1KB6 NSLQQDKMSTERRKLLMEHIFKLQEFCNSMVKLCIDGYEYAYLKAIVLFSPDHPSLENME ::.:.::.: .: : .::::.:::::::::.:: ::::::::::::::::::::.: . CCDS26 NSIQEDKLSGDRIKQVMEHIWKLQEFCNSMAKLDIDGYEYAYLKAIVLFSPDHPGLTSTS 480 490 500 510 520 530 520 530 540 550 560 570 pF1KB6 QIEKFQEKAYVEFQDYITKTYPDDTYRLSRLLLRLPALRLMNATITEELFFKGLIGNIRI ::::::::: .:.:::. ::: .:::::.:.:.::::::::...::::::: :::::. : CCDS26 QIEKFQEKAQMELQDYVQKTYSEDTYRLARILVRLPALRLMSSNITEELFFTGLIGNVSI 540 550 560 570 580 590 580 590 600 pF1KB6 DSVIPHILKMEPADYNSQIIGHSI ::.::.::::: :.::.:: : :. CCDS26 DSIIPYILKMETAEYNGQITGASL 600 610 >>CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 (463 aa) initn: 778 init1: 422 opt: 470 Z-score: 517.4 bits: 105.4 E(32554): 1.7e-22 Smith-Waterman score: 537; 26.0% identity (49.9% similar) in 557 aa overlap (38-588:64-457) 10 20 30 40 50 60 pF1KB6 AHQIIEQQMGEIVTEQQTGQKIQIVTALDHNTQGKQFILTNHDGSTPSKVILARQDSTPG :. :. . . . . :: .. : :: CCDS12 STGKPMDSHPSYTDTPVSAPRTLSAVGTPLNALGSPYRVITSAMGPPSGALAA----PPG 40 50 60 70 80 70 80 90 100 110 120 pF1KB6 KVFLTTPDAAGVNQLFFTTPDLSAQHLQLLTD----NSPDQGPNK-VFDLCVVCGDKASG . :..: .. .: . .. . . . : : : :. .:.. : .:..:::..:: CCDS12 -INLVAPPSSQLNVVNSVSSSEDIKPLPGLPGIGNMNYPSTSPGSLVKHICAICGDRSSG 90 100 110 120 130 140 130 140 150 160 170 180 pF1KB6 RHYGAVTCEGCKGFFKRSIRKNLVYSCRGSKDCIINKHHRNRCQYCRLQRCIAFGMKQDS .:::. .::::::::::.:::.:.:.:: .:::.:.:..:::::::: :.:...:::... CCDS12 KHYGVYSCEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGMKREA 150 160 170 180 190 200 190 200 210 220 230 240 pF1KB6 VQCERKPIEVSREKSSNCAAST-EKIYIRKDLRSPLTATPTFVTDSESTRSTGLLDSGMF :: ::. . :. ..::.: : . ... :.. :.. : CCDS12 VQEERQRSRERAESEAECATSGHEDMPVERILEAELAVEP-------------------- 210 220 230 240 250 260 270 280 290 300 pF1KB6 MNIHPSGVKTESAVLMTSDKAESCQGDLSTLANVVTSLANLGKTKDLSQNSNEMSMIESL :::: :: :.: .: CCDS12 --------KTES------------YGD--------------------------MNMENST 250 260 310 320 330 340 350 360 pF1KB6 SNDDTSLCEFQEMQTNGDVSRAFDTLAKALNPGESTACQSSVAGMEGSVHLITGDSSINY .. :..:. CCDS12 NDPVTNICH--------------------------------------------------- 270 370 380 390 400 410 420 pF1KB6 TEKEGPLLSDSHVAFRLTMPSPMPEYLNVHYIGESASRLLFLSMHWALSIPSFQALGQEN .:.. :: ..:: :: :. : :. CCDS12 ----------------------------------AADKQLFTLVEWAKRIPHFSDLTLED 280 290 430 440 450 460 470 480 pF1KB6 SISLVKAYWNELFTLGLAQCWQVMNVATILATFVNCLHNSLQQDKMSTERRKLLMEHIFK .. :..: ::::. .... .. . .::: .. ..: .. ... ..: : . : CCDS12 QVILLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVSK 300 310 320 330 340 350 490 500 510 520 530 540 pF1KB6 LQEFCNSMVKLCIDGYEYAYLKAIVLFSPDHPSLENMEQIEKFQEKAYVEFQDYITKTYP ... . .: : . :.:::::.:: .: : ..: ..::.:. .. : . :: CCDS12 MKD-------MQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYP 360 370 380 390 400 410 550 560 570 580 590 600 pF1KB6 DDTYRLSRLLLRLPALRLMNATITEELFFKGLIGNIRIDSVIPHILKMEPADYNSQIIGH .. :...::::::::: .. :.::: :::. ::. . ..:. CCDS12 EQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT 420 430 440 450 460 pF1KB6 SI >>CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 (340 aa) initn: 778 init1: 422 opt: 465 Z-score: 513.9 bits: 104.3 E(32554): 2.6e-22 Smith-Waterman score: 532; 27.1% identity (50.1% similar) in 491 aa overlap (100-588:2-334) 70 80 90 100 110 120 pF1KB6 FLTTPDAAGVNQLFFTTPDLSAQHLQLLTDNSPDQGPNK-VFDLCVVCGDKASGRHYGAV : :. .:.. : .:..:::..::.:::. CCDS72 MNYPSTSPGSLVKHICAICGDRSSGKHYGVY 10 20 30 130 140 150 160 170 180 pF1KB6 TCEGCKGFFKRSIRKNLVYSCRGSKDCIINKHHRNRCQYCRLQRCIAFGMKQDSVQCERK .::::::::::.:::.:.:.:: .:::.:.:..:::::::: :.:...:::...:: ::. CCDS72 SCEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQ 40 50 60 70 80 90 190 200 210 220 230 240 pF1KB6 PIEVSREKSSNCAAST-EKIYIRKDLRSPLTATPTFVTDSESTRSTGLLDSGMFMNIHPS . :. ..::.: : . ... :.. :.. : CCDS72 RSRERAESEAECATSGHEDMPVERILEAELAVEP-------------------------- 100 110 120 250 260 270 280 290 300 pF1KB6 GVKTESAVLMTSDKAESCQGDLSTLANVVTSLANLGKTKDLSQNSNEMSMIESLSNDDTS :::: :: :.: .: .. :. CCDS72 --KTES------------YGD--------------------------MNMENSTNDPVTN 130 140 310 320 330 340 350 360 pF1KB6 LCEFQEMQTNGDVSRAFDTLAKALNPGESTACQSSVAGMEGSVHLITGDSSINYTEKEGP .:. CCDS72 ICH--------------------------------------------------------- 370 380 390 400 410 420 pF1KB6 LLSDSHVAFRLTMPSPMPEYLNVHYIGESASRLLFLSMHWALSIPSFQALGQENSISLVK .:.. :: ..:: :: :. : :... :.. CCDS72 ----------------------------AADKQLFTLVEWAKRIPHFSDLTLEDQVILLR 150 160 170 180 430 440 450 460 470 480 pF1KB6 AYWNELFTLGLAQCWQVMNVATILATFVNCLHNSLQQDKMSTERRKLLMEHIFKLQEFCN : ::::. .... .. . .::: .. ..: .. ... ..: : . :... CCDS72 AGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVSKMKD--- 190 200 210 220 230 490 500 510 520 530 540 pF1KB6 SMVKLCIDGYEYAYLKAIVLFSPDHPSLENMEQIEKFQEKAYVEFQDYITKTYPDDTYRL . .: : . :.:::::.:: .: : ..: ..::.:. .. : . ::.. :. CCDS72 ----MQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRF 240 250 260 270 280 290 550 560 570 580 590 600 pF1KB6 SRLLLRLPALRLMNATITEELFFKGLIGNIRIDSVIPHILKMEPADYNSQIIGHSI ..::::::::: .. :.::: :::. ::. . ..:. CCDS72 AKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT 300 310 320 330 340 >>CCDS45359.1 NR2F2 gene_id:7026|Hs108|chr15 (261 aa) initn: 448 init1: 274 opt: 442 Z-score: 490.5 bits: 99.6 E(32554): 5.3e-21 Smith-Waterman score: 442; 37.0% identity (70.5% similar) in 200 aa overlap (388-587:54-247) 360 370 380 390 400 410 pF1KB6 SINYTEKEGPLLSDSHVAFRLTMPSPMPEYLNVHYIGESASRLLFLSMHWALSIPSFQAL .... : : :.:.:: ...:: .:: : : CCDS45 YLSGYISLLLRAEPYPTSRFGSQCMQPNNIMGIENICELAARMLFSAVEWARNIPFFPDL 30 40 50 60 70 80 420 430 440 450 460 470 pF1KB6 GQENSISLVKAYWNELFTLGLAQCWQVMNVATILATFVNCLHNSLQQDKMSTERRKLLME ....:.. :.:::.:. ::: . ..:: .::. :: : ::..: .:. CCDS45 QITDQVALLRLTWSELFVLNAAQCSMPLHVAPLLAA--AGLHAS----PMSADRVVAFMD 90 100 110 120 130 480 490 500 510 520 530 pF1KB6 HIFKLQEFCNSMVKLCIDGYEYAYLKAIVLFSPDHPSLENMEQIEKFQEKAYVEFQDYIT :: .:: ... : .:. ::. :::::::. : .: .. ..:..:::. ...:. CCDS45 HIRIFQEQVEKLKALHVDSAEYSCLKAIVLFTSDACGLSDVAHVESLQEKSQCALEEYVR 140 150 160 170 180 190 540 550 560 570 580 590 pF1KB6 KTYPDDTYRLSRLLLRLPALRLMNATITEELFFKGLIGNIRIDSVIPHILKMEPADYNSQ . ::.. :...::::::.:: ..... :.::: :.:. :...: .: CCDS45 SQYPNQPTRFGKLLLRLPSLRTVSSSVIEQLFFVRLVGKTPIETLIRDMLLSGSSFNWPY 200 210 220 230 240 250 600 pF1KB6 IIGHSI CCDS45 MAIQ 260 >>CCDS45358.1 NR2F2 gene_id:7026|Hs108|chr15 (281 aa) initn: 448 init1: 274 opt: 442 Z-score: 490.0 bits: 99.6 E(32554): 5.7e-21 Smith-Waterman score: 442; 37.0% identity (70.5% similar) in 200 aa overlap (388-587:74-267) 360 370 380 390 400 410 pF1KB6 SINYTEKEGPLLSDSHVAFRLTMPSPMPEYLNVHYIGESASRLLFLSMHWALSIPSFQAL .... : : :.:.:: ...:: .:: : : CCDS45 YLSGYISLLLRAEPYPTSRFGSQCMQPNNIMGIENICELAARMLFSAVEWARNIPFFPDL 50 60 70 80 90 100 420 430 440 450 460 470 pF1KB6 GQENSISLVKAYWNELFTLGLAQCWQVMNVATILATFVNCLHNSLQQDKMSTERRKLLME ....:.. :.:::.:. ::: . ..:: .::. :: : ::..: .:. CCDS45 QITDQVALLRLTWSELFVLNAAQCSMPLHVAPLLAA--AGLHAS----PMSADRVVAFMD 110 120 130 140 150 480 490 500 510 520 530 pF1KB6 HIFKLQEFCNSMVKLCIDGYEYAYLKAIVLFSPDHPSLENMEQIEKFQEKAYVEFQDYIT :: .:: ... : .:. ::. :::::::. : .: .. ..:..:::. ...:. CCDS45 HIRIFQEQVEKLKALHVDSAEYSCLKAIVLFTSDACGLSDVAHVESLQEKSQCALEEYVR 160 170 180 190 200 210 540 550 560 570 580 590 pF1KB6 KTYPDDTYRLSRLLLRLPALRLMNATITEELFFKGLIGNIRIDSVIPHILKMEPADYNSQ . ::.. :...::::::.:: ..... :.::: :.:. :...: .: CCDS45 SQYPNQPTRFGKLLLRLPSLRTVSSSVIEQLFFVRLVGKTPIETLIRDMLLSGSSFNWPY 220 230 240 250 260 270 600 pF1KB6 IIGHSI CCDS45 MAIQ 280 >>CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 (533 aa) initn: 758 init1: 439 opt: 439 Z-score: 482.6 bits: 99.2 E(32554): 1.5e-20 Smith-Waterman score: 513; 28.3% identity (49.5% similar) in 487 aa overlap (102-588:194-527) 80 90 100 110 120 130 pF1KB6 TTPDAAGVNQLFFTTPDLSAQHLQLLTDNSPDQGPNKVFDLCVVCGDKASGRHYGAVTCE : ::. ::..:::..::.:::. .:: CCDS47 STVSLPGGGSGPPEDVKPPVLGVRGLHCPPPPGGPGAGKRLCAICGDRSSGKHYGVYSCE 170 180 190 200 210 220 140 150 160 170 180 190 pF1KB6 GCKGFFKRSIRKNLVYSCRGSKDCIINKHHRNRCQYCRLQRCIAFGMKQDSVQCERKPIE ::::::::.:::.:.:::: .::: ..:..:::::::: :.:.: :::...:: ::. CCDS47 GCKGFFKRTIRKDLTYSCRDNKDCTVDKRQRNRCQYCRYQKCLATGMKREAVQEERQ--- 230 240 250 260 270 280 200 210 220 230 240 250 pF1KB6 VSREKSSNCAASTEKIYIRKDLRSPLTATPTFVTDSESTRSTGLLDSGMFMNIHPSGVKT : :. :: :.:.. .:. CCDS47 --RGKD-------------KD------------GDGEGA----------------GGAPE 290 260 270 280 290 300 310 pF1KB6 ESAVLMTSDKAESCQGDLSTLANVVTSLANLGKTKDLSQNSNEMSMIESLSNDDTSLCEF : : :. ..:. CCDS47 E----MPVDR-----------------------------------ILEA----------- 300 320 330 340 350 360 370 pF1KB6 QEMQTNGDVSRAFDTLAKALNPGESTACQSSVAGMEGSVHLITGDSSINYTEKEGPLLSD : .. :.: :.:: :: :. CCDS47 -----------------------ELAVEQKSDQGVEGPGG--TGGSG------------- 310 320 380 390 400 410 420 430 pF1KB6 SHVAFRLTMPSPMPEYLNVHYIGESASRLLFLSMHWALSIPSFQALGQENSISLVKAYWN :: : : ..:.. :: ..:: :: :..: .... :..: :: CCDS47 ---------SSPNDPVTN---ICQAADKQLFTLVEWAKRIPHFSSLPLDDQVILLRAGWN 330 340 350 360 370 440 450 460 470 480 490 pF1KB6 ELFTLGLAQCWQVMNVATILATFVNCLHNSLQQDKMSTERRKLLMEHIFKLQEFCNSMVK ::. .... . . .::: .. .:: .. ... ..: : . :... CCDS47 ELLIASFSHRSIDVRDGILLATGLHVHRNSAHSAGVGAIFDRVLTELVSKMRD------- 380 390 400 410 420 430 500 510 520 530 540 550 pF1KB6 LCIDGYEYAYLKAIVLFSPDHPSLENMEQIEKFQEKAYVEFQDYITKTYPDDTYRLSRLL . .: : . :.::.::.:: .: : ..: ..::.:. .. : . ::.. :...:: CCDS47 MRMDKTELGCLRAIILFNPDAKGLSNPSEVEVLREKVYASLETYCKQKYPEQQGRFAKLL 440 450 460 470 480 490 560 570 580 590 600 pF1KB6 LRLPALRLMNATITEELFFKGLIGNIRIDSVIPHILKMEPADYNSQIIGHSI ::::::: .. :.::: :::. ::. . ..:. CCDS47 LRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQLA 500 510 520 530 603 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 14:45:51 2016 done: Sun Nov 6 14:45:52 2016 Total Scan time: 3.070 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]