FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7686, 410 aa 1>>>pF1KB7686 410 - 410 aa - 410 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.9719+/-0.000719; mu= 10.2082+/- 0.044 mean_var=103.1391+/-20.226, 0's: 0 Z-trim(113.1): 126 B-trim: 0 in 0/51 Lambda= 0.126288 statistics sampled from 13670 (13796) to 13670 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.764), E-opt: 0.2 (0.424), width: 16 Scan time: 3.380 The best scores are: opt bits E(32554) CCDS73750.1 NR2E3 gene_id:10002|Hs108|chr15 ( 410) 2773 515.2 4.6e-146 CCDS73751.1 NR2E3 gene_id:10002|Hs108|chr15 ( 367) 2495 464.5 7.3e-131 CCDS69165.1 NR2E1 gene_id:7101|Hs108|chr6 ( 422) 1076 206.0 5.6e-53 CCDS5063.1 NR2E1 gene_id:7101|Hs108|chr6 ( 385) 1059 202.9 4.4e-52 CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19 ( 404) 633 125.3 1.1e-28 CCDS45359.1 NR2F2 gene_id:7026|Hs108|chr15 ( 261) 593 117.9 1.1e-26 CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 ( 423) 596 118.5 1.2e-26 CCDS45358.1 NR2F2 gene_id:7026|Hs108|chr15 ( 281) 593 117.9 1.2e-26 CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 ( 414) 593 118.0 1.7e-26 CCDS2610.2 PPARG gene_id:5468|Hs108|chr3 ( 477) 498 100.7 3.1e-21 CCDS2609.1 PPARG gene_id:5468|Hs108|chr3 ( 505) 498 100.7 3.3e-21 CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 471 95.8 9.2e-20 CCDS54994.1 PPARD gene_id:5467|Hs108|chr6 ( 402) 468 95.2 1.2e-19 CCDS4803.1 PPARD gene_id:5467|Hs108|chr6 ( 441) 468 95.2 1.3e-19 CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 ( 537) 456 93.1 7e-19 CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 ( 533) 451 92.1 1.3e-18 CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 ( 340) 444 90.8 2.1e-18 CCDS33669.1 PPARA gene_id:5465|Hs108|chr22 ( 468) 445 91.0 2.5e-18 CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 ( 463) 444 90.8 2.8e-18 CCDS3772.1 NR3C2 gene_id:4306|Hs108|chr4 ( 984) 448 91.7 3.3e-18 CCDS83303.1 HNF4G gene_id:3174|Hs108|chr8 ( 408) 373 77.9 1.9e-14 CCDS6220.2 HNF4G gene_id:3174|Hs108|chr8 ( 445) 373 77.9 2.1e-14 CCDS68131.1 HNF4A gene_id:3172|Hs108|chr20 ( 395) 371 77.5 2.4e-14 CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20 ( 442) 371 77.5 2.7e-14 CCDS42876.1 HNF4A gene_id:3172|Hs108|chr20 ( 452) 371 77.5 2.7e-14 CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 ( 467) 367 76.8 4.7e-14 CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 ( 483) 367 76.8 4.8e-14 CCDS42316.1 THRA gene_id:7067|Hs108|chr17 ( 410) 364 76.2 6.1e-14 CCDS58546.1 THRA gene_id:7067|Hs108|chr17 ( 451) 364 76.3 6.6e-14 CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20 ( 417) 363 76.1 7e-14 CCDS11360.1 THRA gene_id:7067|Hs108|chr17 ( 490) 364 76.3 7.1e-14 CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20 ( 449) 363 76.1 7.5e-14 CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20 ( 464) 363 76.1 7.7e-14 CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20 ( 474) 363 76.1 7.9e-14 CCDS4804.1 PPARD gene_id:5467|Hs108|chr6 ( 361) 350 73.7 3.2e-13 CCDS9850.2 ESRRB gene_id:2103|Hs108|chr14 ( 508) 349 73.6 4.9e-13 CCDS44584.1 NR1H3 gene_id:10062|Hs108|chr11 ( 387) 347 73.1 5e-13 CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11 ( 402) 347 73.1 5.1e-13 CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11 ( 447) 347 73.2 5.6e-13 CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11 ( 453) 347 73.2 5.7e-13 CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 ( 614) 349 73.6 5.8e-13 CCDS2641.1 THRB gene_id:7068|Hs108|chr3 ( 461) 340 71.9 1.4e-12 CCDS1004.1 RORC gene_id:6097|Hs108|chr1 ( 518) 340 71.9 1.6e-12 CCDS33718.1 NR1D2 gene_id:9975|Hs108|chr3 ( 579) 340 71.9 1.7e-12 CCDS54627.1 NR1I2 gene_id:8856|Hs108|chr3 ( 397) 337 71.3 1.8e-12 CCDS60383.1 NR5A2 gene_id:2494|Hs108|chr1 ( 469) 338 71.5 1.8e-12 CCDS1400.1 NR5A2 gene_id:2494|Hs108|chr1 ( 495) 338 71.5 1.9e-12 CCDS42593.1 NR1H2 gene_id:7376|Hs108|chr19 ( 460) 337 71.3 2e-12 CCDS1401.1 NR5A2 gene_id:2494|Hs108|chr1 ( 541) 338 71.6 2.1e-12 CCDS30856.1 RORC gene_id:6097|Hs108|chr1 ( 497) 336 71.2 2.5e-12 >>CCDS73750.1 NR2E3 gene_id:10002|Hs108|chr15 (410 aa) initn: 2773 init1: 2773 opt: 2773 Z-score: 2735.8 bits: 515.2 E(32554): 4.6e-146 Smith-Waterman score: 2773; 100.0% identity (100.0% similar) in 410 aa overlap (1-410:1-410) 10 20 30 40 50 60 pF1KB7 METRPTALMSSTVAAAAPAAGAASRKESPGRWGLGEDPTGVSPSLQCRVCGDSSSGKHYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 METRPTALMSSTVAAAAPAAGAASRKESPGRWGLGEDPTGVSPSLQCRVCGDSSSGKHYG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 IYACNGCSGFFKRSVRRRLIYRCQVGAGMCPVDKAHRNQCQACRLKKCLQAGMNQDAVQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 IYACNGCSGFFKRSVRRRLIYRCQVGAGMCPVDKAHRNQCQACRLKKCLQAGMNQDAVQN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 ERQPRSTAQVHLDSMESNTESRPESLVAPPAPAGRSPRGPTPMSAARALGHHFMASLITA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 ERQPRSTAQVHLDSMESNTESRPESLVAPPAPAGRSPRGPTPMSAARALGHHFMASLITA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 ETCAKLEPEDADENIDVTSNDPEFPSSPYSSSSPCGLDSIHETSARLLFMAVKWAKNLPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 ETCAKLEPEDADENIDVTSNDPEFPSSPYSSSSPCGLDSIHETSARLLFMAVKWAKNLPV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 FSSLPFRDQVILLEEAWSELFLLGAIQWSLPLDSCPLLAPPEASAAGGAQGRLTLASMET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 FSSLPFRDQVILLEEAWSELFLLGAIQWSLPLDSCPLLAPPEASAAGGAQGRLTLASMET 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 RVLQETISRFRALAVDPTEFACMKALVLFKPETRGLKDPEHVEALQDQSQVMLSQHSKAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 RVLQETISRFRALAVDPTEFACMKALVLFKPETRGLKDPEHVEALQDQSQVMLSQHSKAH 310 320 330 340 350 360 370 380 390 400 410 pF1KB7 HPSQPVRFGKLLLLLPSLRFITAERIELLFFRKTIGNTPMEKLLCDMFKN :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 HPSQPVRFGKLLLLLPSLRFITAERIELLFFRKTIGNTPMEKLLCDMFKN 370 380 390 400 410 >>CCDS73751.1 NR2E3 gene_id:10002|Hs108|chr15 (367 aa) initn: 2495 init1: 2495 opt: 2495 Z-score: 2462.8 bits: 464.5 E(32554): 7.3e-131 Smith-Waterman score: 2495; 100.0% identity (100.0% similar) in 367 aa overlap (1-367:1-367) 10 20 30 40 50 60 pF1KB7 METRPTALMSSTVAAAAPAAGAASRKESPGRWGLGEDPTGVSPSLQCRVCGDSSSGKHYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 METRPTALMSSTVAAAAPAAGAASRKESPGRWGLGEDPTGVSPSLQCRVCGDSSSGKHYG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 IYACNGCSGFFKRSVRRRLIYRCQVGAGMCPVDKAHRNQCQACRLKKCLQAGMNQDAVQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 IYACNGCSGFFKRSVRRRLIYRCQVGAGMCPVDKAHRNQCQACRLKKCLQAGMNQDAVQN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 ERQPRSTAQVHLDSMESNTESRPESLVAPPAPAGRSPRGPTPMSAARALGHHFMASLITA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 ERQPRSTAQVHLDSMESNTESRPESLVAPPAPAGRSPRGPTPMSAARALGHHFMASLITA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 ETCAKLEPEDADENIDVTSNDPEFPSSPYSSSSPCGLDSIHETSARLLFMAVKWAKNLPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 ETCAKLEPEDADENIDVTSNDPEFPSSPYSSSSPCGLDSIHETSARLLFMAVKWAKNLPV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 FSSLPFRDQVILLEEAWSELFLLGAIQWSLPLDSCPLLAPPEASAAGGAQGRLTLASMET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 FSSLPFRDQVILLEEAWSELFLLGAIQWSLPLDSCPLLAPPEASAAGGAQGRLTLASMET 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 RVLQETISRFRALAVDPTEFACMKALVLFKPETRGLKDPEHVEALQDQSQVMLSQHSKAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 RVLQETISRFRALAVDPTEFACMKALVLFKPETRGLKDPEHVEALQDQSQVMLSQHSKAH 310 320 330 340 350 360 370 380 390 400 410 pF1KB7 HPSQPVRFGKLLLLLPSLRFITAERIELLFFRKTIGNTPMEKLLCDMFKN ::::::: CCDS73 HPSQPVR >>CCDS69165.1 NR2E1 gene_id:7101|Hs108|chr6 (422 aa) initn: 1058 init1: 377 opt: 1076 Z-score: 1064.6 bits: 206.0 E(32554): 5.6e-53 Smith-Waterman score: 1076; 43.3% identity (68.7% similar) in 409 aa overlap (16-410:21-419) 10 20 30 40 50 pF1KB7 METRPTALMSSTVAAAAPAAGAASRKESPGRW-GLGEDPTGVSPSLQCRVCGDSS : :. : . : : .: :.: : .. :.:::: : CCDS69 MFRAGAEGAEKEPSPRPECRADPGPGLGFPLGSGLPWPSLLESPGGRILDIPCKVCGDRS 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 SGKHYGIYACNGCSGFFKRSVRRRLIYRCQVGA-GMCPVDKAHRNQCQACRLKKCLQAGM ::::::.:::.:::::::::.:: : :. : : :::::.:::::.::::::::...: CCDS69 SGKHYGVYACDGCSGFFKRSIRRNRTYVCKSGNQGGCPVDKTHRNQCRACRLKKCLEVNM 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB7 NQDAVQNERQPRSTAQVHLDSMESNTESRPESLVAPPAPAGRSPRGPTPMSAARALGHHF :.::::.:: :: :. .. . . :. .: :.. : .:. ..:. : : CCDS69 NKDAVQHERGPR-TSTIRKQVALYFRGHKEENGAAAHFPSAALP-APAFFTAVTQLEPHG 130 140 150 160 170 180 190 200 210 220 pF1KB7 MASLITAETCAKLEPEDADENIDVTSNDPEFPSSPYSSSSPCGL-----DSIHETSARLL . .. : :: ..... :..: ...: : .:. :..:::: CCDS69 LELAAVSTT-----PERQTL-VSLAQPTPKYPHE--VNGTPMYLYEVATESVCESAARLL 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB7 FMAVKWAKNLPVFSSLPFRDQVILLEEAWSELFLLGAIQWSLPLDSCPLLAPPEASAAGG ::..::::..:.::.: ..::..:::.:: :::.:: ::..:.:. ::: .. . CCDS69 FMSIKWAKSVPAFSTLSLQDQLMLLEDAWRELFVLGIAQWAIPVDANTLLAVSGMNGDNT 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB7 AQGRLTLASMETRVLQETISRFRALAVDPTEFACMKALVLFK--P-----ETRGLKDPEH . .:. : ..:::...::: : .: :::::.: .: :: : : :.... CCDS69 DSQKLNKIISEIQALQEVVARFRQLRLDATEFACLKCIVTFKAVPTHSGSELRSFRNAAA 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB7 VEALQDQSQVMLSQHSKAHHPSQPVRFGKLLLLLPSLRFITAERIELLFFRKTIGNTPME . ::::..:. :... ....:.:: ::::::::::.:: :. :: .::.:::::.:. CCDS69 IAALQDEAQLTLNSYIHTRYPTQPCRFGKLLLLLPALRSISPSTIEEVFFKKTIGNVPIT 360 370 380 390 400 410 410 pF1KB7 KLLCDMFKN .:: ::.:. CCDS69 RLLSDMYKSSDI 420 >>CCDS5063.1 NR2E1 gene_id:7101|Hs108|chr6 (385 aa) initn: 1058 init1: 377 opt: 1059 Z-score: 1048.5 bits: 202.9 E(32554): 4.4e-52 Smith-Waterman score: 1059; 43.7% identity (69.9% similar) in 389 aa overlap (38-410:4-382) 10 20 30 40 50 60 pF1KB7 LMSSTVAAAAPAAGAASRKESPGRWGLGEDPTGVSP---SLQCRVCGDSSSGKHYGIYAC :.: . .. :.:::: :::::::.::: CCDS50 MSKPAGSTSRILDIPCKVCGDRSSGKHYGVYAC 10 20 30 70 80 90 100 110 120 pF1KB7 NGCSGFFKRSVRRRLIYRCQVGA-GMCPVDKAHRNQCQACRLKKCLQAGMNQDAVQNERQ .:::::::::.:: : :. : : :::::.:::::.::::::::...::.::::.:: CCDS50 DGCSGFFKRSIRRNRTYVCKSGNQGGCPVDKTHRNQCRACRLKKCLEVNMNKDAVQHERG 40 50 60 70 80 90 130 140 150 160 170 180 pF1KB7 PRSTAQVHLDSMESNTESRPESLVAPPAPAGRSPRGPTPMSAARALGHHFMASLITAETC :: :. .. . . :. .: :.. : .:. ..:. : : . .. : CCDS50 PR-TSTIRKQVALYFRGHKEENGAAAHFPSAALP-APAFFTAVTQLEPHGLELAAVSTT- 100 110 120 130 140 150 190 200 210 220 230 pF1KB7 AKLEPEDADENIDVTSNDPEFPSSPYSSSSPCGL-----DSIHETSARLLFMAVKWAKNL :: ..... :..: ...: : .:. :..::::::..::::.. CCDS50 ----PERQTL-VSLAQPTPKYPHE--VNGTPMYLYEVATESVCESAARLLFMSIKWAKSV 160 170 180 190 200 240 250 260 270 280 290 pF1KB7 PVFSSLPFRDQVILLEEAWSELFLLGAIQWSLPLDSCPLLAPPEASAAGGAQGRLTLASM :.::.: ..::..:::.:: :::.:: ::..:.:. ::: .. . . .:. CCDS50 PAFSTLSLQDQLMLLEDAWRELFVLGIAQWAIPVDANTLLAVSGMNGDNTDSQKLNKIIS 210 220 230 240 250 260 300 310 320 330 340 350 pF1KB7 ETRVLQETISRFRALAVDPTEFACMKALVLFK--P-----ETRGLKDPEHVEALQDQSQV : ..:::...::: : .: :::::.: .: :: : : :.... . ::::..:. CCDS50 EIQALQEVVARFRQLRLDATEFACLKCIVTFKAVPTHSGSELRSFRNAAAIAALQDEAQL 270 280 290 300 310 320 360 370 380 390 400 410 pF1KB7 MLSQHSKAHHPSQPVRFGKLLLLLPSLRFITAERIELLFFRKTIGNTPMEKLLCDMFKN :... ....:.:: ::::::::::.:: :. :: .::.:::::.:. .:: ::.:. CCDS50 TLNSYIHTRYPTQPCRFGKLLLLLPALRSISPSTIEEVFFKKTIGNVPITRLLSDMYKSS 330 340 350 360 370 380 CCDS50 DI >>CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19 (404 aa) initn: 955 init1: 573 opt: 633 Z-score: 628.7 bits: 125.3 E(32554): 1.1e-28 Smith-Waterman score: 956; 41.1% identity (65.5% similar) in 397 aa overlap (14-408:21-390) 10 20 30 40 50 pF1KB7 METRPTALMSSTVAAAAPAAGAASRKESPGRWGLGEDPTGVSPSLQ--CRVCG :.. : :. . :: . .: :.:: : ::: CCDS12 MAMVTGGWGGPGGDTNGVDKAGGYPRAAEDDSASPPGAASDAEPGDEERPGLQVDCVVCG 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 DSSSGKHYGIYACNGCSGFFKRSVRRRLIYRCQVGAGMCPVDKAHRNQCQACRLKKCLQA :.:::::::...:.::..:::::.:: : : :. . : .:. :::::: ::::::... CCDS12 DKSSGKHYGVFTCEGCKSFFKRSIRRNLSYTCRSNRD-CQIDQHHRNQCQYCRLKKCFRV 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 GMNQDAVQNERQPRSTAQVHLDSMESNTESRPESLVAPPAPAGRSPRGPTPMSAARALGH :: ..::: : :.: .. ... : : : .: : .: : :.: CCDS12 GMRKEAVQRGRIPHSLP----GAVAASSGSPPGSALAAVASGGDLFPGQ-PVS------- 120 130 140 150 160 180 190 200 210 220 230 pF1KB7 HFMASLITAETCAKLEPEDADENIDVTSNDPEFPSSPYSSSSPCGLDSIHETSARLLFMA ...:.:. :: : : . .: .. .... :.:.. : .::::: . CCDS12 ELIAQLLRAE------PYPAAAG--------RFGAGGGAAGAVLGIDNVCELAARLLFST 170 180 190 200 210 240 250 260 270 280 290 pF1KB7 VKWAKNLPVFSSLPFRDQVILLEEAWSELFLLGAIQWSLPLDSCPLLAPPEASAAGGAQG :.::.. : : :: ::: ::. .:::::.:.: : .::: . :::: :: : CCDS12 VEWARHAPFFPELPVADQVALLRLSWSELFVLNAAQAALPLHTAPLLAAAGLHAAPMAAE 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB7 RLTLASMETRVLQETISRFRALAVDPTEFACMKALVLFKPETRGLKDPEHVEALQDQSQV : . ..:..:: .... : :: .:..:.::..:: :.. ::.:: :::.::...:: CCDS12 RAVAFMDQVRAFQEQVDKLGRLQVDSAEYGCLKAIALFTPDACGLSDPAHVESLQEKAQV 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB7 MLSQHSKAHHPSQPVRFGKLLLLLPSLRFITAERIELLFFRKTIGNTPMEKLLCDMFKN :... .:..:::: :::.::: ::.:: . : : ::: . .:.::.: :. ::. CCDS12 ALTEYVRAQYPSQPQRFGRLLLRLPALRAVPASLISQLFFMRLVGKTPIETLIRDMLLSG 340 350 360 370 380 390 CCDS12 STFNWPYGSGQ 400 >>CCDS45359.1 NR2F2 gene_id:7026|Hs108|chr15 (261 aa) initn: 591 init1: 567 opt: 593 Z-score: 592.3 bits: 117.9 E(32554): 1.1e-26 Smith-Waterman score: 593; 44.3% identity (72.9% similar) in 210 aa overlap (204-408:38-247) 180 190 200 210 220 pF1KB7 MASLITAETCAKLEPEDADENIDVTSNDPEFPSSPYSSS--SPC---GLDSIHETSARLL .:.: ..:. .: :...: : .::.: CCDS45 HGQFALTNGDPLNCHSYLSGYISLLLRAEPYPTSRFGSQCMQPNNIMGIENICELAARML 10 20 30 40 50 60 230 240 250 260 270 280 pF1KB7 FMAVKWAKNLPVFSSLPFRDQVILLEEAWSELFLLGAIQWSLPLDSCPLLAPPEASAAGG : ::.::.:.: : .: . ::: ::. .:::::.:.: : :.:: :::: :. CCDS45 FSAVEWARNIPFFPDLQITDQVALLRLTWSELFVLNAAQCSMPLHVAPLLAAAGLHASPM 70 80 90 100 110 120 290 300 310 320 330 340 pF1KB7 AQGRLTLASMETRVLQETISRFRALAVDPTEFACMKALVLFKPETRGLKDPEHVEALQDQ . :.. . :..:: . ...:: :: .:..:.::.::: .. ::.: :::.::.. CCDS45 SADRVVAFMDHIRIFQEQVEKLKALHVDSAEYSCLKAIVLFTSDACGLSDVAHVESLQEK 130 140 150 160 170 180 350 360 370 380 390 400 pF1KB7 SQVMLSQHSKAHHPSQPVRFGKLLLLLPSLRFITAERIELLFFRKTIGNTPMEKLLCDMF :: : .. ....:.::.::::::: ::::: ... :: ::: . .:.::.: :. ::. CCDS45 SQCALEEYVRSQYPNQPTRFGKLLLRLPSLRTVSSSVIEQLFFVRLVGKTPIETLIRDML 190 200 210 220 230 240 410 pF1KB7 KN CCDS45 LSGSSFNWPYMAIQ 250 260 >>CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 (423 aa) initn: 960 init1: 566 opt: 596 Z-score: 592.0 bits: 118.5 E(32554): 1.2e-26 Smith-Waterman score: 939; 40.6% identity (63.5% similar) in 397 aa overlap (21-408:56-407) 10 20 30 40 pF1KB7 METRPTALMSSTVAAAAPAAGAASRKESPGRWG-LGEDPTGVSPSLQ--- : . .:: : :. : : . : : CCDS40 AAQAARGGGGGAGEQQQQAGSGAPHTPQTPGQPGAPATPGTAGDKGQGPPGSGQSQQHIE 30 40 50 60 70 80 50 60 70 80 90 100 pF1KB7 CRVCGDSSSGKHYGIYACNGCSGFFKRSVRRRLIYRCQVGAGMCPVDKAHRNQCQACRLK : ::::.::::::: ..:.::..:::::::: : : :... . ::.:. :::::: :::: CCDS40 CVVCGDKSSGKHYGQFTCEGCKSFFKRSVRRNLTYTCRANRN-CPIDQHHRNQCQYCRLK 90 100 110 120 130 140 110 120 130 140 150 160 pF1KB7 KCLQAGMNQDAVQNERQPRSTAQVHLDSMESNTESRPESLVAPPAPAGRSPRGPTPMSAA :::..:: ..::: :.: : . : :. . . :.. CCDS40 KCLKVGMRREAVQRGRMP------------------PTQ----PNPGQYALTNGDPLN-- 150 160 170 180 170 180 190 200 210 220 pF1KB7 RALGHHFMASLITAETCAKLEPEDADENIDVTSNDPEFPSSPYSSS--SPC---GLDSIH :: .... :. . :: .:.: :.:. .: :...: CCDS40 ---GHCYLSGYIS--LLLRAEP---------------YPTSRYGSQCMQPNNIMGIENIC 190 200 210 220 230 240 250 260 270 280 pF1KB7 ETSARLLFMAVKWAKNLPVFSSLPFRDQVILLEEAWSELFLLGAIQWSLPLDSCPLLAPP : .::::: ::.::.:.: : .: . ::: ::. .:::::.:.: : :.:: :::: CCDS40 ELAARLLFSAVEWARNIPFFPDLQITDQVSLLRLTWSELFVLNAAQCSMPLHVAPLLAAA 230 240 250 260 270 280 290 300 310 320 330 340 pF1KB7 EASAAGGAQGRLTLASMETRVLQETISRFRALAVDPTEFACMKALVLFKPETRGLKDPEH :. . :.. . :..:: . ...:: :: .:..:.::.::: .. ::.: : CCDS40 GLHASPMSADRVVAFMDHIRIFQEQVEKLKALHVDSAEYSCLKAIVLFTSDACGLSDAAH 290 300 310 320 330 340 350 360 370 380 390 400 pF1KB7 VEALQDQSQVMLSQHSKAHHPSQPVRFGKLLLLLPSLRFITAERIELLFFRKTIGNTPME .:.::..:: : .. ....:.:: ::::::: ::::: ... :: ::: . .:.::.: CCDS40 IESLQEKSQCALEEYVRSQYPNQPSRFGKLLLRLPSLRTVSSSVIEQLFFVRLVGKTPIE 350 360 370 380 390 400 410 pF1KB7 KLLCDMFKN :. ::. CCDS40 TLIRDMLLSGSSFNWPYMSIQCS 410 420 >>CCDS45358.1 NR2F2 gene_id:7026|Hs108|chr15 (281 aa) initn: 591 init1: 567 opt: 593 Z-score: 591.8 bits: 117.9 E(32554): 1.2e-26 Smith-Waterman score: 593; 44.3% identity (72.9% similar) in 210 aa overlap (204-408:58-267) 180 190 200 210 220 pF1KB7 MASLITAETCAKLEPEDADENIDVTSNDPEFPSSPYSSS--SPC---GLDSIHETSARLL .:.: ..:. .: :...: : .::.: CCDS45 HGQFALTNGDPLNCHSYLSGYISLLLRAEPYPTSRFGSQCMQPNNIMGIENICELAARML 30 40 50 60 70 80 230 240 250 260 270 280 pF1KB7 FMAVKWAKNLPVFSSLPFRDQVILLEEAWSELFLLGAIQWSLPLDSCPLLAPPEASAAGG : ::.::.:.: : .: . ::: ::. .:::::.:.: : :.:: :::: :. CCDS45 FSAVEWARNIPFFPDLQITDQVALLRLTWSELFVLNAAQCSMPLHVAPLLAAAGLHASPM 90 100 110 120 130 140 290 300 310 320 330 340 pF1KB7 AQGRLTLASMETRVLQETISRFRALAVDPTEFACMKALVLFKPETRGLKDPEHVEALQDQ . :.. . :..:: . ...:: :: .:..:.::.::: .. ::.: :::.::.. CCDS45 SADRVVAFMDHIRIFQEQVEKLKALHVDSAEYSCLKAIVLFTSDACGLSDVAHVESLQEK 150 160 170 180 190 200 350 360 370 380 390 400 pF1KB7 SQVMLSQHSKAHHPSQPVRFGKLLLLLPSLRFITAERIELLFFRKTIGNTPMEKLLCDMF :: : .. ....:.::.::::::: ::::: ... :: ::: . .:.::.: :. ::. CCDS45 SQCALEEYVRSQYPNQPTRFGKLLLRLPSLRTVSSSVIEQLFFVRLVGKTPIETLIRDML 210 220 230 240 250 260 410 pF1KB7 KN CCDS45 LSGSSFNWPYMAIQ 270 280 >>CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 (414 aa) initn: 963 init1: 567 opt: 593 Z-score: 589.2 bits: 118.0 E(32554): 1.7e-26 Smith-Waterman score: 940; 40.5% identity (65.1% similar) in 395 aa overlap (15-408:49-400) 10 20 30 40 pF1KB7 METRPTALMSSTVAAAAPAAGAASRKESPGRWGLGEDPTGVSPS :..:: ::. . .:: : : : . CCDS10 QGSQASQAPPVPGPPPGAPHTPQTPGQGGPASTPAQTAAGGQGGPG--GPGSDKQQQQQH 20 30 40 50 60 70 50 60 70 80 90 100 pF1KB7 LQCRVCGDSSSGKHYGIYACNGCSGFFKRSVRRRLIYRCQVGAGMCPVDKAHRNQCQACR ..: ::::.::::::: ..:.::..:::::::: : : :... . ::.:. :::::: :: CCDS10 IECVVCGDKSSGKHYGQFTCEGCKSFFKRSVRRNLSYTCRANRN-CPIDQHHRNQCQYCR 80 90 100 110 120 130 110 120 130 140 150 160 pF1KB7 LKKCLQAGMNQDAVQNERQPRSTAQVHLDSMESNTESRPESLVAPPAPAGRSPRGPTPMS :::::..:: ..::: :.: : :. .: .. CCDS10 LKKCLKVGMRREAVQRGRMP------------------------PTQPT----HGQFALT 140 150 160 170 180 190 200 210 220 pF1KB7 AARALG-HHFMASLITAETCAKLEPEDADENIDVTSNDPEFPSSPYSSSSPCGLDSIHET . :. : .... :. :. : :: .: :. .. .. :...: : CCDS10 NGDPLNCHSYLSGYISLLLRAEPYP---------TS---RFGSQCMQPNNIMGIENICEL 170 180 190 200 210 230 240 250 260 270 280 pF1KB7 SARLLFMAVKWAKNLPVFSSLPFRDQVILLEEAWSELFLLGAIQWSLPLDSCPLLAPPEA .::.:: ::.::.:.: : .: . ::: ::. .:::::.:.: : :.:: :::: CCDS10 AARMLFSAVEWARNIPFFPDLQITDQVALLRLTWSELFVLNAAQCSMPLHVAPLLAAAGL 220 230 240 250 260 270 290 300 310 320 330 340 pF1KB7 SAAGGAQGRLTLASMETRVLQETISRFRALAVDPTEFACMKALVLFKPETRGLKDPEHVE :. . :.. . :..:: . ...:: :: .:..:.::.::: .. ::.: ::: CCDS10 HASPMSADRVVAFMDHIRIFQEQVEKLKALHVDSAEYSCLKAIVLFTSDACGLSDVAHVE 280 290 300 310 320 330 350 360 370 380 390 400 pF1KB7 ALQDQSQVMLSQHSKAHHPSQPVRFGKLLLLLPSLRFITAERIELLFFRKTIGNTPMEKL .::..:: : .. ....:.::.::::::: ::::: ... :: ::: . .:.::.: : CCDS10 SLQEKSQCALEEYVRSQYPNQPTRFGKLLLRLPSLRTVSSSVIEQLFFVRLVGKTPIETL 340 350 360 370 380 390 410 pF1KB7 LCDMFKN . ::. CCDS10 IRDMLLSGSSFNWPYMAIQ 400 410 >>CCDS2610.2 PPARG gene_id:5468|Hs108|chr3 (477 aa) initn: 398 init1: 217 opt: 498 Z-score: 494.7 bits: 100.7 E(32554): 3.1e-21 Smith-Waterman score: 498; 29.7% identity (58.4% similar) in 394 aa overlap (36-410:100-475) 10 20 30 40 50 60 pF1KB7 TALMSSTVAAAAPAAGAASRKESPGRWGLGEDPTGVSPSLQCRVCGDSSSGKHYGIYACN :.:.. ...::::::..:: :::..::. CCDS26 KLQEYQSAIKVEPASPPYYSEKTQLYNKPHEEPSNSLMAIECRVCGDKASGFHYGVHACE 70 80 90 100 110 120 70 80 90 100 110 120 pF1KB7 GCSGFFKRSVRRRLIY-RCQVGAGMCPVDKAHRNQCQACRLKKCLQAGMNQDAVQNERQP ::.:::.:..: .::: ::... : . : ::.:: ::..::: .::...:.. :.: CCDS26 GCKGFFRRTIRLKLIYDRCDLN---CRIHKKSRNKCQYCRFQKCLAVGMSHNAIRFGRMP 130 140 150 160 170 180 130 140 150 160 170 180 pF1KB7 RSTAQVHLDSMESNTES-RPES--LVAPPAPAGRSPRGPTPMSAARALGHHFMASLITAE .. . : . :. .. ::: : : : :.. :.: ...:.. CCDS26 QAEKEKLLAEISSDIDQLNPESADLRALAKHLYDSYIKSFPLTKAKA------RAILTGK 190 200 210 220 230 240 190 200 210 220 230 pF1KB7 TCAKLEPEDADENIDVTSNDP-EFPS-SPYSSSSPCGLDSIHE----TSARLLFMAVKWA : : : : . ..: .: .: . .: : . :.. . ...: CCDS26 TTDKSPFVIYDMNSLMMGEDKIKFKHITPLQEQSKEVAIRIFQGCQFRSVEAVQEITEYA 250 260 270 280 290 300 240 250 260 270 280 290 pF1KB7 KNLPVFSSLPFRDQVILLEEAWSELFLLGAIQWSLPLDSCPLLAPPEASAAGGAQGRLTL :..: : .: . ::: ::. . :. . .. :: ... .: : . : . : : CCDS26 KSIPGFVNLDLNDQVTLLKYGVHEI--IYTMLASL-MNKDGVLI----SEGQGFMTREFL 310 320 330 340 350 300 310 320 330 340 pF1KB7 AS--------METRVLQETISRFRALAVDPTEFACMKALVLFKPETRGLKDPEHVEALQD : :: . : .: :: .: ...: . :..... . :: . . .: .:: CCDS26 KSLRKPFGDFMEPKF--EFAVKFNALELDDSDLAIFIAVIILSGDRPGLLNVKPIEDIQD 360 370 380 390 400 410 350 360 370 380 390 400 pF1KB7 QSQVMLSQHSKAHHPSQPVRFGKLLLLLPSLRFITAERIELL-FFRKTIGNTPMEKLLCD . : . : .:: . :.::: . .:: :..:...:: ..:: . .. :: . CCDS26 NLLQALELQLKLNHPESSQLFAKLLQKMTDLRQIVTEHVQLLQVIKKTETDMSLHPLLQE 420 430 440 450 460 470 410 pF1KB7 MFKN ..:. CCDS26 IYKDLY 410 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 05:28:42 2016 done: Sun Nov 6 05:28:42 2016 Total Scan time: 3.380 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]