FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7751, 445 aa 1>>>pF1KB7751 445 - 445 aa - 445 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8153+/-0.000889; mu= 16.3099+/- 0.054 mean_var=85.7608+/-17.131, 0's: 0 Z-trim(108.4): 126 B-trim: 41 in 1/50 Lambda= 0.138494 statistics sampled from 10086 (10212) to 10086 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.687), E-opt: 0.2 (0.314), width: 16 Scan time: 3.070 The best scores are: opt bits E(32554) CCDS6220.2 HNF4G gene_id:3174|Hs108|chr8 ( 445) 2982 605.6 3.3e-173 CCDS83303.1 HNF4G gene_id:3174|Hs108|chr8 ( 408) 2750 559.2 2.7e-159 CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20 ( 464) 2187 446.7 2.2e-125 CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20 ( 474) 2080 425.4 6.1e-119 CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20 ( 442) 2070 423.3 2.3e-118 CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20 ( 417) 1969 403.2 2.6e-112 CCDS42876.1 HNF4A gene_id:3172|Hs108|chr20 ( 452) 1963 402.0 6.4e-112 CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20 ( 449) 1959 401.2 1.1e-111 CCDS68131.1 HNF4A gene_id:3172|Hs108|chr20 ( 395) 1852 379.8 2.7e-105 CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 ( 533) 935 196.6 5e-50 CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 916 192.8 6.2e-49 CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 ( 463) 902 190.0 4.3e-48 CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 ( 340) 898 189.1 5.8e-48 CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 ( 414) 773 164.2 2.3e-40 CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 ( 423) 764 162.4 8e-40 CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 ( 537) 633 136.3 7.3e-32 CCDS45359.1 NR2F2 gene_id:7026|Hs108|chr15 ( 261) 432 95.9 5e-20 CCDS45358.1 NR2F2 gene_id:7026|Hs108|chr15 ( 281) 432 95.9 5.3e-20 CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 ( 467) 424 94.5 2.4e-19 CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 ( 483) 424 94.5 2.5e-19 CCDS9051.1 NR2C1 gene_id:7181|Hs108|chr12 ( 603) 424 94.6 3e-19 CCDS74905.1 NR2C2 gene_id:7182|Hs108|chr3 ( 596) 404 90.6 4.7e-18 CCDS2621.1 NR2C2 gene_id:7182|Hs108|chr3 ( 615) 404 90.6 4.9e-18 CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19 ( 404) 393 88.3 1.6e-17 CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 387 87.1 3.9e-17 CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 386 86.9 4.6e-17 CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 381 85.8 8e-17 CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 376 84.9 1.9e-16 CCDS73750.1 NR2E3 gene_id:10002|Hs108|chr15 ( 410) 373 84.3 2.6e-16 CCDS69165.1 NR2E1 gene_id:7101|Hs108|chr6 ( 422) 373 84.3 2.6e-16 CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 373 84.3 2.8e-16 CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 371 83.9 3.7e-16 CCDS5063.1 NR2E1 gene_id:7101|Hs108|chr6 ( 385) 369 83.4 4.2e-16 CCDS9850.2 ESRRB gene_id:2103|Hs108|chr14 ( 508) 369 83.5 5.3e-16 CCDS73751.1 NR2E3 gene_id:10002|Hs108|chr15 ( 367) 357 81.0 2.2e-15 CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 ( 598) 347 79.2 1.3e-14 CCDS58061.1 ESRRG gene_id:2104|Hs108|chr1 ( 470) 340 77.7 2.8e-14 CCDS55340.1 NR6A1 gene_id:2649|Hs108|chr9 ( 475) 339 77.5 3.2e-14 CCDS65127.1 NR6A1 gene_id:2649|Hs108|chr9 ( 476) 339 77.5 3.2e-14 CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 ( 443) 337 77.1 4e-14 CCDS35137.1 NR6A1 gene_id:2649|Hs108|chr9 ( 480) 337 77.1 4.3e-14 CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 ( 626) 337 77.2 5.3e-14 CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 ( 637) 337 77.2 5.3e-14 CCDS1517.1 ESRRG gene_id:2104|Hs108|chr1 ( 435) 333 76.3 6.8e-14 CCDS41468.1 ESRRG gene_id:2104|Hs108|chr1 ( 458) 333 76.3 7.1e-14 CCDS58060.1 ESRRG gene_id:2104|Hs108|chr1 ( 396) 330 75.7 9.6e-14 CCDS8757.1 VDR gene_id:7421|Hs108|chr12 ( 427) 327 75.1 1.5e-13 CCDS10177.1 RORA gene_id:6095|Hs108|chr15 ( 523) 328 75.3 1.6e-13 CCDS55820.1 VDR gene_id:7421|Hs108|chr12 ( 477) 327 75.1 1.7e-13 CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 ( 598) 328 75.4 1.8e-13 >>CCDS6220.2 HNF4G gene_id:3174|Hs108|chr8 (445 aa) initn: 2982 init1: 2982 opt: 2982 Z-score: 3223.2 bits: 605.6 E(32554): 3.3e-173 Smith-Waterman score: 2982; 100.0% identity (100.0% similar) in 445 aa overlap (1-445:1-445) 10 20 30 40 50 60 pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPETSMNTTDNGVNCLCAICGDRATGKH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPETSMNTTDNGVNCLCAICGDRATGKH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 YGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 YGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 NERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCESM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 NERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCESM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 KQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 KQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 HRNSCEVEISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 HRNSCEVEISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 FQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 FQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 MLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 MLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSG 370 380 390 400 410 420 430 440 pF1KB7 QEQYKIAANQASVISHQHLSKQKQL ::::::::::::::::::::::::: CCDS62 QEQYKIAANQASVISHQHLSKQKQL 430 440 >>CCDS83303.1 HNF4G gene_id:3174|Hs108|chr8 (408 aa) initn: 2750 init1: 2750 opt: 2750 Z-score: 2973.2 bits: 559.2 E(32554): 2.7e-159 Smith-Waterman score: 2750; 100.0% identity (100.0% similar) in 408 aa overlap (38-445:1-408) 10 20 30 40 50 60 pF1KB7 EVLDPTYTTLEFETMQILYNSSDSSAPETSMNTTDNGVNCLCAICGDRATGKHYGASSCD :::::::::::::::::::::::::::::: CCDS83 MNTTDNGVNCLCAICGDRATGKHYGASSCD 10 20 30 70 80 90 100 110 120 pF1KB7 GCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQNERDRIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 GCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQNERDRIS 40 50 60 70 80 90 130 140 150 160 170 180 pF1KB7 TRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCESMKQQLLVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 TRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCESMKQQLLVL 100 110 120 130 140 150 190 200 210 220 230 240 pF1KB7 VEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVIHRNSCEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 VEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVIHRNSCEV 160 170 180 190 200 210 250 260 270 280 290 300 pF1KB7 EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMRFQVQIGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMRFQVQIGL 220 230 240 250 260 270 310 320 330 340 350 360 pF1KB7 EDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQEMLLGGAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 EDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQEMLLGGAS 280 290 300 310 320 330 370 380 390 400 410 420 pF1KB7 NDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSGQEQYKIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 NDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSGQEQYKIA 340 350 360 370 380 390 430 440 pF1KB7 ANQASVISHQHLSKQKQL :::::::::::::::::: CCDS83 ANQASVISHQHLSKQKQL 400 >>CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20 (464 aa) initn: 2051 init1: 1163 opt: 2187 Z-score: 2364.5 bits: 446.7 E(32554): 2.2e-125 Smith-Waterman score: 2187; 73.7% identity (88.8% similar) in 437 aa overlap (1-434:10-446) 10 20 30 40 pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLC ::::.:: .:::.:::::::..:.: ..:.: : :..:. .. ::. :: CCDS46 MRLSKTLVDMDMADYSAALDPAYTTLEFENVQVLTMGNDTSPSEGTNLNAPNSLGVSALC 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB7 AICGDRATGKHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKC :::::::::::::::::::::::::::.::.:.::::::::::::::::::::::::.:: CCDS46 AICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKC 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB7 FRAGMKKEAVQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKK ::::::::::::::::::::::... :..::::.: :::: ::::. : . :: .:: CCDS46 FRAGMKKEAVQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKK 130 140 150 160 170 180 170 180 190 200 210 220 pF1KB7 IASIGDVCESMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYK ::::.:::::::.::::::::::::::::::::::::::::::::::::::::::::..: CCDS46 IASIADVCESMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFK 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB7 DILLLGNNYVIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAK :.:::::.:.. :. :. :.:::. :.::::: ::::.:::::::: ::::.::::::: CCDS46 DVLLLGNDYIVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAK 250 260 270 280 290 300 290 300 310 320 330 340 pF1KB7 GLSDPVKIKNMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKL ::::: ::: .: :::..:::::::::::::::::::::::::::::::::::::::.:: CCDS46 GLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKL 310 320 330 340 350 360 350 360 370 380 390 400 pF1KB7 FGMVKIDNLLQEMLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTP :::.:::::::::::::. .:. : :::.:::: :. . ..:. . : : . :.::: CCDS46 FGMAKIDNLLQEMLLGGSPSDAPHAHHPLHPHLMQEHMGTNVIVANTMPTHLSNGQMSTP 370 380 390 400 410 420 410 420 430 440 pF1KB7 ETPLPSPPQGSGQEQYKIAANQASVISHQHLSKQKQL ::: :::: :::.: ::. . ...: CCDS46 ETPQPSPPGGSGSEPYKLLPGAVATIVKPLSAIPQPTITKQEVI 430 440 450 460 >>CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20 (474 aa) initn: 2028 init1: 1163 opt: 2080 Z-score: 2248.8 bits: 425.4 E(32554): 6.1e-119 Smith-Waterman score: 2153; 71.8% identity (86.8% similar) in 447 aa overlap (1-434:10-456) 10 20 30 40 pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLC ::::.:: .:::.:::::::..:.: ..:.: : :..:. .. ::. :: CCDS13 MRLSKTLVDMDMADYSAALDPAYTTLEFENVQVLTMGNDTSPSEGTNLNAPNSLGVSALC 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB7 AICGDRATGKHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKC :::::::::::::::::::::::::::.::.:.::::::::::::::::::::::::.:: CCDS13 AICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKC 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB7 FRAGMKKEAVQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKK ::::::::::::::::::::::... :..::::.: :::: ::::. : . :: .:: CCDS13 FRAGMKKEAVQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKK 130 140 150 160 170 180 170 180 190 200 210 220 pF1KB7 IASIGDVCESMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYK ::::.:::::::.::::::::::::::::::::::::::::::::::::::::::::..: CCDS13 IASIADVCESMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFK 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB7 DILLLGNNYVIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAK :.:::::.:.. :. :. :.:::. :.::::: ::::.:::::::: ::::.::::::: CCDS13 DVLLLGNDYIVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAK 250 260 270 280 290 300 290 300 310 320 330 340 pF1KB7 GLSDPVKIKNMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKL ::::: ::: .: :::..:::::::::::::::::::::::::::::::::::::::.:: CCDS13 GLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKL 310 320 330 340 350 360 350 360 370 380 390 400 pF1KB7 FGMVKIDNLLQEMLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQI--- :::.:::::::::::::. .:. : :::.:::: :. . ..:. . : : . :. CCDS13 FGMAKIDNLLQEMLLGGSPSDAPHAHHPLHPHLMQEHMGTNVIVANTMPTHLSNGQMCEW 370 380 390 400 410 420 410 420 430 440 pF1KB7 -------STPETPLPSPPQGSGQEQYKIAANQASVISHQHLSKQKQL .::::: :::: :::.: ::. . ...: CCDS13 PRPRGQAATPETPQPSPPGGSGSEPYKLLPGAVATIVKPLSAIPQPTITKQEVI 430 440 450 460 470 >>CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20 (442 aa) initn: 2051 init1: 1163 opt: 2070 Z-score: 2238.4 bits: 423.3 E(32554): 2.3e-118 Smith-Waterman score: 2070; 74.2% identity (88.6% similar) in 411 aa overlap (27-434:14-424) 10 20 30 40 50 pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLCAICGDRATG .: :.: : :..:. .. ::. ::::::::::: CCDS46 MVSVNAPLGAPVESSYDTSPSEGTNLNAPNSLGVSALCAICGDRATG 10 20 30 40 60 70 80 90 100 110 pF1KB7 KHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEA ::::::::::::::::::.::.:.::::::::::::::::::::::::.::::::::::: CCDS46 KHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEA 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB7 VQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCE :::::::::::::... :..::::.: :::: ::::. : . :: .::::::.:::: CCDS46 VQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKKIASIADVCE 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB7 SMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNY :::.::::::::::::::::::::::::::::::::::::::::::::..::.:::::.: CCDS46 SMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDY 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB7 VIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIK .. :. :. :.:::. :.::::: ::::.:::::::: ::::.:::::::::::: ::: CCDS46 IVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIK 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB7 NMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNL .: :::..:::::::::::::::::::::::::::::::::::::::.:::::.::::: CCDS46 RLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNL 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB7 LQEMLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQ ::::::::. .:. : :::.:::: :. . ..:. . : : . :.:::::: :::: CCDS46 LQEMLLGGSPSDAPHAHHPLHPHLMQEHMGTNVIVANTMPTHLSNGQMSTPETPQPSPPG 350 360 370 380 390 400 420 430 440 pF1KB7 GSGQEQYKIAANQASVISHQHLSKQKQL :::.: ::. . ...: CCDS46 GSGSEPYKLLPGAVATIVKPLSAIPQPTITKQEVI 410 420 430 440 >>CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20 (417 aa) initn: 1163 init1: 1163 opt: 1969 Z-score: 2129.7 bits: 403.2 E(32554): 2.6e-112 Smith-Waterman score: 1969; 75.2% identity (89.1% similar) in 395 aa overlap (1-387:10-404) 10 20 30 40 pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLC ::::.:: .:::.:::::::..:.: ..:.: : :..:. .. ::. :: CCDS13 MRLSKTLVDMDMADYSAALDPAYTTLEFENVQVLTMGNDTSPSEGTNLNAPNSLGVSALC 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB7 AICGDRATGKHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKC :::::::::::::::::::::::::::.::.:.::::::::::::::::::::::::.:: CCDS13 AICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKC 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB7 FRAGMKKEAVQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKK ::::::::::::::::::::::... :..::::.: :::: ::::. : . :: .:: CCDS13 FRAGMKKEAVQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKK 130 140 150 160 170 180 170 180 190 200 210 220 pF1KB7 IASIGDVCESMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYK ::::.:::::::.::::::::::::::::::::::::::::::::::::::::::::..: CCDS13 IASIADVCESMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFK 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB7 DILLLGNNYVIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAK :.:::::.:.. :. :. :.:::. :.::::: ::::.:::::::: ::::.::::::: CCDS13 DVLLLGNDYIVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAK 250 260 270 280 290 300 290 300 310 320 330 340 pF1KB7 GLSDPVKIKNMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKL ::::: ::: .: :::..:::::::::::::::::::::::::::::::::::::::.:: CCDS13 GLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKL 310 320 330 340 350 360 350 360 370 380 390 400 pF1KB7 FGMVKIDNLLQEMLLGGA--SNDGSHLH--HPM-HPHLSQDPLTGQTILLGPMSTLVHAD :::.::::::::::::: ...: : .:: ..::. CCDS13 FGMAKIDNLLQEMLLGGPCQAQEGRGWSGDSPGDRPHTVSSPLSSLASPLCRFGQVA 370 380 390 400 410 410 420 430 440 pF1KB7 QISTPETPLPSPPQGSGQEQYKIAANQASVISHQHLSKQKQL >>CCDS42876.1 HNF4A gene_id:3172|Hs108|chr20 (452 aa) initn: 2028 init1: 1163 opt: 1963 Z-score: 2122.7 bits: 402.0 E(32554): 6.4e-112 Smith-Waterman score: 2036; 72.2% identity (86.5% similar) in 421 aa overlap (27-434:14-434) 10 20 30 40 50 pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLCAICGDRATG .: :.: : :..:. .. ::. ::::::::::: CCDS42 MVSVNAPLGAPVESSYDTSPSEGTNLNAPNSLGVSALCAICGDRATG 10 20 30 40 60 70 80 90 100 110 pF1KB7 KHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEA ::::::::::::::::::.::.:.::::::::::::::::::::::::.::::::::::: CCDS42 KHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEA 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB7 VQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCE :::::::::::::... :..::::.: :::: ::::. : . :: .::::::.:::: CCDS42 VQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKKIASIADVCE 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB7 SMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNY :::.::::::::::::::::::::::::::::::::::::::::::::..::.:::::.: CCDS42 SMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDY 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB7 VIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIK .. :. :. :.:::. :.::::: ::::.:::::::: ::::.:::::::::::: ::: CCDS42 IVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIK 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB7 NMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNL .: :::..:::::::::::::::::::::::::::::::::::::::.:::::.::::: CCDS42 RLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNL 290 300 310 320 330 340 360 370 380 390 400 pF1KB7 LQEMLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQI----------ST ::::::::. .:. : :::.:::: :. . ..:. . : : . :. .: CCDS42 LQEMLLGGSPSDAPHAHHPLHPHLMQEHMGTNVIVANTMPTHLSNGQMCEWPRPRGQAAT 350 360 370 380 390 400 410 420 430 440 pF1KB7 PETPLPSPPQGSGQEQYKIAANQASVISHQHLSKQKQL :::: :::: :::.: ::. . ...: CCDS42 PETPQPSPPGGSGSEPYKLLPGAVATIVKPLSAIPQPTITKQEVI 410 420 430 440 450 >>CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20 (449 aa) initn: 2028 init1: 1163 opt: 1959 Z-score: 2118.5 bits: 401.2 E(32554): 1.1e-111 Smith-Waterman score: 2032; 72.5% identity (86.6% similar) in 418 aa overlap (30-434:14-431) 10 20 30 40 50 pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLCAICGDRATG :.: : :..:. .. ::. ::::::::::: CCDS74 MSDWGQGFPQDPPDTSPSEGTNLNAPNSLGVSALCAICGDRATG 10 20 30 40 60 70 80 90 100 110 pF1KB7 KHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEA ::::::::::::::::::.::.:.::::::::::::::::::::::::.::::::::::: CCDS74 KHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEA 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB7 VQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCE :::::::::::::... :..::::.: :::: ::::. : . :: .::::::.:::: CCDS74 VQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKKIASIADVCE 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB7 SMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNY :::.::::::::::::::::::::::::::::::::::::::::::::..::.:::::.: CCDS74 SMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDY 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB7 VIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIK .. :. :. :.:::. :.::::: ::::.:::::::: ::::.:::::::::::: ::: CCDS74 IVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIK 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB7 NMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNL .: :::..:::::::::::::::::::::::::::::::::::::::.:::::.::::: CCDS74 RLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNL 290 300 310 320 330 340 360 370 380 390 400 pF1KB7 LQEMLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQI----------ST ::::::::. .:. : :::.:::: :. . ..:. . : : . :. .: CCDS74 LQEMLLGGSPSDAPHAHHPLHPHLMQEHMGTNVIVANTMPTHLSNGQMCEWPRPRGQAAT 350 360 370 380 390 400 410 420 430 440 pF1KB7 PETPLPSPPQGSGQEQYKIAANQASVISHQHLSKQKQL :::: :::: :::.: ::. . ...: CCDS74 PETPQPSPPGGSGSEPYKLLPGAVATIVKPLSAIPQPTITKQEVI 410 420 430 440 >>CCDS68131.1 HNF4A gene_id:3172|Hs108|chr20 (395 aa) initn: 1189 init1: 1163 opt: 1852 Z-score: 2003.7 bits: 379.8 E(32554): 2.7e-105 Smith-Waterman score: 1852; 75.9% identity (88.3% similar) in 369 aa overlap (27-387:14-382) 10 20 30 40 50 pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLCAICGDRATG .: :.: : :..:. .. ::. ::::::::::: CCDS68 MVSVNAPLGAPVESSYDTSPSEGTNLNAPNSLGVSALCAICGDRATG 10 20 30 40 60 70 80 90 100 110 pF1KB7 KHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEA ::::::::::::::::::.::.:.::::::::::::::::::::::::.::::::::::: CCDS68 KHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEA 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB7 VQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCE :::::::::::::... :..::::.: :::: ::::. : . :: .::::::.:::: CCDS68 VQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKKIASIADVCE 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB7 SMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNY :::.::::::::::::::::::::::::::::::::::::::::::::..::.:::::.: CCDS68 SMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDY 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB7 VIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIK .. :. :. :.:::. :.::::: ::::.:::::::: ::::.:::::::::::: ::: CCDS68 IVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIK 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB7 NMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNL .: :::..:::::::::::::::::::::::::::::::::::::::.:::::.::::: CCDS68 RLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNL 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB7 LQEMLLGGASND----GSHLHHPM-HPHLSQDPLTGQTILLGPMSTLVHADQISTPETPL :::::::: . : : .:: ..::. CCDS68 LQEMLLGGPCQAQEGRGWSGDSPGDRPHTVSSPLSSLASPLCRFGQVA 350 360 370 380 390 420 430 440 pF1KB7 PSPPQGSGQEQYKIAANQASVISHQHLSKQKQL >>CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 (533 aa) initn: 746 init1: 409 opt: 935 Z-score: 1011.6 bits: 196.6 E(32554): 5e-50 Smith-Waterman score: 935; 43.8% identity (75.3% similar) in 324 aa overlap (48-362:204-526) 20 30 40 50 60 70 pF1KB7 EFETMQILYNSSDSSAPETSMNTTDNGVNCLCAICGDRATGKHYGASSCDGCKGFFRRSI ::::::::..:::::. ::.::::::.:.: CCDS47 GPPEDVKPPVLGVRGLHCPPPPGGPGAGKRLCAICGDRSSGKHYGVYSCEGCKGFFKRTI 180 190 200 210 220 230 80 90 100 110 120 130 pF1KB7 RKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQNERDRISTRRSTFDGSN ::. .:::: ...:.::: .::.:.::: .::. .:::.::::.::.: . . . .:.. CCDS47 RKDLTYSCRDNKDCTVDKRQRNRCQYCRYQKCLATGMKREAVQEERQRGKDKDGDGEGAG 240 250 260 270 280 290 140 150 160 170 180 pF1KB7 -----IPSINTLAQAEVRSRQIS---VSSPGSSTDINVKKIASIGDVCESMKQQLLVLVE .: .. . .::. .: : : .::.. . . . ..:.. .::..::: CCDS47 GAPEEMP-VDRILEAELAVEQKSDQGVEGPGGTGGSGSSPNDPVTNICQAADKQLFTLVE 300 310 320 330 340 350 190 200 210 220 230 240 pF1KB7 WAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVIHRNSCEVE- ::: :: : ::::::: :::: .: :. . ..::. .: .::... .:::: . CCDS47 WAKRIPHFSSLPLDDQVILLRAGWNELLIASFSHRSIDVRDGILLATGLHVHRNSAHSAG 360 370 380 390 400 410 250 260 270 280 290 300 pF1KB7 ISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMRFQVQIGLE .. . .::: ::: ......: .: .::.::..:.:::::::.: ... .: .: .:: CCDS47 VGAIFDRVLTELVSKMRDMRMDKTELGCLRAIILFNPDAKGLSNPSEVEVLREKVYASLE 420 430 440 450 460 470 310 320 330 340 350 360 pF1KB7 DYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQEMLLGGASN : ... ...:::..::: ::.:.:: . .:.. : ::.: . ::..:.::: CCDS47 TYCKQKYPEQQGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQL 480 490 500 510 520 530 370 380 390 400 410 420 pF1KB7 DGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSGQEQYKIAA CCDS47 A 445 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 03:10:24 2016 done: Sun Nov 6 03:10:25 2016 Total Scan time: 3.070 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]