FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7751, 445 aa
1>>>pF1KB7751 445 - 445 aa - 445 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.8153+/-0.000889; mu= 16.3099+/- 0.054
mean_var=85.7608+/-17.131, 0's: 0 Z-trim(108.4): 126 B-trim: 41 in 1/50
Lambda= 0.138494
statistics sampled from 10086 (10212) to 10086 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.687), E-opt: 0.2 (0.314), width: 16
Scan time: 3.070
The best scores are: opt bits E(32554)
CCDS6220.2 HNF4G gene_id:3174|Hs108|chr8 ( 445) 2982 605.6 3.3e-173
CCDS83303.1 HNF4G gene_id:3174|Hs108|chr8 ( 408) 2750 559.2 2.7e-159
CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20 ( 464) 2187 446.7 2.2e-125
CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20 ( 474) 2080 425.4 6.1e-119
CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20 ( 442) 2070 423.3 2.3e-118
CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20 ( 417) 1969 403.2 2.6e-112
CCDS42876.1 HNF4A gene_id:3172|Hs108|chr20 ( 452) 1963 402.0 6.4e-112
CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20 ( 449) 1959 401.2 1.1e-111
CCDS68131.1 HNF4A gene_id:3172|Hs108|chr20 ( 395) 1852 379.8 2.7e-105
CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 ( 533) 935 196.6 5e-50
CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 916 192.8 6.2e-49
CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 ( 463) 902 190.0 4.3e-48
CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 ( 340) 898 189.1 5.8e-48
CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 ( 414) 773 164.2 2.3e-40
CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 ( 423) 764 162.4 8e-40
CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 ( 537) 633 136.3 7.3e-32
CCDS45359.1 NR2F2 gene_id:7026|Hs108|chr15 ( 261) 432 95.9 5e-20
CCDS45358.1 NR2F2 gene_id:7026|Hs108|chr15 ( 281) 432 95.9 5.3e-20
CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 ( 467) 424 94.5 2.4e-19
CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 ( 483) 424 94.5 2.5e-19
CCDS9051.1 NR2C1 gene_id:7181|Hs108|chr12 ( 603) 424 94.6 3e-19
CCDS74905.1 NR2C2 gene_id:7182|Hs108|chr3 ( 596) 404 90.6 4.7e-18
CCDS2621.1 NR2C2 gene_id:7182|Hs108|chr3 ( 615) 404 90.6 4.9e-18
CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19 ( 404) 393 88.3 1.6e-17
CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 387 87.1 3.9e-17
CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 386 86.9 4.6e-17
CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 381 85.8 8e-17
CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 376 84.9 1.9e-16
CCDS73750.1 NR2E3 gene_id:10002|Hs108|chr15 ( 410) 373 84.3 2.6e-16
CCDS69165.1 NR2E1 gene_id:7101|Hs108|chr6 ( 422) 373 84.3 2.6e-16
CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 373 84.3 2.8e-16
CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 371 83.9 3.7e-16
CCDS5063.1 NR2E1 gene_id:7101|Hs108|chr6 ( 385) 369 83.4 4.2e-16
CCDS9850.2 ESRRB gene_id:2103|Hs108|chr14 ( 508) 369 83.5 5.3e-16
CCDS73751.1 NR2E3 gene_id:10002|Hs108|chr15 ( 367) 357 81.0 2.2e-15
CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 ( 598) 347 79.2 1.3e-14
CCDS58061.1 ESRRG gene_id:2104|Hs108|chr1 ( 470) 340 77.7 2.8e-14
CCDS55340.1 NR6A1 gene_id:2649|Hs108|chr9 ( 475) 339 77.5 3.2e-14
CCDS65127.1 NR6A1 gene_id:2649|Hs108|chr9 ( 476) 339 77.5 3.2e-14
CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 ( 443) 337 77.1 4e-14
CCDS35137.1 NR6A1 gene_id:2649|Hs108|chr9 ( 480) 337 77.1 4.3e-14
CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 ( 626) 337 77.2 5.3e-14
CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 ( 637) 337 77.2 5.3e-14
CCDS1517.1 ESRRG gene_id:2104|Hs108|chr1 ( 435) 333 76.3 6.8e-14
CCDS41468.1 ESRRG gene_id:2104|Hs108|chr1 ( 458) 333 76.3 7.1e-14
CCDS58060.1 ESRRG gene_id:2104|Hs108|chr1 ( 396) 330 75.7 9.6e-14
CCDS8757.1 VDR gene_id:7421|Hs108|chr12 ( 427) 327 75.1 1.5e-13
CCDS10177.1 RORA gene_id:6095|Hs108|chr15 ( 523) 328 75.3 1.6e-13
CCDS55820.1 VDR gene_id:7421|Hs108|chr12 ( 477) 327 75.1 1.7e-13
CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 ( 598) 328 75.4 1.8e-13
>>CCDS6220.2 HNF4G gene_id:3174|Hs108|chr8 (445 aa)
initn: 2982 init1: 2982 opt: 2982 Z-score: 3223.2 bits: 605.6 E(32554): 3.3e-173
Smith-Waterman score: 2982; 100.0% identity (100.0% similar) in 445 aa overlap (1-445:1-445)
10 20 30 40 50 60
pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPETSMNTTDNGVNCLCAICGDRATGKH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPETSMNTTDNGVNCLCAICGDRATGKH
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 YGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 YGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 NERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCESM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 NERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCESM
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 KQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 KQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 HRNSCEVEISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 HRNSCEVEISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 FQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 FQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 MLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 MLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSG
370 380 390 400 410 420
430 440
pF1KB7 QEQYKIAANQASVISHQHLSKQKQL
:::::::::::::::::::::::::
CCDS62 QEQYKIAANQASVISHQHLSKQKQL
430 440
>>CCDS83303.1 HNF4G gene_id:3174|Hs108|chr8 (408 aa)
initn: 2750 init1: 2750 opt: 2750 Z-score: 2973.2 bits: 559.2 E(32554): 2.7e-159
Smith-Waterman score: 2750; 100.0% identity (100.0% similar) in 408 aa overlap (38-445:1-408)
10 20 30 40 50 60
pF1KB7 EVLDPTYTTLEFETMQILYNSSDSSAPETSMNTTDNGVNCLCAICGDRATGKHYGASSCD
::::::::::::::::::::::::::::::
CCDS83 MNTTDNGVNCLCAICGDRATGKHYGASSCD
10 20 30
70 80 90 100 110 120
pF1KB7 GCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQNERDRIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 GCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQNERDRIS
40 50 60 70 80 90
130 140 150 160 170 180
pF1KB7 TRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCESMKQQLLVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 TRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCESMKQQLLVL
100 110 120 130 140 150
190 200 210 220 230 240
pF1KB7 VEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVIHRNSCEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 VEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVIHRNSCEV
160 170 180 190 200 210
250 260 270 280 290 300
pF1KB7 EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMRFQVQIGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMRFQVQIGL
220 230 240 250 260 270
310 320 330 340 350 360
pF1KB7 EDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQEMLLGGAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 EDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQEMLLGGAS
280 290 300 310 320 330
370 380 390 400 410 420
pF1KB7 NDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSGQEQYKIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 NDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSGQEQYKIA
340 350 360 370 380 390
430 440
pF1KB7 ANQASVISHQHLSKQKQL
::::::::::::::::::
CCDS83 ANQASVISHQHLSKQKQL
400
>>CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20 (464 aa)
initn: 2051 init1: 1163 opt: 2187 Z-score: 2364.5 bits: 446.7 E(32554): 2.2e-125
Smith-Waterman score: 2187; 73.7% identity (88.8% similar) in 437 aa overlap (1-434:10-446)
10 20 30 40
pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLC
::::.:: .:::.:::::::..:.: ..:.: : :..:. .. ::. ::
CCDS46 MRLSKTLVDMDMADYSAALDPAYTTLEFENVQVLTMGNDTSPSEGTNLNAPNSLGVSALC
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB7 AICGDRATGKHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKC
:::::::::::::::::::::::::::.::.:.::::::::::::::::::::::::.::
CCDS46 AICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKC
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB7 FRAGMKKEAVQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKK
::::::::::::::::::::::... :..::::.: :::: ::::. : . :: .::
CCDS46 FRAGMKKEAVQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKK
130 140 150 160 170 180
170 180 190 200 210 220
pF1KB7 IASIGDVCESMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYK
::::.:::::::.::::::::::::::::::::::::::::::::::::::::::::..:
CCDS46 IASIADVCESMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFK
190 200 210 220 230 240
230 240 250 260 270 280
pF1KB7 DILLLGNNYVIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAK
:.:::::.:.. :. :. :.:::. :.::::: ::::.:::::::: ::::.:::::::
CCDS46 DVLLLGNDYIVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAK
250 260 270 280 290 300
290 300 310 320 330 340
pF1KB7 GLSDPVKIKNMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKL
::::: ::: .: :::..:::::::::::::::::::::::::::::::::::::::.::
CCDS46 GLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKL
310 320 330 340 350 360
350 360 370 380 390 400
pF1KB7 FGMVKIDNLLQEMLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTP
:::.:::::::::::::. .:. : :::.:::: :. . ..:. . : : . :.:::
CCDS46 FGMAKIDNLLQEMLLGGSPSDAPHAHHPLHPHLMQEHMGTNVIVANTMPTHLSNGQMSTP
370 380 390 400 410 420
410 420 430 440
pF1KB7 ETPLPSPPQGSGQEQYKIAANQASVISHQHLSKQKQL
::: :::: :::.: ::. . ...:
CCDS46 ETPQPSPPGGSGSEPYKLLPGAVATIVKPLSAIPQPTITKQEVI
430 440 450 460
>>CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20 (474 aa)
initn: 2028 init1: 1163 opt: 2080 Z-score: 2248.8 bits: 425.4 E(32554): 6.1e-119
Smith-Waterman score: 2153; 71.8% identity (86.8% similar) in 447 aa overlap (1-434:10-456)
10 20 30 40
pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLC
::::.:: .:::.:::::::..:.: ..:.: : :..:. .. ::. ::
CCDS13 MRLSKTLVDMDMADYSAALDPAYTTLEFENVQVLTMGNDTSPSEGTNLNAPNSLGVSALC
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB7 AICGDRATGKHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKC
:::::::::::::::::::::::::::.::.:.::::::::::::::::::::::::.::
CCDS13 AICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKC
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB7 FRAGMKKEAVQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKK
::::::::::::::::::::::... :..::::.: :::: ::::. : . :: .::
CCDS13 FRAGMKKEAVQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKK
130 140 150 160 170 180
170 180 190 200 210 220
pF1KB7 IASIGDVCESMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYK
::::.:::::::.::::::::::::::::::::::::::::::::::::::::::::..:
CCDS13 IASIADVCESMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFK
190 200 210 220 230 240
230 240 250 260 270 280
pF1KB7 DILLLGNNYVIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAK
:.:::::.:.. :. :. :.:::. :.::::: ::::.:::::::: ::::.:::::::
CCDS13 DVLLLGNDYIVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAK
250 260 270 280 290 300
290 300 310 320 330 340
pF1KB7 GLSDPVKIKNMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKL
::::: ::: .: :::..:::::::::::::::::::::::::::::::::::::::.::
CCDS13 GLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKL
310 320 330 340 350 360
350 360 370 380 390 400
pF1KB7 FGMVKIDNLLQEMLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQI---
:::.:::::::::::::. .:. : :::.:::: :. . ..:. . : : . :.
CCDS13 FGMAKIDNLLQEMLLGGSPSDAPHAHHPLHPHLMQEHMGTNVIVANTMPTHLSNGQMCEW
370 380 390 400 410 420
410 420 430 440
pF1KB7 -------STPETPLPSPPQGSGQEQYKIAANQASVISHQHLSKQKQL
.::::: :::: :::.: ::. . ...:
CCDS13 PRPRGQAATPETPQPSPPGGSGSEPYKLLPGAVATIVKPLSAIPQPTITKQEVI
430 440 450 460 470
>>CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20 (442 aa)
initn: 2051 init1: 1163 opt: 2070 Z-score: 2238.4 bits: 423.3 E(32554): 2.3e-118
Smith-Waterman score: 2070; 74.2% identity (88.6% similar) in 411 aa overlap (27-434:14-424)
10 20 30 40 50
pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLCAICGDRATG
.: :.: : :..:. .. ::. :::::::::::
CCDS46 MVSVNAPLGAPVESSYDTSPSEGTNLNAPNSLGVSALCAICGDRATG
10 20 30 40
60 70 80 90 100 110
pF1KB7 KHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEA
::::::::::::::::::.::.:.::::::::::::::::::::::::.:::::::::::
CCDS46 KHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEA
50 60 70 80 90 100
120 130 140 150 160 170
pF1KB7 VQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCE
:::::::::::::... :..::::.: :::: ::::. : . :: .::::::.::::
CCDS46 VQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKKIASIADVCE
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB7 SMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNY
:::.::::::::::::::::::::::::::::::::::::::::::::..::.:::::.:
CCDS46 SMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDY
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB7 VIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIK
.. :. :. :.:::. :.::::: ::::.:::::::: ::::.:::::::::::: :::
CCDS46 IVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIK
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB7 NMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNL
.: :::..:::::::::::::::::::::::::::::::::::::::.:::::.:::::
CCDS46 RLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNL
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB7 LQEMLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQ
::::::::. .:. : :::.:::: :. . ..:. . : : . :.:::::: ::::
CCDS46 LQEMLLGGSPSDAPHAHHPLHPHLMQEHMGTNVIVANTMPTHLSNGQMSTPETPQPSPPG
350 360 370 380 390 400
420 430 440
pF1KB7 GSGQEQYKIAANQASVISHQHLSKQKQL
:::.: ::. . ...:
CCDS46 GSGSEPYKLLPGAVATIVKPLSAIPQPTITKQEVI
410 420 430 440
>>CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20 (417 aa)
initn: 1163 init1: 1163 opt: 1969 Z-score: 2129.7 bits: 403.2 E(32554): 2.6e-112
Smith-Waterman score: 1969; 75.2% identity (89.1% similar) in 395 aa overlap (1-387:10-404)
10 20 30 40
pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLC
::::.:: .:::.:::::::..:.: ..:.: : :..:. .. ::. ::
CCDS13 MRLSKTLVDMDMADYSAALDPAYTTLEFENVQVLTMGNDTSPSEGTNLNAPNSLGVSALC
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB7 AICGDRATGKHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKC
:::::::::::::::::::::::::::.::.:.::::::::::::::::::::::::.::
CCDS13 AICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKC
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB7 FRAGMKKEAVQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKK
::::::::::::::::::::::... :..::::.: :::: ::::. : . :: .::
CCDS13 FRAGMKKEAVQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKK
130 140 150 160 170 180
170 180 190 200 210 220
pF1KB7 IASIGDVCESMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYK
::::.:::::::.::::::::::::::::::::::::::::::::::::::::::::..:
CCDS13 IASIADVCESMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFK
190 200 210 220 230 240
230 240 250 260 270 280
pF1KB7 DILLLGNNYVIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAK
:.:::::.:.. :. :. :.:::. :.::::: ::::.:::::::: ::::.:::::::
CCDS13 DVLLLGNDYIVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAK
250 260 270 280 290 300
290 300 310 320 330 340
pF1KB7 GLSDPVKIKNMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKL
::::: ::: .: :::..:::::::::::::::::::::::::::::::::::::::.::
CCDS13 GLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKL
310 320 330 340 350 360
350 360 370 380 390 400
pF1KB7 FGMVKIDNLLQEMLLGGA--SNDGSHLH--HPM-HPHLSQDPLTGQTILLGPMSTLVHAD
:::.::::::::::::: ...: : .:: ..::.
CCDS13 FGMAKIDNLLQEMLLGGPCQAQEGRGWSGDSPGDRPHTVSSPLSSLASPLCRFGQVA
370 380 390 400 410
410 420 430 440
pF1KB7 QISTPETPLPSPPQGSGQEQYKIAANQASVISHQHLSKQKQL
>>CCDS42876.1 HNF4A gene_id:3172|Hs108|chr20 (452 aa)
initn: 2028 init1: 1163 opt: 1963 Z-score: 2122.7 bits: 402.0 E(32554): 6.4e-112
Smith-Waterman score: 2036; 72.2% identity (86.5% similar) in 421 aa overlap (27-434:14-434)
10 20 30 40 50
pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLCAICGDRATG
.: :.: : :..:. .. ::. :::::::::::
CCDS42 MVSVNAPLGAPVESSYDTSPSEGTNLNAPNSLGVSALCAICGDRATG
10 20 30 40
60 70 80 90 100 110
pF1KB7 KHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEA
::::::::::::::::::.::.:.::::::::::::::::::::::::.:::::::::::
CCDS42 KHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEA
50 60 70 80 90 100
120 130 140 150 160 170
pF1KB7 VQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCE
:::::::::::::... :..::::.: :::: ::::. : . :: .::::::.::::
CCDS42 VQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKKIASIADVCE
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB7 SMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNY
:::.::::::::::::::::::::::::::::::::::::::::::::..::.:::::.:
CCDS42 SMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDY
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB7 VIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIK
.. :. :. :.:::. :.::::: ::::.:::::::: ::::.:::::::::::: :::
CCDS42 IVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIK
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB7 NMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNL
.: :::..:::::::::::::::::::::::::::::::::::::::.:::::.:::::
CCDS42 RLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNL
290 300 310 320 330 340
360 370 380 390 400
pF1KB7 LQEMLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQI----------ST
::::::::. .:. : :::.:::: :. . ..:. . : : . :. .:
CCDS42 LQEMLLGGSPSDAPHAHHPLHPHLMQEHMGTNVIVANTMPTHLSNGQMCEWPRPRGQAAT
350 360 370 380 390 400
410 420 430 440
pF1KB7 PETPLPSPPQGSGQEQYKIAANQASVISHQHLSKQKQL
:::: :::: :::.: ::. . ...:
CCDS42 PETPQPSPPGGSGSEPYKLLPGAVATIVKPLSAIPQPTITKQEVI
410 420 430 440 450
>>CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20 (449 aa)
initn: 2028 init1: 1163 opt: 1959 Z-score: 2118.5 bits: 401.2 E(32554): 1.1e-111
Smith-Waterman score: 2032; 72.5% identity (86.6% similar) in 418 aa overlap (30-434:14-431)
10 20 30 40 50
pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLCAICGDRATG
:.: : :..:. .. ::. :::::::::::
CCDS74 MSDWGQGFPQDPPDTSPSEGTNLNAPNSLGVSALCAICGDRATG
10 20 30 40
60 70 80 90 100 110
pF1KB7 KHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEA
::::::::::::::::::.::.:.::::::::::::::::::::::::.:::::::::::
CCDS74 KHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEA
50 60 70 80 90 100
120 130 140 150 160 170
pF1KB7 VQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCE
:::::::::::::... :..::::.: :::: ::::. : . :: .::::::.::::
CCDS74 VQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKKIASIADVCE
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB7 SMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNY
:::.::::::::::::::::::::::::::::::::::::::::::::..::.:::::.:
CCDS74 SMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDY
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB7 VIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIK
.. :. :. :.:::. :.::::: ::::.:::::::: ::::.:::::::::::: :::
CCDS74 IVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIK
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB7 NMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNL
.: :::..:::::::::::::::::::::::::::::::::::::::.:::::.:::::
CCDS74 RLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNL
290 300 310 320 330 340
360 370 380 390 400
pF1KB7 LQEMLLGGASNDGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQI----------ST
::::::::. .:. : :::.:::: :. . ..:. . : : . :. .:
CCDS74 LQEMLLGGSPSDAPHAHHPLHPHLMQEHMGTNVIVANTMPTHLSNGQMCEWPRPRGQAAT
350 360 370 380 390 400
410 420 430 440
pF1KB7 PETPLPSPPQGSGQEQYKIAANQASVISHQHLSKQKQL
:::: :::: :::.: ::. . ...:
CCDS74 PETPQPSPPGGSGSEPYKLLPGAVATIVKPLSAIPQPTITKQEVI
410 420 430 440
>>CCDS68131.1 HNF4A gene_id:3172|Hs108|chr20 (395 aa)
initn: 1189 init1: 1163 opt: 1852 Z-score: 2003.7 bits: 379.8 E(32554): 2.7e-105
Smith-Waterman score: 1852; 75.9% identity (88.3% similar) in 369 aa overlap (27-387:14-382)
10 20 30 40 50
pF1KB7 MDMANYSEVLDPTYTTLEFETMQILYNSSDSSAPE-TSMNTTDN-GVNCLCAICGDRATG
.: :.: : :..:. .. ::. :::::::::::
CCDS68 MVSVNAPLGAPVESSYDTSPSEGTNLNAPNSLGVSALCAICGDRATG
10 20 30 40
60 70 80 90 100 110
pF1KB7 KHYGASSCDGCKGFFRRSIRKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEA
::::::::::::::::::.::.:.::::::::::::::::::::::::.:::::::::::
CCDS68 KHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEA
50 60 70 80 90 100
120 130 140 150 160 170
pF1KB7 VQNERDRISTRRSTFDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIASIGDVCE
:::::::::::::... :..::::.: :::: ::::. : . :: .::::::.::::
CCDS68 VQNERDRISTRRSSYEDSSLPSINALLQAEVLSRQITSPVSGINGDIRAKKIASIADVCE
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB7 SMKQQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNY
:::.::::::::::::::::::::::::::::::::::::::::::::..::.:::::.:
CCDS68 SMKEQLLVLVEWAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDY
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB7 VIHRNSCEV-EISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIK
.. :. :. :.:::. :.::::: ::::.:::::::: ::::.:::::::::::: :::
CCDS68 IVPRHCPELAEMSRVSIRILDELVLPFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIK
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB7 NMRFQVQIGLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNL
.: :::..:::::::::::::::::::::::::::::::::::::::.:::::.:::::
CCDS68 RLRSQVQVSLEDYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNL
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB7 LQEMLLGGASND----GSHLHHPM-HPHLSQDPLTGQTILLGPMSTLVHADQISTPETPL
:::::::: . : : .:: ..::.
CCDS68 LQEMLLGGPCQAQEGRGWSGDSPGDRPHTVSSPLSSLASPLCRFGQVA
350 360 370 380 390
420 430 440
pF1KB7 PSPPQGSGQEQYKIAANQASVISHQHLSKQKQL
>>CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 (533 aa)
initn: 746 init1: 409 opt: 935 Z-score: 1011.6 bits: 196.6 E(32554): 5e-50
Smith-Waterman score: 935; 43.8% identity (75.3% similar) in 324 aa overlap (48-362:204-526)
20 30 40 50 60 70
pF1KB7 EFETMQILYNSSDSSAPETSMNTTDNGVNCLCAICGDRATGKHYGASSCDGCKGFFRRSI
::::::::..:::::. ::.::::::.:.:
CCDS47 GPPEDVKPPVLGVRGLHCPPPPGGPGAGKRLCAICGDRSSGKHYGVYSCEGCKGFFKRTI
180 190 200 210 220 230
80 90 100 110 120 130
pF1KB7 RKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQNERDRISTRRSTFDGSN
::. .:::: ...:.::: .::.:.::: .::. .:::.::::.::.: . . . .:..
CCDS47 RKDLTYSCRDNKDCTVDKRQRNRCQYCRYQKCLATGMKREAVQEERQRGKDKDGDGEGAG
240 250 260 270 280 290
140 150 160 170 180
pF1KB7 -----IPSINTLAQAEVRSRQIS---VSSPGSSTDINVKKIASIGDVCESMKQQLLVLVE
.: .. . .::. .: : : .::.. . . . ..:.. .::..:::
CCDS47 GAPEEMP-VDRILEAELAVEQKSDQGVEGPGGTGGSGSSPNDPVTNICQAADKQLFTLVE
300 310 320 330 340 350
190 200 210 220 230 240
pF1KB7 WAKYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVIHRNSCEVE-
::: :: : ::::::: :::: .: :. . ..::. .: .::... .:::: .
CCDS47 WAKRIPHFSSLPLDDQVILLRAGWNELLIASFSHRSIDVRDGILLATGLHVHRNSAHSAG
360 370 380 390 400 410
250 260 270 280 290 300
pF1KB7 ISRVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMRFQVQIGLE
.. . .::: ::: ......: .: .::.::..:.:::::::.: ... .: .: .::
CCDS47 VGAIFDRVLTELVSKMRDMRMDKTELGCLRAIILFNPDAKGLSNPSEVEVLREKVYASLE
420 430 440 450 460 470
310 320 330 340 350 360
pF1KB7 DYINDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQEMLLGGASN
: ... ...:::..::: ::.:.:: . .:.. : ::.: . ::..:.:::
CCDS47 TYCKQKYPEQQGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQL
480 490 500 510 520 530
370 380 390 400 410 420
pF1KB7 DGSHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSGQEQYKIAA
CCDS47 A
445 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 03:10:24 2016 done: Sun Nov 6 03:10:25 2016
Total Scan time: 3.070 Total Display time: 0.080
Function used was FASTA [36.3.4 Apr, 2011]