FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9770, 462 aa
1>>>pF1KB9770 462 - 462 aa - 462 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.2861+/-0.00105; mu= -0.0290+/- 0.063
mean_var=206.2611+/-42.013, 0's: 0 Z-trim(111.0): 122 B-trim: 5 in 1/50
Lambda= 0.089303
statistics sampled from 11899 (12025) to 11899 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.721), E-opt: 0.2 (0.369), width: 16
Scan time: 3.440
The best scores are: opt bits E(32554)
CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 3123 415.0 8.2e-116
CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 ( 463) 2162 291.2 1.5e-78
CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 ( 533) 2137 288.0 1.6e-77
CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 ( 537) 2119 285.7 8.1e-77
CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 ( 340) 1983 268.0 1e-71
CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 ( 414) 1001 141.6 1.5e-33
CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 ( 423) 972 137.8 2e-32
CCDS83303.1 HNF4G gene_id:3174|Hs108|chr8 ( 408) 916 130.6 2.9e-30
CCDS6220.2 HNF4G gene_id:3174|Hs108|chr8 ( 445) 916 130.6 3.2e-30
CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20 ( 442) 907 129.5 7e-30
CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20 ( 449) 907 129.5 7.1e-30
CCDS42876.1 HNF4A gene_id:3172|Hs108|chr20 ( 452) 907 129.5 7.1e-30
CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20 ( 464) 907 129.5 7.3e-30
CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20 ( 474) 907 129.5 7.4e-30
CCDS68131.1 HNF4A gene_id:3172|Hs108|chr20 ( 395) 902 128.8 1e-29
CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20 ( 417) 902 128.8 1e-29
CCDS1517.1 ESRRG gene_id:2104|Hs108|chr1 ( 435) 743 108.3 1.6e-23
CCDS41468.1 ESRRG gene_id:2104|Hs108|chr1 ( 458) 743 108.4 1.7e-23
CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 739 107.8 2.3e-23
CCDS9850.2 ESRRB gene_id:2103|Hs108|chr14 ( 508) 731 106.8 5.3e-23
CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 728 106.4 5.4e-23
CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 728 106.4 6.1e-23
CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 719 105.3 1.4e-22
CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 713 104.5 2.4e-22
CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 706 103.6 4.5e-22
CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 ( 598) 678 100.1 6.8e-21
CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 ( 611) 678 100.1 7e-21
CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12 ( 652) 678 100.1 7.4e-21
CCDS58237.1 RARG gene_id:5916|Hs108|chr12 ( 432) 594 89.1 9.5e-18
CCDS45358.1 NR2F2 gene_id:7026|Hs108|chr15 ( 281) 562 84.9 1.2e-16
CCDS45359.1 NR2F2 gene_id:7026|Hs108|chr15 ( 261) 561 84.8 1.2e-16
CCDS46775.1 RARB gene_id:5915|Hs108|chr3 ( 336) 532 81.1 2e-15
CCDS73750.1 NR2E3 gene_id:10002|Hs108|chr15 ( 410) 471 73.3 5.3e-13
CCDS58060.1 ESRRG gene_id:2104|Hs108|chr1 ( 396) 466 72.6 8.1e-13
CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 ( 598) 462 72.2 1.6e-12
CCDS74905.1 NR2C2 gene_id:7182|Hs108|chr3 ( 596) 458 71.7 2.3e-12
CCDS2621.1 NR2C2 gene_id:7182|Hs108|chr3 ( 615) 458 71.7 2.4e-12
CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 ( 467) 436 68.8 1.4e-11
CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 ( 483) 436 68.8 1.4e-11
CCDS9051.1 NR2C1 gene_id:7181|Hs108|chr12 ( 603) 436 68.9 1.7e-11
CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19 ( 404) 422 67.0 4.2e-11
CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 ( 443) 414 66.0 9.3e-11
>>CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 (462 aa)
initn: 3123 init1: 3123 opt: 3123 Z-score: 2192.6 bits: 415.0 E(32554): 8.2e-116
Smith-Waterman score: 3123; 100.0% identity (100.0% similar) in 462 aa overlap (1-462:1-462)
10 20 30 40 50 60
pF1KB9 MDTKHFLPLDFSTQVNSSLTSPTGRGSMAAPSLHPSLGPGIGSPGQLHSPISTLSSPING
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 MDTKHFLPLDFSTQVNSSLTSPTGRGSMAAPSLHPSLGPGIGSPGQLHSPISTLSSPING
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 MGPPFSVISSPMGPHSMSVPTTPTLGFSTGSPQLSSPMNPVSSSEDIKPPLGLNGVLKVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 MGPPFSVISSPMGPHSMSVPTTPTLGFSTGSPQLSSPMNPVSSSEDIKPPLGLNGVLKVP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 AHPSGNMASFTKHICAICGDRSSGKHYGVYSCEGCKGFFKRTVRKDLTYTCRDNKDCLID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 AHPSGNMASFTKHICAICGDRSSGKHYGVYSCEGCKGFFKRTVRKDLTYTCRDNKDCLID
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 KRQRNRCQYCRYQKCLAMGMKREAVQEERQRGKDRNENEVESTSSANEDMPVERILEAEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 KRQRNRCQYCRYQKCLAMGMKREAVQEERQRGKDRNENEVESTSSANEDMPVERILEAEL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 AVEPKTETYVEANMGLNPSSPNDPVTNICQAADKQLFTLVEWAKRIPHFSELPLDDQVIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 AVEPKTETYVEANMGLNPSSPNDPVTNICQAADKQLFTLVEWAKRIPHFSELPLDDQVIL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 LRAGWNELLIASFSHRSIAVKDGILLATGLHVHRNSAHSAGVGAIFDRVLTELVSKMRDM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 LRAGWNELLIASFSHRSIAVKDGILLATGLHVHRNSAHSAGVGAIFDRVLTELVSKMRDM
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 QMDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEAYCKHKYPEQPGRFAKLLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 QMDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEAYCKHKYPEQPGRFAKLLL
370 380 390 400 410 420
430 440 450 460
pF1KB9 RLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQMT
::::::::::::::::::::::::::::::::::::::::::
CCDS35 RLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQMT
430 440 450 460
>>CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 (463 aa)
initn: 2139 init1: 1217 opt: 2162 Z-score: 1523.5 bits: 291.2 E(32554): 1.5e-78
Smith-Waterman score: 2162; 73.8% identity (87.1% similar) in 451 aa overlap (21-462:18-463)
10 20 30 40 50
pF1KB9 MDTKHFLPLDFSTQVNSSLTSPTGRGSMA-APSLHPSLGPGIGS-PGQLHSPIS---TLS
:: :: . .:: : : . : :. .:.: :::
CCDS12 MYGNYSHFMKFPAGYGGSPGHTGSTSMSPSAALSTGKPMDSHPSYTDTPVSAPRTLS
10 20 30 40 50
60 70 80 90 100 110
pF1KB9 ---SPINGMGPPFSVISSPMGPHSMSVPTTPTLGF-STGSPQLSSPMNPVSSSEDIKPPL
.:.:..: :. ::.: ::: : .. . : ... . : ::. .: :::::::::
CCDS12 AVGTPLNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNV-VNSVSSSEDIKPLP
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB9 GLNGVLKVPAHPSGNMASFTKHICAICGDRSSGKHYGVYSCEGCKGFFKRTVRKDLTYTC
:: :. .. .:: . .:..:::::::::::::::::::::::::::::::.:::: :::
CCDS12 GLPGIGNM-NYPSTSPGSLVKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTC
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB9 RDNKDCLIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQRGKDRNENEVESTSSANEDMP
:::::::::::::::::::::::::.::::::::::::::...: :.:.: ..:..::::
CCDS12 RDNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDMP
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB9 VERILEAELAVEPKTETYVEANMGLNPSSPNDPVTNICQAADKQLFTLVEWAKRIPHFSE
::::::::::::::::.: . :: .: ::::::::.::::::::::::::::::::.
CCDS12 VERILEAELAVEPKTESYGDMNM---ENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSD
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB9 LPLDDQVILLRAGWNELLIASFSHRSIAVKDGILLATGLHVHRNSAHSAGVGAIFDRVLT
: :.::::::::::::::::::::::..:.:::::::::::::.::::::::.:::::::
CCDS12 LTLEDQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLT
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB9 ELVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEAYCKHKYPEQ
::::::.::::::.::::::::::::::.::::::.:::.:::::::.:::: :.:::::
CCDS12 ELVSKMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQ
360 370 380 390 400 410
420 430 440 450 460
pF1KB9 PGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQMT
:::::::::::::::::::::::::::::::::::::::::::::.: :.:
CCDS12 PGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT
420 430 440 450 460
>>CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 (533 aa)
initn: 2092 init1: 1281 opt: 2137 Z-score: 1505.2 bits: 288.0 E(32554): 1.6e-77
Smith-Waterman score: 2137; 72.0% identity (84.6% similar) in 461 aa overlap (12-461:80-532)
10 20 30
pF1KB9 MDTKHFLPLDFSTQVNSSLTSPTGRG----SMAAPSLHPSL
: . .:: .: .: : .: : ::
CCDS47 AAAVAGGEQQTPEPEPGEAGRDGMGDSGRDSRSPDSSSPNPLPQGVPPPSPPGPPLPPST
50 60 70 80 90 100
40 50 60 70 80 90
pF1KB9 GPGIGSPGQLHSPISTLSSPINGMGPPFSVISSPMGPHSMSVPTTPTLGFSTGSPQLSSP
.:..:. : : . : .: :: :::: :: .. :. : .. ..:::..:
CCDS47 APSLGGSGA--PPPPPMPPP--PLGSPFPVISSSMGSPGLPPPAPPGFSGPVSSPQINST
110 120 130 140 150 160
100 110 120 130 140 150
pF1KB9 MN-PVSSS---EDIKPP-LGLNGVLKVPAHPSGNMASFTKHICAICGDRSSGKHYGVYSC
.. : ..: ::.::: ::. : :. : :.: :. :..::::::::::::::::::
CCDS47 VSLPGGGSGPPEDVKPPVLGVRG-LHCPPPPGGPGAG--KRLCAICGDRSSGKHYGVYSC
170 180 190 200 210 220
160 170 180 190 200 210
pF1KB9 EGCKGFFKRTVRKDLTYTCRDNKDCLIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQRG
::::::::::.::::::.::::::: .:::::::::::::::::: ::::::::::::::
CCDS47 EGCKGFFKRTIRKDLTYSCRDNKDCTVDKRQRNRCQYCRYQKCLATGMKREAVQEERQRG
230 240 250 260 270 280
220 230 240 250 260 270
pF1KB9 KDRNENEVESTSSANEDMPVERILEAELAVEPKTETYVEA--NMGLNPSSPNDPVTNICQ
::.. .. :....: :.:::.:::::::::: :.. ::. . : . ::::::::::::
CCDS47 KDKD-GDGEGAGGAPEEMPVDRILEAELAVEQKSDQGVEGPGGTGGSGSSPNDPVTNICQ
290 300 310 320 330 340
280 290 300 310 320 330
pF1KB9 AADKQLFTLVEWAKRIPHFSELPLDDQVILLRAGWNELLIASFSHRSIAVKDGILLATGL
:::::::::::::::::::: ::::::::::::::::::::::::::: :.:::::::::
CCDS47 AADKQLFTLVEWAKRIPHFSSLPLDDQVILLRAGWNELLIASFSHRSIDVRDGILLATGL
350 360 370 380 390 400
340 350 360 370 380 390
pF1KB9 HVHRNSAHSAGVGAIFDRVLTELVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNPAEVE
::::::::::::::::::::::::::::::.::::::::::::.:::::.::::::.:::
CCDS47 HVHRNSAHSAGVGAIFDRVLTELVSKMRDMRMDKTELGCLRAIILFNPDAKGLSNPSEVE
410 420 430 440 450 460
400 410 420 430 440 450
pF1KB9 ALREKVYASLEAYCKHKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTF
.::::::::::.:::.::::: ::::::::::::::::::::::::::::::::::::::
CCDS47 VLREKVYASLETYCKQKYPEQQGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTF
470 480 490 500 510 520
460
pF1KB9 LMEMLEAPHQMT
::::::::::.
CCDS47 LMEMLEAPHQLA
530
>>CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 (537 aa)
initn: 2099 init1: 707 opt: 2119 Z-score: 1492.6 bits: 285.7 E(32554): 8.1e-77
Smith-Waterman score: 2119; 71.4% identity (83.9% similar) in 465 aa overlap (12-461:80-536)
10 20 30
pF1KB9 MDTKHFLPLDFSTQVNSSLTSPTGRG----SMAAPSLHPSL
: . .:: .: .: : .: : ::
CCDS59 AAAVAGGEQQTPEPEPGEAGRDGMGDSGRDSRSPDSSSPNPLPQGVPPPSPPGPPLPPST
50 60 70 80 90 100
40 50 60 70 80 90
pF1KB9 GPGIGSPGQLHSPISTLSSPINGMGPPFSVISSPMGPHSMSVPTTPTLGFSTGSPQLSSP
.:..:. : : . : .: :: :::: :: .. :. : .. ..:::..:
CCDS59 APSLGGSGA--PPPPPMPPP--PLGSPFPVISSSMGSPGLPPPAPPGFSGPVSSPQINST
110 120 130 140 150 160
100 110 120 130 140 150
pF1KB9 MN-PVSSS---EDIKPP-LGLNGVLKVPAHPSGNMASFTKHICAICGDRSSGKHYGVYSC
.. : ..: ::.::: ::. : :. : :.: :. :..::::::::::::::::::
CCDS59 VSLPGGGSGPPEDVKPPVLGVRG-LHCPPPPGGPGAG--KRLCAICGDRSSGKHYGVYSC
170 180 190 200 210 220
160 170 180 190 200 210
pF1KB9 EGCKGFFKRTVRKDLTYTCRDNKDCLIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQRG
::::::::::.::::::.::::::: .:::::::::::::::::: ::::::::::::::
CCDS59 EGCKGFFKRTIRKDLTYSCRDNKDCTVDKRQRNRCQYCRYQKCLATGMKREAVQEERQRG
230 240 250 260 270 280
220 230 240 250 260 270
pF1KB9 KDRNENEVESTSSANEDMPVERILEAELAVEPKTETYVEA--NMGLNPSSPNDPVTNICQ
::.. .. :....: :.:::.:::::::::: :.. ::. . : . ::::::::::::
CCDS59 KDKD-GDGEGAGGAPEEMPVDRILEAELAVEQKSDQGVEGPGGTGGSGSSPNDPVTNICQ
290 300 310 320 330 340
280 290 300 310 320 330
pF1KB9 AADKQLFTLVEWAKRIPHFSELPLDDQVILLRAGWNELLIASFSHRSIAVKDGILLATGL
:::::::::::::::::::: ::::::::::::::::::::::::::: :.:::::::::
CCDS59 AADKQLFTLVEWAKRIPHFSSLPLDDQVILLRAGWNELLIASFSHRSIDVRDGILLATGL
350 360 370 380 390 400
340 350 360 370 380
pF1KB9 HVHRNSAHSAGVGAIFDR----VLTELVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNP
:::::::::::::::::: ::::::::::::.::::::::::::.:::::.::::::
CCDS59 HVHRNSAHSAGVGAIFDRSLSRVLTELVSKMRDMRMDKTELGCLRAIILFNPDAKGLSNP
410 420 430 440 450 460
390 400 410 420 430 440
pF1KB9 AEVEALREKVYASLEAYCKHKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTP
.:::.::::::::::.:::.::::: ::::::::::::::::::::::::::::::::::
CCDS59 SEVEVLREKVYASLETYCKQKYPEQQGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTP
470 480 490 500 510 520
450 460
pF1KB9 IDTFLMEMLEAPHQMT
::::::::::::::.
CCDS59 IDTFLMEMLEAPHQLA
530
>>CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 (340 aa)
initn: 1985 init1: 1217 opt: 1983 Z-score: 1400.8 bits: 268.0 E(32554): 1e-71
Smith-Waterman score: 1983; 85.0% identity (95.6% similar) in 341 aa overlap (122-462:3-340)
100 110 120 130 140 150
pF1KB9 PQLSSPMNPVSSSEDIKPPLGLNGVLKVPAHPSGNMASFTKHICAICGDRSSGKHYGVYS
.:: . .:..::::::::::::::::::::
CCDS72 MNYPSTSPGSLVKHICAICGDRSSGKHYGVYS
10 20 30
160 170 180 190 200 210
pF1KB9 CEGCKGFFKRTVRKDLTYTCRDNKDCLIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQR
:::::::::::.:::: ::::::::::::::::::::::::::::.::::::::::::::
CCDS72 CEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQR
40 50 60 70 80 90
220 230 240 250 260 270
pF1KB9 GKDRNENEVESTSSANEDMPVERILEAELAVEPKTETYVEANMGLNPSSPNDPVTNICQA
...: :.:.: ..:..::::::::::::::::::::.: . :: .: ::::::::.:
CCDS72 SRERAESEAECATSGHEDMPVERILEAELAVEPKTESYGDMNM---ENSTNDPVTNICHA
100 110 120 130 140
280 290 300 310 320 330
pF1KB9 ADKQLFTLVEWAKRIPHFSELPLDDQVILLRAGWNELLIASFSHRSIAVKDGILLATGLH
:::::::::::::::::::.: :.::::::::::::::::::::::..:.::::::::::
CCDS72 ADKQLFTLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSHRSVSVQDGILLATGLH
150 160 170 180 190 200
340 350 360 370 380 390
pF1KB9 VHRNSAHSAGVGAIFDRVLTELVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNPAEVEA
:::.::::::::.:::::::::::::.::::::.::::::::::::::.::::::.:::.
CCDS72 VHRSSAHSAGVGSIFDRVLTELVSKMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVET
210 220 230 240 250 260
400 410 420 430 440 450
pF1KB9 LREKVYASLEAYCKHKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFL
:::::::.:::: :.:::::::::::::::::::::::::::::::::::::::::::::
CCDS72 LREKVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFL
270 280 290 300 310 320
460
pF1KB9 MEMLEAPHQMT
:::::.: :.:
CCDS72 MEMLETPLQIT
330 340
>>CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 (414 aa)
initn: 566 init1: 532 opt: 1001 Z-score: 715.8 bits: 141.6 E(32554): 1.5e-33
Smith-Waterman score: 1001; 39.9% identity (70.1% similar) in 398 aa overlap (64-455:11-400)
40 50 60 70 80 90
pF1KB9 HPSLGPGIGSPGQLHSPISTLSSPINGMGPPFSVISSPMGPHSMSVPTTPTLGFSTGSPQ
: . . . .: .. ..: .: : :.:.
CCDS10 MAMVVSTWRDPQDEVPGSQGSQASQAPPVP--GPPPGAPH
10 20 30
100 110 120 130 140 150
pF1KB9 LSSPMNPVSSSEDIKPPLGLNGVLKVPAHPSGNMASFTKHI-CAICGDRSSGKHYGVYSC
.:..: ... : : :. :... . .:: :..:::.::::::: ..:
CCDS10 --TPQTPGQGGPASTPAQTAAGGQGGPGGPGSDKQQQQQHIECVVCGDKSSGKHYGQFTC
40 50 60 70 80 90
160 170 180 190 200 210
pF1KB9 EGCKGFFKRTVRKDLTYTCRDNKDCLIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQRG
::::.::::.::..:.:::: :..: ::...::.::::: .::: .::.::::: : :
CCDS10 EGCKSFFKRSVRRNLSYTCRANRNCPIDQHHRNQCQYCRLKKCLKVGMRREAVQ--RGRM
100 110 120 130 140 150
220 230 240 250 260 270
pF1KB9 KDRNENEVESTSSANEDMPVERILEAELAVEPKTETYVEANMGLNPSSPND--PVTNICQ
. .. . . . .. . . : . ... ..: : . .: . .::. . :::.
CCDS10 PPTQPTHGQFALTNGDPLNCHSYLSGYISLLLRAEPYPTSRFGSQCMQPNNIMGIENICE
160 170 180 190 200 210
280 290 300 310 320
pF1KB9 AADKQLFTLVEWAKRIPHFSELPLDDQVILLRAGWNELLIASFSHRSIAVKDGILLAT-G
: ..::. ::::. :: : .: . ::: ::: :.::.. . .. :. .. . :::. :
CCDS10 LAARMLFSAVEWARNIPFFPDLQITDQVALLRLTWSELFVLNAAQCSMPLHVAPLLAAAG
220 230 240 250 260 270
330 340 350 360 370 380
pF1KB9 LHVHRNSAHSAGVGAIFD--RVLTELVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNPA
::. :: : :..: :.. : : :.. ...:..: .::.:::::. :. :::. :
CCDS10 LHASPMSADR--VVAFMDHIRIFQEQVEKLKALHVDSAEYSCLKAIVLFTSDACGLSDVA
280 290 300 310 320 330
390 400 410 420 430 440
pF1KB9 EVEALREKVYASLEAYCKHKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPI
.::.:.:: .:: : . .::.:: ::.:::::::.::... . .:.::: .:.: :::
CCDS10 HVESLQEKSQCALEEYVRSQYPNQPTRFGKLLLRLPSLRTVSSSVIEQLFFVRLVGKTPI
340 350 360 370 380 390
450 460
pF1KB9 DTFLMEMLEAPHQMT
.:.. .::
CCDS10 ETLIRDMLLSGSSFNWPYMAIQ
400 410
>>CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 (423 aa)
initn: 584 init1: 538 opt: 972 Z-score: 695.5 bits: 137.8 E(32554): 2e-32
Smith-Waterman score: 972; 42.1% identity (70.2% similar) in 373 aa overlap (89-455:46-407)
60 70 80 90 100 110
pF1KB9 NGMGPPFSVISSPMGPHSMSVPTTPTLGFSTGSPQLSSPMNPVSSSEDIKPPLGLNGVLK
.:.:. .:..: . . : : :
CCDS40 AGGNPGGPNPAAQAARGGGGGAGEQQQQAGSGAPH--TPQTPGQPGAPATP--GTAG--D
20 30 40 50 60
120 130 140 150 160 170
pF1KB9 VPAHPSGNMASFTKHI-CAICGDRSSGKHYGVYSCEGCKGFFKRTVRKDLTYTCRDNKDC
: :. : .:: :..:::.::::::: ..:::::.::::.::..:::::: :..:
CCDS40 KGQGPPGSGQS-QQHIECVVCGDKSSGKHYGQFTCEGCKSFFKRSVRRNLTYTCRANRNC
70 80 90 100 110 120
180 190 200 210 220 230
pF1KB9 LIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQRGKDRNENEVESTSSANEDMPVERILE
::...::.::::: .::: .::.::::: : : . : . . . .. . . :
CCDS40 PIDQHHRNQCQYCRLKKCLKVGMRREAVQ--RGRMPPTQPNPGQYALTNGDPLNGHCYLS
130 140 150 160 170 180
240 250 260 270 280 290
pF1KB9 AELAVEPKTETYVEANMGLNPSSPND--PVTNICQAADKQLFTLVEWAKRIPHFSELPLD
. ... ..: : . .: . .::. . :::. : . ::. ::::. :: : .: .
CCDS40 GYISLLLRAEPYPTSRYGSQCMQPNNIMGIENICELAARLLFSAVEWARNIPFFPDLQIT
190 200 210 220 230 240
300 310 320 330 340 350
pF1KB9 DQVILLRAGWNELLIASFSHRSIAVKDGILLAT-GLHVHRNSAHSAGVGAIFD--RVLTE
::: ::: :.::.. . .. :. .. . :::. :::. :: : :..: :.. :
CCDS40 DQVSLLRLTWSELFVLNAAQCSMPLHVAPLLAAAGLHASPMSADR--VVAFMDHIRIFQE
250 260 270 280 290 300
360 370 380 390 400 410
pF1KB9 LVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEAYCKHKYPEQP
: :.. ...:..: .::.:::::. :. :::. :..:.:.:: .:: : . .::.::
CCDS40 QVEKLKALHVDSAEYSCLKAIVLFTSDACGLSDAAHIESLQEKSQCALEEYVRSQYPNQP
310 320 330 340 350 360
420 430 440 450 460
pF1KB9 GRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQMT
.::.:::::::.::... . .:.::: .:.: :::.:.. .::
CCDS40 SRFGKLLLRLPSLRTVSSSVIEQLFFVRLVGKTPIETLIRDMLLSGSSFNWPYMSIQCS
370 380 390 400 410 420
>>CCDS83303.1 HNF4G gene_id:3174|Hs108|chr8 (408 aa)
initn: 732 init1: 399 opt: 916 Z-score: 656.7 bits: 130.6 E(32554): 2.9e-30
Smith-Waterman score: 916; 42.9% identity (75.5% similar) in 322 aa overlap (134-455:11-325)
110 120 130 140 150 160
pF1KB9 SEDIKPPLGLNGVLKVPAHPSGNMASFTKHICAICGDRSSGKHYGVYSCEGCKGFFKRTV
.:::::::..:::::. ::.::::::.:..
CCDS83 MNTTDNGVNCLCAICGDRATGKHYGASSCDGCKGFFRRSI
10 20 30 40
170 180 190 200 210 220
pF1KB9 RKDLTYTCRDNKDCLIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQRGKDRNENEVEST
::. .:.:: ...:..:: .::.:.::: .::. :::.::::.::.: . : .::
CCDS83 RKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQNERDRISTR-----RST
50 60 70 80 90
230 240 250 260 270 280
pF1KB9 SSANEDMPVERILEAELAVEPKTETYVEANMGLNPSSPNDPVTNICQAADKQLFTLVEWA
.... .. . .::. . . . .. .: .. . . ..:.. .::..:::::
CCDS83 FDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIAS-IGDVCESMKQQLLVLVEWA
100 110 120 130 140 150
290 300 310 320 330 340
pF1KB9 KRIPHFSELPLDDQVILLRAGWNELLIASFSHRSIAVKDGILLATGLHVHRNSAHSAGVG
: :: : :::::::: :::: .: :. . ..::. :: .::... .:::: . . ..
CCDS83 KYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVIHRNSCE-VEIS
160 170 180 190 200 210
350 360 370 380 390 400
pF1KB9 AIFDRVLTELVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEAY
. .::: ::: ....:.: .: .::.:::.:.::.::::.:.... .: .: .:: :
CCDS83 RVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMRFQVQIGLEDY
220 230 240 250 260 270
410 420 430 440 450 460
pF1KB9 CKHKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQMT
. . .. :::..::: ::.:.:: . .:.. : ::.: . ::..:.:::
CCDS83 INDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQEMLLGGASNDG
280 290 300 310 320 330
CCDS83 SHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSGQEQYKIAANQ
340 350 360 370 380 390
>>CCDS6220.2 HNF4G gene_id:3174|Hs108|chr8 (445 aa)
initn: 732 init1: 399 opt: 916 Z-score: 656.2 bits: 130.6 E(32554): 3.2e-30
Smith-Waterman score: 916; 42.9% identity (75.5% similar) in 322 aa overlap (134-455:48-362)
110 120 130 140 150 160
pF1KB9 SEDIKPPLGLNGVLKVPAHPSGNMASFTKHICAICGDRSSGKHYGVYSCEGCKGFFKRTV
.:::::::..:::::. ::.::::::.:..
CCDS62 EFETMQILYNSSDSSAPETSMNTTDNGVNCLCAICGDRATGKHYGASSCDGCKGFFRRSI
20 30 40 50 60 70
170 180 190 200 210 220
pF1KB9 RKDLTYTCRDNKDCLIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQRGKDRNENEVEST
::. .:.:: ...:..:: .::.:.::: .::. :::.::::.::.: . : .::
CCDS62 RKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQNERDRISTR-----RST
80 90 100 110 120 130
230 240 250 260 270 280
pF1KB9 SSANEDMPVERILEAELAVEPKTETYVEANMGLNPSSPNDPVTNICQAADKQLFTLVEWA
.... .. . .::. . . . .. .: .. . . ..:.. .::..:::::
CCDS62 FDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIAS-IGDVCESMKQQLLVLVEWA
140 150 160 170 180 190
290 300 310 320 330 340
pF1KB9 KRIPHFSELPLDDQVILLRAGWNELLIASFSHRSIAVKDGILLATGLHVHRNSAHSAGVG
: :: : :::::::: :::: .: :. . ..::. :: .::... .:::: . . ..
CCDS62 KYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVIHRNSCE-VEIS
200 210 220 230 240 250
350 360 370 380 390 400
pF1KB9 AIFDRVLTELVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEAY
. .::: ::: ....:.: .: .::.:::.:.::.::::.:.... .: .: .:: :
CCDS62 RVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMRFQVQIGLEDY
260 270 280 290 300 310
410 420 430 440 450 460
pF1KB9 CKHKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQMT
. . .. :::..::: ::.:.:: . .:.. : ::.: . ::..:.:::
CCDS62 INDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQEMLLGGASNDG
320 330 340 350 360 370
CCDS62 SHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSGQEQYKIAANQ
380 390 400 410 420 430
>>CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20 (442 aa)
initn: 910 init1: 515 opt: 907 Z-score: 649.9 bits: 129.5 E(32554): 7e-30
Smith-Waterman score: 934; 41.7% identity (70.3% similar) in 374 aa overlap (94-459:4-362)
70 80 90 100 110 120
pF1KB9 PFSVISSPMGPHSMSVPTTPTLGFSTGSPQLSSPMN-PVSSSEDIKPPLGLNGVLKVPAH
...:.. :: :: : .: : : :..: .
CCDS46 MVSVNAPLGAPVESSYDTSPSEGTN--LNAP-N
10 20 30
130 140 150 160 170 180
pF1KB9 PSGNMASFTKHICAICGDRSSGKHYGVYSCEGCKGFFKRTVRKDLTYTCRDNKDCLIDKR
: : .:::::::..:::::. ::.::::::.:.:::. :.:: ...:..::
CCDS46 SLGVSA-----LCAICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKD
40 50 60 70 80
190 200 210 220 230 240
pF1KB9 QRNRCQYCRYQKCLAMGMKREAVQEERQRGKDRNENEVESTSSANEDMP-VERILEAELA
.::.:.::: .::. :::.::::.::.: . : .: . ..: .. .:.::.
CCDS46 KRNQCRYCRLKKCFRAGMKKEAVQNERDRISTRR------SSYEDSSLPSINALLQAEVL
90 100 110 120 130
250 260 270 280 290 300
pF1KB9 VEPKTETYVEANMGLNPSSPNDPVTNICQAADKQLFTLVEWAKRIPHFSELPLDDQVILL
. : : : .. ....:.. .::..:::::: :: : :::::::: ::
CCDS46 SRQITSPVSGIN-GDIRAKKIASIADVCESMKEQLLVLVEWAKYIPAFCELPLDDQVALL
140 150 160 170 180 190
310 320 330 340 350 360
pF1KB9 RAGWNELLIASFSHRSIAVKDGILLATGLHVHRNSAHSAGVGAIFDRVLTELVSKMRDMQ
:: .: :. . ..::.. :: .::.. : :. . : .. . :.: ::: ....:
CCDS46 RAHAGEHLLLGATKRSMVFKDVLLLGNDYIVPRHCPELAEMSRVSIRILDELVLPFQELQ
200 210 220 230 240 250
370 380 390 400 410 420
pF1KB9 MDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEAYCKHKYPEQPGRFAKLLLR
.: .: . :.::..:.::.::::.:.... :: .: .::: : . . .. :::..:::
CCDS46 IDDNEYAYLKAIIFFDPDAKGLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRFGELLLL
260 270 280 290 300 310
430 440 450 460
pF1KB9 LPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEML------EAPHQMT
::.:.:: . .:.. :.::.: . ::..:.::: .:::
CCDS46 LPTLQSITWQMIEQIQFIKLFGMAKIDNLLQEMLLGGSPSDAPHAHHPLHPHLMQEHMGT
320 330 340 350 360 370
CCDS46 NVIVANTMPTHLSNGQMSTPETPQPSPPGGSGSEPYKLLPGAVATIVKPLSAIPQPTITK
380 390 400 410 420 430
462 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 18:47:54 2016 done: Fri Nov 4 18:47:55 2016
Total Scan time: 3.440 Total Display time: 0.080
Function used was FASTA [36.3.4 Apr, 2011]