FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7810, 595 aa
1>>>pF1KB7810 595 - 595 aa - 595 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.8557+/- 0.001; mu= 7.8763+/- 0.060
mean_var=145.3265+/-28.826, 0's: 0 Z-trim(110.0): 122 B-trim: 0 in 0/51
Lambda= 0.106390
statistics sampled from 11146 (11270) to 11146 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.694), E-opt: 0.2 (0.346), width: 16
Scan time: 3.590
The best scores are: opt bits E(32554)
CCDS5234.1 ESR1 gene_id:2099|Hs108|chr6 ( 595) 4030 630.4 1.9e-180
CCDS9762.1 ESR2 gene_id:2100|Hs108|chr14 ( 530) 1013 167.3 4.3e-41
CCDS32096.1 ESR2 gene_id:2100|Hs108|chr14 ( 495) 838 140.5 5e-33
CCDS55920.1 ESR2 gene_id:2100|Hs108|chr14 ( 481) 828 138.9 1.4e-32
CCDS61470.1 ESR2 gene_id:2100|Hs108|chr14 ( 474) 827 138.8 1.5e-32
CCDS3772.1 NR3C2 gene_id:4306|Hs108|chr4 ( 984) 609 105.5 3.4e-22
CCDS61469.1 ESR2 gene_id:2100|Hs108|chr14 ( 439) 601 104.1 4e-22
CCDS5063.1 NR2E1 gene_id:7101|Hs108|chr6 ( 385) 476 84.8 2.2e-16
CCDS69165.1 NR2E1 gene_id:7101|Hs108|chr6 ( 422) 476 84.9 2.3e-16
CCDS60830.1 ESRRA gene_id:2101|Hs108|chr11 ( 422) 451 81.0 3.3e-15
CCDS41667.1 ESRRA gene_id:2101|Hs108|chr11 ( 423) 451 81.0 3.3e-15
CCDS9850.2 ESRRB gene_id:2103|Hs108|chr14 ( 508) 447 80.5 5.9e-15
CCDS58061.1 ESRRG gene_id:2104|Hs108|chr1 ( 470) 446 80.3 6.2e-15
CCDS1517.1 ESRRG gene_id:2104|Hs108|chr1 ( 435) 443 79.8 8e-15
CCDS41468.1 ESRRG gene_id:2104|Hs108|chr1 ( 458) 443 79.8 8.3e-15
CCDS58060.1 ESRRG gene_id:2104|Hs108|chr1 ( 396) 406 74.1 3.8e-13
CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11 ( 402) 398 72.9 9e-13
CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11 ( 447) 398 72.9 9.8e-13
CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11 ( 453) 398 72.9 9.9e-13
CCDS55873.1 NR1H4 gene_id:9971|Hs108|chr12 ( 476) 386 71.1 3.7e-12
CCDS55876.1 NR1H4 gene_id:9971|Hs108|chr12 ( 486) 386 71.1 3.8e-12
CCDS42316.1 THRA gene_id:7067|Hs108|chr17 ( 410) 384 70.7 4e-12
CCDS58546.1 THRA gene_id:7067|Hs108|chr17 ( 451) 384 70.8 4.4e-12
CCDS9078.1 NR1H4 gene_id:9971|Hs108|chr12 ( 472) 384 70.8 4.5e-12
CCDS55875.1 NR1H4 gene_id:9971|Hs108|chr12 ( 482) 384 70.8 4.6e-12
CCDS11360.1 THRA gene_id:7067|Hs108|chr17 ( 490) 384 70.8 4.7e-12
CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 ( 598) 383 70.7 6.2e-12
CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 ( 611) 383 70.7 6.3e-12
CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12 ( 652) 383 70.7 6.6e-12
CCDS54627.1 NR1I2 gene_id:8856|Hs108|chr3 ( 397) 376 69.5 9.2e-12
CCDS14387.1 AR gene_id:367|Hs108|chrX ( 920) 377 69.9 1.7e-11
CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 369 68.5 2.2e-11
CCDS2641.1 THRB gene_id:7068|Hs108|chr3 ( 461) 362 67.4 4.6e-11
CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 ( 533) 362 67.4 5.2e-11
CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 ( 537) 362 67.4 5.3e-11
>>CCDS5234.1 ESR1 gene_id:2099|Hs108|chr6 (595 aa)
initn: 4030 init1: 4030 opt: 4030 Z-score: 3353.1 bits: 630.4 E(32554): 1.9e-180
Smith-Waterman score: 4030; 100.0% identity (100.0% similar) in 595 aa overlap (1-595:1-595)
10 20 30 40 50 60
pF1KB7 MTMTLHTKASGMALLHQIQGNELEPLNRPQLKIPLERPLGEVYLDSSKPAVYNYPEGAAY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 MTMTLHTKASGMALLHQIQGNELEPLNRPQLKIPLERPLGEVYLDSSKPAVYNYPEGAAY
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 EFNAAAAANAQVYGQTGLPYGPGSEAAAFGSNGLGGFPPLNSVSPSPLMLLHPPPQLSPF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 EFNAAAAANAQVYGQTGLPYGPGSEAAAFGSNGLGGFPPLNSVSPSPLMLLHPPPQLSPF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 LQPHGQQVPYYLENEPSGYTVREAGPPAFYRPNSDNRRQGGRERLASTNDKGSMAMESAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 LQPHGQQVPYYLENEPSGYTVREAGPPAFYRPNSDNRRQGGRERLASTNDKGSMAMESAK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 ETRYCAVCNDYASGYHYGVWSCEGCKAFFKRSIQGHNDYMCPATNQCTIDKNRRKSCQAC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 ETRYCAVCNDYASGYHYGVWSCEGCKAFFKRSIQGHNDYMCPATNQCTIDKNRRKSCQAC
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 RLRKCYEVGMMKGGIRKDRRGGRMLKHKRQRDDGEGRGEVGSAGDMRAANLWPSPLMIKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 RLRKCYEVGMMKGGIRKDRRGGRMLKHKRQRDDGEGRGEVGSAGDMRAANLWPSPLMIKR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 SKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 SKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINW
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 AKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPGKLLFAPNLLLDRNQGKCVEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 AKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPGKLLFAPNLLLDRNQGKCVEG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB7 MVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 MVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLD
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB7 KITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVPLYDLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 KITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVPLYDLL
490 500 510 520 530 540
550 560 570 580 590
pF1KB7 LEMLDAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATV
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 LEMLDAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATV
550 560 570 580 590
>>CCDS9762.1 ESR2 gene_id:2100|Hs108|chr14 (530 aa)
initn: 1276 init1: 641 opt: 1013 Z-score: 851.2 bits: 167.3 E(32554): 4.3e-41
Smith-Waterman score: 1593; 48.2% identity (72.0% similar) in 558 aa overlap (27-578:17-529)
10 20 30 40 50 60
pF1KB7 MTMTLHTKASGMALLHQIQGNELEPLNRPQLKIPLERPLGEVYLDSSKPAVYNYPEGAAY
: : .:::. : .:. :: : .. : :.
CCDS97 MDIKNSPSSLNSPSSYNCSQSILPLEH--GSIYIPSS--YVDSHHEYPAM
10 20 30 40
70 80 90 100 110
pF1KB7 EFNAAAAANAQVYGQ-TGLPYGPGSEAAAFGSNGLGGFPPLNSVSPSPLMLLHPPPQLSP
: . :. : .. .. :.: ::: . . :: .: : .:::
CCDS97 TFYSPAVMNYSIPSNVTNLEGGPGRQ------------------TTSPNVLWPTPGHLSP
50 60 70 80
120 130 140 150 160 170
pF1KB7 FLQPHGQQVPYYLENEPSGYTVREAGPPAFYRP-NSDN-RRQGGRERLAS-TNDKGSMAM
.. : : : : . : . :: : : .. .:. . .: :: .. ::
CCDS97 LVV-HRQLSHLYAEPQKSPWC--EARSLEHTLPVNRETLKRKVSGNRCASPVTGPGS---
90 100 110 120 130 140
180 190 200 210 220 230
pF1KB7 ESAKETRYCAVCNDYASGYHYGVWSCEGCKAFFKRSIQGHNDYMCPATNQCTIDKNRRKS
.....::::.::::::::::::::::::::::::::::::.::::::::::::::::
CCDS97 --KRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSIQGHNDYICPATNQCTIDKNRRKS
150 160 170 180 190 200
240 250 260 270 280 290
pF1KB7 CQACRLRKCYEVGMMKGGIRKDRRGGRMLKHKRQRDDGEGRGEVGSAGDMRAANLWPSPL
::::::::::::::.: : :..: : :.....:. :. .. :: . .. .:
CCDS97 CQACRLRKCYEVGMVKCGSRRERCGYRLVRRQRSADE-----QLHCAGKAKRSG-GHAPR
210 220 230 240 250
300 310 320 330 340 350
pF1KB7 MIKRSKKNSLALSLTADQMVSALLDAEPP-ILYSEYDPTRPFSEASMMGLLTNLADRELV
. .. : .:. .:.: .::.:::: .: :. :. ::.::::: ::.:::.:::
CCDS97 V-----RELLLDALSPEQLVLTLLEAEPPHVLISR--PSAPFTEASMMMSLTKLADKELV
260 270 280 290 300
360 370 380 390 400 410
pF1KB7 HMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPGKLLFAPNLLLDRNQG
:::.:::..::::.:.: :::.::: :.:.::.::.:::..:::::.:::.:.:::..:
CCDS97 HMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDHPGKLIFAPDLVLDRDEG
310 320 330 340 350 360
420 430 440 450 460 470
pF1KB7 KCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHI
:::::..:::::::::.:::: ..:: .:..:.:..:::::..: ....: . .
CCDS97 KCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSMYPLVTATQDADSSRKLA
370 380 390 400 410 420
480 490 500 510 520 530
pF1KB7 HRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVP
: .:. .::.:. ..::.:.. ::: .:::.::..:::.:: :::::::: .::::::::
CCDS97 H-LLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHASNKGMEHLLNMKCKNVVP
430 440 450 460 470 480
540 550 560 570 580 590
pF1KB7 LYDLLLEMLDAHRLHA-PTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPAT
.::::::::.:: :.. .: :. ...:. . :: . .:
CCDS97 VYDLLLEMLNAHVLRGCKSSITGSECSPAEDSK-SKEGSQNPQSQ
490 500 510 520 530
pF1KB7 V
>>CCDS32096.1 ESR2 gene_id:2100|Hs108|chr14 (495 aa)
initn: 1276 init1: 641 opt: 838 Z-score: 706.4 bits: 140.5 E(32554): 5e-33
Smith-Waterman score: 1418; 46.6% identity (71.6% similar) in 517 aa overlap (27-535:17-489)
10 20 30 40 50 60
pF1KB7 MTMTLHTKASGMALLHQIQGNELEPLNRPQLKIPLERPLGEVYLDSSKPAVYNYPEGAAY
: : .:::. : .:. :: : .. : :.
CCDS32 MDIKNSPSSLNSPSSYNCSQSILPLEH--GSIYIPSS--YVDSHHEYPAM
10 20 30 40
70 80 90 100 110
pF1KB7 EFNAAAAANAQVYGQ-TGLPYGPGSEAAAFGSNGLGGFPPLNSVSPSPLMLLHPPPQLSP
: . :. : .. .. :.: ::: . . :: .: : .:::
CCDS32 TFYSPAVMNYSIPSNVTNLEGGPGRQ------------------TTSPNVLWPTPGHLSP
50 60 70 80
120 130 140 150 160 170
pF1KB7 FLQPHGQQVPYYLENEPSGYTVREAGPPAFYRP-NSDN-RRQGGRERLAS-TNDKGSMAM
.. : : : : . : . :: : : .. .:. . .: :: .. ::
CCDS32 LVV-HRQLSHLYAEPQKSPWC--EARSLEHTLPVNRETLKRKVSGNRCASPVTGPGS---
90 100 110 120 130 140
180 190 200 210 220 230
pF1KB7 ESAKETRYCAVCNDYASGYHYGVWSCEGCKAFFKRSIQGHNDYMCPATNQCTIDKNRRKS
.....::::.::::::::::::::::::::::::::::::.::::::::::::::::
CCDS32 --KRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSIQGHNDYICPATNQCTIDKNRRKS
150 160 170 180 190 200
240 250 260 270 280 290
pF1KB7 CQACRLRKCYEVGMMKGGIRKDRRGGRMLKHKRQRDDGEGRGEVGSAGDMRAANLWPSPL
::::::::::::::.: : :..: : :.....:. :. .. :: . .. .:
CCDS32 CQACRLRKCYEVGMVKCGSRRERCGYRLVRRQRSADE-----QLHCAGKAKRSG-GHAPR
210 220 230 240 250
300 310 320 330 340 350
pF1KB7 MIKRSKKNSLALSLTADQMVSALLDAEPP-ILYSEYDPTRPFSEASMMGLLTNLADRELV
. .. : .:. .:.: .::.:::: .: :. :. ::.::::: ::.:::.:::
CCDS32 V-----RELLLDALSPEQLVLTLLEAEPPHVLISR--PSAPFTEASMMMSLTKLADKELV
260 270 280 290 300
360 370 380 390 400 410
pF1KB7 HMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPGKLLFAPNLLLDRNQG
:::.:::..::::.:.: :::.::: :.:.::.::.:::..:::::.:::.:.:::..:
CCDS32 HMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDHPGKLIFAPDLVLDRDEG
310 320 330 340 350 360
420 430 440 450 460 470
pF1KB7 KCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHI
:::::..:::::::::.:::: ..:: .:..:.:..:::::..: ....: . .
CCDS32 KCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSMYPLVTATQDADSSRKLA
370 380 390 400 410 420
480 490 500 510 520 530
pF1KB7 HRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHM-SNKGMEHL--YSMKCKN
: .:. .::.:. ..::.:.. ::: .:::.::..:::.:: ..:. . : ..:: ..
CCDS32 H-LLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHARAEKASQTLTSFGMKMET
430 440 450 460 470 480
540 550 560 570 580 590
pF1KB7 VVPLYDLLLEMLDAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFP
..:
CCDS32 LLPEATMEQ
490
>>CCDS55920.1 ESR2 gene_id:2100|Hs108|chr14 (481 aa)
initn: 1276 init1: 641 opt: 828 Z-score: 698.3 bits: 138.9 E(32554): 1.4e-32
Smith-Waterman score: 1408; 47.0% identity (71.1% similar) in 508 aa overlap (27-529:17-479)
10 20 30 40 50 60
pF1KB7 MTMTLHTKASGMALLHQIQGNELEPLNRPQLKIPLERPLGEVYLDSSKPAVYNYPEGAAY
: : .:::. : .:. :: : .. : :.
CCDS55 MDIKNSPSSLNSPSSYNCSQSILPLEH--GSIYIPSSY--VDSHHEYPAM
10 20 30 40
70 80 90 100 110
pF1KB7 EFNAAAAANAQVYGQ-TGLPYGPGSEAAAFGSNGLGGFPPLNSVSPSPLMLLHPPPQLSP
: . :. : .. .. :.: ::: . . :: .: : .:::
CCDS55 TFYSPAVMNYSIPSNVTNLEGGPGRQ------------------TTSPNVLWPTPGHLSP
50 60 70 80
120 130 140 150 160 170
pF1KB7 FLQPHGQQVPYYLENEPSGYTVREAGPPAFYRP-NSDN-RRQGGRERLAS-TNDKGSMAM
: : : : : . : . :: : : .. .:. . .: :: .. ::
CCDS55 -LVVHRQLSHLYAEPQKSPWC--EARSLEHTLPVNRETLKRKVSGNRCASPVTGPGS---
90 100 110 120 130 140
180 190 200 210 220 230
pF1KB7 ESAKETRYCAVCNDYASGYHYGVWSCEGCKAFFKRSIQGHNDYMCPATNQCTIDKNRRKS
.....::::.::::::::::::::::::::::::::::::.::::::::::::::::
CCDS55 --KRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSIQGHNDYICPATNQCTIDKNRRKS
150 160 170 180 190 200
240 250 260 270 280 290
pF1KB7 CQACRLRKCYEVGMMKGGIRKDRRGGRMLKHKRQRDDGEGRGEVGSAGDMRAANLWPSPL
::::::::::::::.: : :..: : :.....:. :. .. :: . .. .:
CCDS55 CQACRLRKCYEVGMVKCGSRRERCGYRLVRRQRSADE-----QLHCAGKAKRSG-GHAPR
210 220 230 240 250
300 310 320 330 340 350
pF1KB7 MIKRSKKNSLALSLTADQMVSALLDAEPP-ILYSEYDPTRPFSEASMMGLLTNLADRELV
. .. : .:. .:.: .::.:::: .: :. :. ::.::::: ::.:::.:::
CCDS55 V-----RELLLDALSPEQLVLTLLEAEPPHVLISR--PSAPFTEASMMMSLTKLADKELV
260 270 280 290 300
360 370 380 390 400 410
pF1KB7 HMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPGKLLFAPNLLLDRNQG
:::.:::..::::.:.: :::.::: :.:.::.::.:::..:::::.:::.:.:::..:
CCDS55 HMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDHPGKLIFAPDLVLDRDEG
310 320 330 340 350 360
420 430 440 450 460 470
pF1KB7 KCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHI
:::::..:::::::::.:::: ..:: .:..:.:..:::::..: ....: . .
CCDS55 KCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSMYPLVTATQDADSSRKLA
370 380 390 400 410 420
480 490 500 510 520 530
pF1KB7 HRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVP
: .:. .::.:. ..::.:.. ::: .:::.::..:::.:: . : ... .:
CCDS55 H-LLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRH-ARWGEKQFIHLKLS
430 440 450 460 470 480
540 550 560 570 580 590
pF1KB7 LYDLLLEMLDAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATV
>>CCDS61470.1 ESR2 gene_id:2100|Hs108|chr14 (474 aa)
initn: 1276 init1: 641 opt: 827 Z-score: 697.6 bits: 138.8 E(32554): 1.5e-32
Smith-Waterman score: 1407; 47.7% identity (71.7% similar) in 495 aa overlap (27-516:17-467)
10 20 30 40 50 60
pF1KB7 MTMTLHTKASGMALLHQIQGNELEPLNRPQLKIPLERPLGEVYLDSSKPAVYNYPEGAAY
: : .:::. : .:. :: : .. : :.
CCDS61 MDIKNSPSSLNSPSSYNCSQSILPLEH--GSIYIPSSY--VDSHHEYPAM
10 20 30 40
70 80 90 100 110
pF1KB7 EFNAAAAANAQVYGQ-TGLPYGPGSEAAAFGSNGLGGFPPLNSVSPSPLMLLHPPPQLSP
: . :. : .. .. :.: ::: . . :: .: : .:::
CCDS61 TFYSPAVMNYSIPSNVTNLEGGPGRQ------------------TTSPNVLWPTPGHLSP
50 60 70 80
120 130 140 150 160 170
pF1KB7 FLQPHGQQVPYYLENEPSGYTVREAGPPAFYRP-NSDN-RRQGGRERLAS-TNDKGSMAM
.. : : : : . : . :: : : .. .:. . .: :: .. ::
CCDS61 LVV-HRQLSHLYAEPQKSPWC--EARSLEHTLPVNRETLKRKVSGNRCASPVTGPGS---
90 100 110 120 130 140
180 190 200 210 220 230
pF1KB7 ESAKETRYCAVCNDYASGYHYGVWSCEGCKAFFKRSIQGHNDYMCPATNQCTIDKNRRKS
.....::::.::::::::::::::::::::::::::::::.::::::::::::::::
CCDS61 --KRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSIQGHNDYICPATNQCTIDKNRRKS
150 160 170 180 190 200
240 250 260 270 280 290
pF1KB7 CQACRLRKCYEVGMMKGGIRKDRRGGRMLKHKRQRDDGEGRGEVGSAGDMRAANLWPSPL
::::::::::::::.: : :..: : :.....:. :. .. :: . .. .:
CCDS61 CQACRLRKCYEVGMVKCGSRRERCGYRLVRRQRSADE-----QLHCAGKAKRSG-GHAPR
210 220 230 240 250
300 310 320 330 340 350
pF1KB7 MIKRSKKNSLALSLTADQMVSALLDAEPP-ILYSEYDPTRPFSEASMMGLLTNLADRELV
. .. : .:. .:.: .::.:::: .: :. :. ::.::::: ::.:::.:::
CCDS61 V-----RELLLDALSPEQLVLTLLEAEPPHVLISR--PSAPFTEASMMMSLTKLADKELV
260 270 280 290 300
360 370 380 390 400 410
pF1KB7 HMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPGKLLFAPNLLLDRNQG
:::.:::..::::.:.: :::.::: :.:.::.::.:::..:::::.:::.:.:::..:
CCDS61 HMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDHPGKLIFAPDLVLDRDEG
310 320 330 340 350 360
420 430 440 450 460 470
pF1KB7 KCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHI
:::::..:::::::::.:::: ..:: .:..:.:..:::::..: ....: . .
CCDS61 KCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSMYPLVTATQDADSSRKLA
370 380 390 400 410 420
480 490 500 510 520 530
pF1KB7 HRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVP
: .:. .::.:. ..::.:.. ::: .:::.::..:::.::
CCDS61 H-LLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHARSCVYK
430 440 450 460 470
540 550 560 570 580 590
pF1KB7 LYDLLLEMLDAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATV
>>CCDS3772.1 NR3C2 gene_id:4306|Hs108|chr4 (984 aa)
initn: 576 init1: 328 opt: 609 Z-score: 512.0 bits: 105.5 E(32554): 3.4e-22
Smith-Waterman score: 620; 26.8% identity (57.4% similar) in 538 aa overlap (49-544:445-964)
20 30 40 50 60 70
pF1KB7 QGNELEPLNRPQLKIPLERPLGEVYLDSSKPAVYNYP--EGAAYEFNAAAAANAQVYGQT
:.: .: .:. . : . . :. .
CCDS37 SKINSDSSFSVPIKQESTKHSCSGTSFKGNPTVNPFPFMDGSYFSF----MDDKDYYSLS
420 430 440 450 460 470
80 90 100 110 120
pF1KB7 GL--PYGPGSEAAAFGSN---GL------GGFPPLNSVSPSPLMLLHPPPQLSPFLQPHG
:. : :: .. ::. :. :.. : :. : .. .. : : :
CCDS37 GILGPPVPGFDGNCEGSGFPVGIKQEPDDGSYYPEASIPSSAIVGVNSGGQ--SFHYRIG
480 490 500 510 520
130 140 150 160 170
pF1KB7 QQVPYYLENEPSGYTVREAG--PPA-----FYRPNSD--NRRQGGRERL------ASTND
: : . .. . ::. .. ..: .::. : : .:..
CCDS37 AQGTISLSRSARDQSFQHLSSFPPVNTLVESWKSHGDLSSRRSDGYPVLEYIPENVSSST
530 540 550 560 570 580
180 190 200 210 220 230
pF1KB7 KGSMAMESAKETRYCAVCNDYASGYHYGVWSCEGCKAFFKRSIQGHNDYMCPATNQCTID
:.. :.. .. : ::.: ::: :::: .: .::.::::...:...:.: . :.: ::
CCDS37 LRSVSTGSSRPSKICLVCGDEASGCHYGVVTCGSCKVFFKRAVEGQHNYLCAGRNDCIID
590 600 610 620 630 640
240 250 260 270 280
pF1KB7 KNRRKSCQACRLRKCYEVGMMKGGIRKDRRGGRMLK-HKRQRDDGEG--------RGEVG
: :::.: ::::.:: ..:: . : ::... :.. :..: .. . : :
CCDS37 KIRRKNCPACRLQKCLQAGM-NLGARKSKKLGKLKGIHEEQPQQQQPPPPPPPPQSPEEG
650 660 670 680 690 700
290 300 310 320 330 340
pF1KB7 SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEAS
.. . : :: . .... .:: . : .: . :: :.:. :: ..: . .
CCDS37 TT--YIAPAKEPSVNTALVPQLSTISRALTPSP-VMVLENIEPEIVYAGYDSSKPDTAEN
710 720 730 740 750 760
350 360 370 380 390 400
pF1KB7 MMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPGK
... :. :: ........::: .::: .: :.::. :.. .:. . ..: :::..: ..
CCDS37 LLSTLNRLAGKQMIQVVKWAKVLPGFKNLPLEDQITLIQYSWMCLSSFALSWRSYKHTNS
770 780 790 800 810 820
410 420 430 440 450
pF1KB7 --LLFAPNLLLDRNQGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVY
: :::.:...... . .: :. . . : .: ..: ::.. .: ..::..
CCDS37 QFLYFAPDLVFNEEKMHQ-SAMYELCQGMHQISLQFVRLQLTFEEYTIMKVLLLLSTIPK
830 840 850 860 870 880
460 470 480 490 500 510
pF1KB7 TFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSN
:.: : . . . : : ...: . :. ::. :: .:. .. . .
CCDS37 DGLKSQAAFEEMRTNYIKELRK-------MVTKCPNNSGQSWQRFYQLTKLLDSMHDLVS
890 900 910 920 930
520 530 540 550 560 570
pF1KB7 KGMEH-LYSMKCKNV--VPLYDLLLEMLDAHRLHAPTSRGGASVEETDQSHLATAGSTSS
.: .:... ... : . .:.:..
CCDS37 DLLEFCFYTFRESHALKVEFPAMLVEIISDQLPKVESGNAKPLYFHRK
940 950 960 970 980
>>CCDS61469.1 ESR2 gene_id:2100|Hs108|chr14 (439 aa)
initn: 966 init1: 569 opt: 601 Z-score: 510.6 bits: 104.1 E(32554): 4e-22
Smith-Waterman score: 960; 38.4% identity (57.0% similar) in 558 aa overlap (27-578:17-438)
10 20 30 40 50 60
pF1KB7 MTMTLHTKASGMALLHQIQGNELEPLNRPQLKIPLERPLGEVYLDSSKPAVYNYPEGAAY
: : .:::. : .:. :: : .. : :.
CCDS61 MDIKNSPSSLNSPSSYNCSQSILPLEH--GSIYIPSS--YVDSHHEYPAM
10 20 30 40
70 80 90 100 110
pF1KB7 EFNAAAAANAQVYGQ-TGLPYGPGSEAAAFGSNGLGGFPPLNSVSPSPLMLLHPPPQLSP
: . :. : .. .. :.: ::: . . :: .: : .:::
CCDS61 TFYSPAVMNYSIPSNVTNLEGGPGRQ------------------TTSPNVLWPTPGHLSP
50 60 70 80
120 130 140 150 160 170
pF1KB7 FLQPHGQQVPYYLENEPSGYTVREAGPPAFYRP-NSDN-RRQGGRERLAS-TNDKGSMAM
.. : : : : . : . :: : : .. .:. . .: :: .. ::
CCDS61 LVV-HRQLSHLYAEPQKSPWC--EARSLEHTLPVNRETLKRKVSGNRCASPVTGPGS---
90 100 110 120 130 140
180 190 200 210 220 230
pF1KB7 ESAKETRYCAVCNDYASGYHYGVWSCEGCKAFFKRSIQGHNDYMCPATNQCTIDKNRRKS
.....::::.::::::::::::::::::::::::::::::.::::::::::::::::
CCDS61 --KRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSIQGHNDYICPATNQCTIDKNRRKS
150 160 170 180 190 200
240 250 260 270 280 290
pF1KB7 CQACRLRKCYEVGMMKGGIRKDRRGGRMLKHKRQRDDGEGRGEVGSAGDMRAANLWPSPL
::::::::::::::.: : :..: : :.....:. :. .. :: . .. .:
CCDS61 CQACRLRKCYEVGMVKCGSRRERCGYRLVRRQRSADE-----QLHCAGKAKRSG-GHAPR
210 220 230 240 250
300 310 320 330 340 350
pF1KB7 MIKRSKKNSLALSLTADQMVSALLDAEPP-ILYSEYDPTRPFSEASMMGLLTNLADRELV
. .. : .:. .:.: .::.:::: .: :. :. ::.::::: ::.:::.:::
CCDS61 V-----RELLLDALSPEQLVLTLLEAEPPHVLISR--PSAPFTEASMMMSLTKLADKELV
260 270 280 290 300
360 370 380 390 400 410
pF1KB7 HMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPGKLLFAPNLLLDRNQG
:::.:::..::. :. : :
CCDS61 HMISWAKKIPGMYPLVTATQ-----------------------------------D----
310 320
420 430 440 450 460 470
pF1KB7 KCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHI
: ::: .. .:
CCDS61 --------------ADSSR-KLAHL-----------------------------------
330
480 490 500 510 520 530
pF1KB7 HRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVP
:. .::.:. ..::.:.. ::: .:::.::..:::.:: :::::::: .::::::::
CCDS61 ---LNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHASNKGMEHLLNMKCKNVVP
340 350 360 370 380 390
540 550 560 570 580 590
pF1KB7 LYDLLLEMLDAHRLHA-PTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPAT
.::::::::.:: :.. .: :. ...:. . :: . .:
CCDS61 VYDLLLEMLNAHVLRGCKSSITGSECSPAEDSK-SKEGSQNPQSQ
400 410 420 430
pF1KB7 V
>>CCDS5063.1 NR2E1 gene_id:7101|Hs108|chr6 (385 aa)
initn: 483 init1: 189 opt: 476 Z-score: 407.8 bits: 84.8 E(32554): 2.2e-16
Smith-Waterman score: 574; 31.8% identity (60.6% similar) in 371 aa overlap (185-543:16-379)
160 170 180 190 200 210
pF1KB7 DNRRQGGRERLASTNDKGSMAMESAKETRYCAVCNDYASGYHYGVWSCEGCKAFFKRSIQ
: ::.: .:: ::::..:.::..::::::.
CCDS50 MSKPAGSTSRILDIPCKVCGDRSSGKHYGVYACDGCSGFFKRSIR
10 20 30 40
220 230 240 250 260 270
pF1KB7 GHNDYMCPATNQ--CTIDKNRRKSCQACRLRKCYEVGMMKGGIRKDRRGGRMLKHKRQRD
. :.: . :: : .::..:..:.::::.:: ::.: : .....: : : ..:
CCDS50 RNRTYVCKSGNQGGCPVDKTHRNQCRACRLKKCLEVNMNKDAVQHER-GPRTSTIRKQVA
50 60 70 80 90 100
280 290 300 310 320
pF1KB7 ---DGEGRGEVGSAGDMRAANLWPSPLM---IKRSKKNSL---ALSLTADQMVSALLDAE
:. . : :.:. . .: : :.: . . . . ..: :.: : .... . :
CCDS50 LYFRGH-KEENGAAAHFPSAAL-PAPAFFTAVTQLEPHGLELAAVSTTPERQTLVSLAQP
110 120 130 140 150 160
330 340 350 360 370 380
pF1KB7 PPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAW
: : . : . . . : : : :.::: ::.: :.:.::. ::: ::
CCDS50 TPKYPHEVNGTPMYLYEVATESVCESAARLLFMSIKWAKSVPAFSTLSLQDQLMLLEDAW
170 180 190 200 210 220
390 400 410 420 430 440
pF1KB7 LEILMIGLV-WRSMEHPGKLLFAPNLLLDRNQGKCVEGMVEIFDMLLATSSRFRMMNLQG
:....:.. : . :: . .. : .... .. .. .. : . .:::.. :..
CCDS50 RELFVLGIAQWAIPVDANTLLAVSGMNGDNTDSQKLNKIISEIQALQEVVARFRQLRLDA
230 240 250 260 270 280
450 460 470 480 490 500
pF1KB7 EEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQ
::.::: :. ... : : .: :.:... : . :. :: . :
CCDS50 TEFACLKCIVTFKA-VPTHSGSELRSFRNAAAIAALQDEAQLTLNSYIHT---RYPTQPC
290 300 310 320 330
510 520 530 540 550 560
pF1KB7 RLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVPLYDLLLEMLDAHRLHAPTSRGGASVEE
:...:::.: .: .: . .:... : . ::. :: .:
CCDS50 RFGKLLLLLPALRSISPSTIEEVFFKKTIGNVPITRLLSDMYKSSDI
340 350 360 370 380
570 580 590
pF1KB7 TDQSHLATAGSTSSHSLQKYYITGEAEGFPATV
>>CCDS69165.1 NR2E1 gene_id:7101|Hs108|chr6 (422 aa)
initn: 512 init1: 189 opt: 476 Z-score: 407.2 bits: 84.9 E(32554): 2.3e-16
Smith-Waterman score: 574; 31.8% identity (60.6% similar) in 371 aa overlap (185-543:53-416)
160 170 180 190 200 210
pF1KB7 DNRRQGGRERLASTNDKGSMAMESAKETRYCAVCNDYASGYHYGVWSCEGCKAFFKRSIQ
: ::.: .:: ::::..:.::..::::::.
CCDS69 PGPGLGFPLGSGLPWPSLLESPGGRILDIPCKVCGDRSSGKHYGVYACDGCSGFFKRSIR
30 40 50 60 70 80
220 230 240 250 260 270
pF1KB7 GHNDYMCPATNQ--CTIDKNRRKSCQACRLRKCYEVGMMKGGIRKDRRGGRMLKHKRQRD
. :.: . :: : .::..:..:.::::.:: ::.: : .....: : : ..:
CCDS69 RNRTYVCKSGNQGGCPVDKTHRNQCRACRLKKCLEVNMNKDAVQHER-GPRTSTIRKQVA
90 100 110 120 130 140
280 290 300 310 320
pF1KB7 ---DGEGRGEVGSAGDMRAANLWPSPLM---IKRSKKNSL---ALSLTADQMVSALLDAE
:. . : :.:. . .: : :.: . . . . ..: :.: : .... . :
CCDS69 LYFRGH-KEENGAAAHFPSAAL-PAPAFFTAVTQLEPHGLELAAVSTTPERQTLVSLAQP
150 160 170 180 190
330 340 350 360 370 380
pF1KB7 PPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAW
: : . : . . . : : : :.::: ::.: :.:.::. ::: ::
CCDS69 TPKYPHEVNGTPMYLYEVATESVCESAARLLFMSIKWAKSVPAFSTLSLQDQLMLLEDAW
200 210 220 230 240 250
390 400 410 420 430 440
pF1KB7 LEILMIGLV-WRSMEHPGKLLFAPNLLLDRNQGKCVEGMVEIFDMLLATSSRFRMMNLQG
:....:.. : . :: . .. : .... .. .. .. : . .:::.. :..
CCDS69 RELFVLGIAQWAIPVDANTLLAVSGMNGDNTDSQKLNKIISEIQALQEVVARFRQLRLDA
260 270 280 290 300 310
450 460 470 480 490 500
pF1KB7 EEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQ
::.::: :. ... : : .: :.:... : . :. :: . :
CCDS69 TEFACLKCIVTFKA-VPTHSGSELRSFRNAAAIAALQDEAQLTLNSYIHT---RYPTQPC
320 330 340 350 360 370
510 520 530 540 550 560
pF1KB7 RLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVPLYDLLLEMLDAHRLHAPTSRGGASVEE
:...:::.: .: .: . .:... : . ::. :: .:
CCDS69 RFGKLLLLLPALRSISPSTIEEVFFKKTIGNVPITRLLSDMYKSSDI
380 390 400 410 420
570 580 590
pF1KB7 TDQSHLATAGSTSSHSLQKYYITGEAEGFPATV
>>CCDS60830.1 ESRRA gene_id:2101|Hs108|chr11 (422 aa)
initn: 831 init1: 400 opt: 451 Z-score: 386.5 bits: 81.0 E(32554): 3.3e-15
Smith-Waterman score: 850; 36.6% identity (62.7% similar) in 434 aa overlap (129-546:10-419)
100 110 120 130 140 150
pF1KB7 PLNSVSPSPLMLLHPPPQLSPFLQPHGQQVPYYLENEPS------GYTVREAGPPAFYRP
: :.. ::. : . :. ::. :
CCDS60 MSSQVVGIEPLYIKAEPASPDSPKGSSETETEPPVALAP
10 20 30
160 170 180 190 200
pF1KB7 NSDNRR--QGGRERL----ASTNDKGSMAME-SAKETRYCAVCNDYASGYHYGVWSCEGC
. : : .:. :. ...:. . :. : : ::.: :::::::: :::.:
CCDS60 GPAPTRCLPGHKEEEDGEGAGPGEQGGGKLVLSSLPKRLCLVCGDVASGYHYGVASCEAC
40 50 60 70 80 90
210 220 230 240 250 260
pF1KB7 KAFFKRSIQGHNDYMCPATNQCTIDKNRRKSCQACRLRKCYEVGMMKGGIRKDR-RGGRM
::::::.::: .: :::.:.: : : :::.:::::. :: .:::.: :.: :: ::::.
CCDS60 KAFFKRTIQGSIEYSCPASNECEITKRRRKACQACRFTKCLRVGMLKEGVRLDRVRGGRQ
100 110 120 130 140 150
270 280 290 300 310 320
pF1KB7 LKHKRQRDDGEGRGEVGSAGDMRAANLWPS-PLMIKRSKKNSLALSLTADQMVSALLDAE
:.:: : :: . . .:. :: . . ... . . .:: :: .:
CCDS60 -KYKR-------RPEVD---PLPFPGPFPAGPLAVAGGPRKTAPV----NALVSHLLVVE
160 170 180 190 200
330 340 350 360 370 380
pF1KB7 PPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAW
: ::. ::. : .. .. : .: :::.: :.::: .::: .:.: ::. .:. .:
CCDS60 PEKLYAMPDPAGPDGHLPAVATLCDLFDREIVVTISWAKSIPGFSSLSLSDQMSVLQSVW
210 220 230 240 250 260
390 400 410 420 430 440
pF1KB7 LEILMIGLVWRSMEHPGKLLFAPNLLLDRNQGKCVEGMVEIFDMLLATSSRFRMMNLQGE
.:.:..:.. ::. .: :: .:.::. .: . :. :. :: :.. . :. :
CCDS60 MEVLVLGVAQRSLPLQDELAFAEDLVLDE-EGARAAGLGELGAALLQLVRRLQALRLERE
270 280 290 300 310 320
450 460 470 480 490 500
pF1KB7 EFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMA-KAGLTLQQQHQ
:.: ::.. : :: .:. . .... . . ..:.. : .:: ...
CCDS60 EYVLLKALALANSDSV--------HIEDAEAVEQLREALHEALLEYEAGRAGPGGGAERR
330 340 350 360 370
510 520 530 540 550 560
pF1KB7 RLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVPLYDLLLEMLDAHRLHAPTSRGGASVEE
: ..::: : .:. ..: . :.:..: .. ::.. :.::::.:
CCDS60 RAGRLLLTLPLLRQTAGKVLAHFYGVKLEGKVPMHKLFLEMLEAMMD
380 390 400 410 420
570 580 590
pF1KB7 TDQSHLATAGSTSSHSLQKYYITGEAEGFPATV
595 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 20:58:32 2016 done: Sat Nov 5 20:58:33 2016
Total Scan time: 3.590 Total Display time: 0.120
Function used was FASTA [36.3.4 Apr, 2011]