FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2015, 592 aa
1>>>pF1KE2015 592 - 592 aa - 592 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.0979+/-0.00155; mu= 4.7167+/- 0.094
mean_var=360.2436+/-74.129, 0's: 0 Z-trim(108.9): 184 B-trim: 0 in 0/50
Lambda= 0.067573
statistics sampled from 10333 (10507) to 10333 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.626), E-opt: 0.2 (0.323), width: 16
Scan time: 2.940
The best scores are: opt bits E(32554)
CCDS32623.1 TAF15 gene_id:8148|Hs108|chr17 ( 592) 4321 436.0 6.4e-122
CCDS59279.1 TAF15 gene_id:8148|Hs108|chr17 ( 589) 4285 432.5 7.3e-121
CCDS58454.1 FUS gene_id:2521|Hs108|chr16 ( 525) 1225 134.1 4.3e-31
CCDS10707.1 FUS gene_id:2521|Hs108|chr16 ( 526) 1214 133.0 9e-31
CCDS54514.1 EWSR1 gene_id:2130|Hs108|chr22 ( 600) 1000 112.3 1.9e-24
CCDS54513.1 EWSR1 gene_id:2130|Hs108|chr22 ( 655) 989 111.2 4.1e-24
CCDS13852.2 EWSR1 gene_id:2130|Hs108|chr22 ( 661) 989 111.2 4.2e-24
CCDS13851.1 EWSR1 gene_id:2130|Hs108|chr22 ( 656) 987 111.0 4.7e-24
>>CCDS32623.1 TAF15 gene_id:8148|Hs108|chr17 (592 aa)
initn: 4321 init1: 4321 opt: 4321 Z-score: 2302.3 bits: 436.0 E(32554): 6.4e-122
Smith-Waterman score: 4321; 100.0% identity (100.0% similar) in 592 aa overlap (1-592:1-592)
10 20 30 40 50 60
pF1KE2 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQASQSYSGYGQTTDSSYGQNYSGYSSYGQSQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQASQSYSGYGQTTDSSYGQNYSGYSSYGQSQ
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 SGYSQSYGGYENQKQSSYSQQPYNNQGQQQNMESSGSQGGRAPSYDQPDYGQQDSYDQQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 SGYSQSYGGYENQKQSSYSQQPYNNQGQQQNMESSGSQGGRAPSYDQPDYGQQDSYDQQS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 GYDQHQGSYDEQSNYDQQHDSYSQNQQSYHSQRENYSHHTQDDRRDVSRYGEDNRGYGGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 GYDQHQGSYDEQSNYDQQHDSYSQNQQSYHSQRENYSHHTQDDRRDVSRYGEDNRGYGGS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 QGGGRGRGGYDKDGRGPMTGSSGGDRGGFKNFGGHRDYGPRTDADSESDNSDNNTIFVQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 QGGGRGRGGYDKDGRGPMTGSSGGDRGGFKNFGGHRDYGPRTDADSESDNSDNNTIFVQG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 LGEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 LGEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAI
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 DWFDGKEFHGNIIKVSFATRRPEFMRGGGSGGGRRGRGGYRGRGGFQGRGGDPKSGDWVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 DWFDGKEFHGNIIKVSFATRRPEFMRGGGSGGGRRGRGGYRGRGGFQGRGGDPKSGDWVC
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 PNPSCGNMNFARRNSCNQCNEPRPEDSRPSGGDFRGRGYGGERGYRGRGGRGGDRGGYGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 PNPSCGNMNFARRNSCNQCNEPRPEDSRPSGGDFRGRGYGGERGYRGRGGRGGDRGGYGG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 DRSGGGYGGDRSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGYGGDRGGGYGGDRGGGYG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 DRSGGGYGGDRSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGYGGDRGGGYGGDRGGGYG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 GDRGGYGGDRGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 GDRGGYGGDRGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSG
490 500 510 520 530 540
550 560 570 580 590
pF1KE2 YGGDRSGGYGGDRSGGGYGGDRGGGYGGDRGGYGGKMGGRNDYRNDQRNRPY
::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 YGGDRSGGYGGDRSGGGYGGDRGGGYGGDRGGYGGKMGGRNDYRNDQRNRPY
550 560 570 580 590
>>CCDS59279.1 TAF15 gene_id:8148|Hs108|chr17 (589 aa)
initn: 3918 init1: 3918 opt: 4285 Z-score: 2283.4 bits: 432.5 E(32554): 7.3e-121
Smith-Waterman score: 4285; 99.5% identity (99.5% similar) in 592 aa overlap (1-592:1-589)
10 20 30 40 50 60
pF1KE2 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQASQSYSGYGQTTDSSYGQNYSGYSSYGQSQ
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQASQSYSGYGQTTDSSYGQNYSGYSSYGQS-
10 20 30 40 50
70 80 90 100 110 120
pF1KE2 SGYSQSYGGYENQKQSSYSQQPYNNQGQQQNMESSGSQGGRAPSYDQPDYGQQDSYDQQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 --YSQSYGGYENQKQSSYSQQPYNNQGQQQNMESSGSQGGRAPSYDQPDYGQQDSYDQQS
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE2 GYDQHQGSYDEQSNYDQQHDSYSQNQQSYHSQRENYSHHTQDDRRDVSRYGEDNRGYGGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 GYDQHQGSYDEQSNYDQQHDSYSQNQQSYHSQRENYSHHTQDDRRDVSRYGEDNRGYGGS
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE2 QGGGRGRGGYDKDGRGPMTGSSGGDRGGFKNFGGHRDYGPRTDADSESDNSDNNTIFVQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 QGGGRGRGGYDKDGRGPMTGSSGGDRGGFKNFGGHRDYGPRTDADSESDNSDNNTIFVQG
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE2 LGEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 LGEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAI
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE2 DWFDGKEFHGNIIKVSFATRRPEFMRGGGSGGGRRGRGGYRGRGGFQGRGGDPKSGDWVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 DWFDGKEFHGNIIKVSFATRRPEFMRGGGSGGGRRGRGGYRGRGGFQGRGGDPKSGDWVC
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE2 PNPSCGNMNFARRNSCNQCNEPRPEDSRPSGGDFRGRGYGGERGYRGRGGRGGDRGGYGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 PNPSCGNMNFARRNSCNQCNEPRPEDSRPSGGDFRGRGYGGERGYRGRGGRGGDRGGYGG
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE2 DRSGGGYGGDRSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGYGGDRGGGYGGDRGGGYG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 DRSGGGYGGDRSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGYGGDRGGGYGGDRGGGYG
420 430 440 450 460 470
490 500 510 520 530 540
pF1KE2 GDRGGYGGDRGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 GDRGGYGGDRGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSG
480 490 500 510 520 530
550 560 570 580 590
pF1KE2 YGGDRSGGYGGDRSGGGYGGDRGGGYGGDRGGYGGKMGGRNDYRNDQRNRPY
::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 YGGDRSGGYGGDRSGGGYGGDRGGGYGGDRGGYGGKMGGRNDYRNDQRNRPY
540 550 560 570 580
>>CCDS58454.1 FUS gene_id:2521|Hs108|chr16 (525 aa)
initn: 675 init1: 675 opt: 1225 Z-score: 671.7 bits: 134.1 E(32554): 4.3e-31
Smith-Waterman score: 1421; 51.8% identity (67.0% similar) in 515 aa overlap (15-459:20-520)
10 20 30 40 50
pF1KE2 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQASQSYSGYGQTTDSS-YGQNYSGYS
: . :.. .:: ::: ::::::.:.::.: ::: :.::
CCDS58 MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQ--QSYSGYSQSTDTSGYGQ--SSYS
10 20 30 40 50
60 70 80 90 100
pF1KE2 SYGQSQSGYS-----QSYG---GYENQK--QSSYSQQP-YNNQGQQQNMES-SGSQGG--
::::::..:. :.:: :: ... ::::.:: : . ::: : ::: :.
CCDS58 SYGQSQNSYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSS
60 70 80 90 100 110
110 120 130 140
pF1KE2 RAPSYDQPD---YGQQDSYD-QQSGYDQHQGSYDEQSNYDQQHD---------------S
.. :: ::. :.:: :: ::..: :.: ::. ..: ::.. .
CCDS58 QSSSYGQPQSGSYSQQPSYGGQQQSYGQQQ-SYNPPQGYGQQNQYNSSSGGGGGGGGGGN
120 130 140 150 160 170
150 160 170 180
pF1KE2 YSQNQQSYHS---QRENYSHHTQDDRRDVSRYGEDNRG---YGGSQGGG--------RGR
:.:.:.:. : . .:... :. . ::...:: ::: ::: :.
CCDS58 YGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSS
180 190 200 210 220 230
190 200 210 220 230 240
pF1KE2 GGYDKDGRGPMTGSSGG----DRGGFKNFGGHRDYGPRTDADSESDNSDNNTIFVQGLGE
:::. ::: :. :: :::::..::: :: : : : ::.:::::::::::::::
CCDS58 GGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD--SEQDNSDNNTIFVQGLGE
240 250 260 270 280 290
250 260 270 280 290 300
pF1KE2 GVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAIDWF
.:. ..:...::::::::::::::.::::::::..::: :::::::::::::::::::::
CCDS58 NVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWF
300 310 320 330 340 350
310 320 330 340 350
pF1KE2 DGKEFHGNIIKVSFATRRPEFMRGGGSGGGRRGRGGYRGRGGFQG-------RGGDP---
::::: :: ::::::::: .: ::::.: : ::::: ::::. : ::: :
CCDS58 DGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGG
360 370 380 390 400 410
360 370 380 390 400
pF1KE2 -------KSGDWVCPNPSCGNMNFARRNSCNQCNEPRPEDSRPSGGDFRGRGYGGERGYR
..::: ::::.: ::::. :: ::::. :.:. :.:: : .::. :
CCDS58 GGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDG--PGGGP-GGSHMGGNYGDD
420 430 440 450 460 470
410 420 430 440 450 460
pF1KE2 GRGGRGG-DRGGYGGDRSGGGYGGDRSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGYGG
:::::: ::::: : :: :: :.. :: :::.: : : : : . ::
CCDS58 RRGGRGGYDRGGYRG--RGGDRGGFRGGRGG--GDRGGFGPGKMDSRGEHRQDRRERPY
480 490 500 510 520
470 480 490 500 510 520
pF1KE2 DRGGGYGGDRGGGYGGDRGGYGGDRGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYGGD
>>CCDS10707.1 FUS gene_id:2521|Hs108|chr16 (526 aa)
initn: 693 init1: 693 opt: 1214 Z-score: 665.9 bits: 133.0 E(32554): 9e-31
Smith-Waterman score: 1418; 51.9% identity (66.9% similar) in 516 aa overlap (15-459:20-521)
10 20 30 40 50
pF1KE2 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQASQSYSGYGQTTDSS-YGQNYSGYS
: . :.. .:: ::: ::::::.:.::.: ::: :.::
CCDS10 MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQ--QSYSGYSQSTDTSGYGQ--SSYS
10 20 30 40 50
60 70 80 90 100
pF1KE2 SYGQSQ-SGYS-----QSYG---GYENQK--QSSYSQQP-YNNQGQQQNMES-SGSQGG-
:::::: .::. :.:: :: ... ::::.:: : . ::: : ::: :.
CCDS10 SYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSS
60 70 80 90 100 110
110 120 130 140
pF1KE2 -RAPSYDQPD---YGQQDSYD-QQSGYDQHQGSYDEQSNYDQQHD---------------
.. :: ::. :.:: :: ::..: :.: ::. ..: ::..
CCDS10 SQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQ-SYNPPQGYGQQNQYNSSSGGGGGGGGGG
120 130 140 150 160 170
150 160 170 180
pF1KE2 SYSQNQQSYHS---QRENYSHHTQDDRRDVSRYGEDNRG---YGGSQGGG--------RG
.:.:.:.:. : . .:... :. . ::...:: ::: ::: :.
CCDS10 NYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRS
180 190 200 210 220 230
190 200 210 220 230 240
pF1KE2 RGGYDKDGRGPMTGSSGG----DRGGFKNFGGHRDYGPRTDADSESDNSDNNTIFVQGLG
:::. ::: :. :: :::::..::: :: : : : ::.::::::::::::::
CCDS10 SGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD--SEQDNSDNNTIFVQGLG
240 250 260 270 280 290
250 260 270 280 290 300
pF1KE2 EGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAIDW
:.:. ..:...::::::::::::::.::::::::..::: ::::::::::::::::::::
CCDS10 ENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDW
300 310 320 330 340 350
310 320 330 340 350
pF1KE2 FDGKEFHGNIIKVSFATRRPEFMRGGGSGGGRRGRGGYRGRGGFQG-------RGGDP--
:::::: :: ::::::::: .: ::::.: : ::::: ::::. : ::: :
CCDS10 FDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSG
360 370 380 390 400 410
360 370 380 390 400
pF1KE2 --------KSGDWVCPNPSCGNMNFARRNSCNQCNEPRPEDSRPSGGDFRGRGYGGERGY
..::: ::::.: ::::. :: ::::. :.:. :.:: : .::. :
CCDS10 GGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDG--PGGGP-GGSHMGGNYGD
420 430 440 450 460 470
410 420 430 440 450 460
pF1KE2 RGRGGRGG-DRGGYGGDRSGGGYGGDRSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGYG
:::::: ::::: : :: :: :.. :: :::.: : : : : . ::
CCDS10 DRRGGRGGYDRGGYRG--RGGDRGGFRGGRGG--GDRGGFGPGKMDSRGEHRQDRRERPY
480 490 500 510 520
470 480 490 500 510 520
pF1KE2 GDRGGGYGGDRGGGYGGDRGGYGGDRGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYGG
>>CCDS54514.1 EWSR1 gene_id:2130|Hs108|chr22 (600 aa)
initn: 927 init1: 474 opt: 1000 Z-score: 552.5 bits: 112.3 E(32554): 1.9e-24
Smith-Waterman score: 1262; 42.8% identity (60.8% similar) in 572 aa overlap (16-491:40-589)
10 20 30 40
pF1KE2 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQASQSYSGYGQTT-DS
::.:::.: . .: :: :. . ::::. .
CCDS54 SQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQA-QTTATYGQTAYAT
10 20 30 40 50 60
50 60 70 80
pF1KE2 SYGQNYSGYSS------YGQSQSGYSQSYGGYENQK------------QSSYSQQP-YNN
:::: .::.. :.: .::. :.:.. ::.:. :: :
CCDS54 SYGQPPTGYTTPTAPQAYSQPVQGYGT--GAYDTTTATVTTTQASYAAQSAYGTQPAYPA
70 80 90 100 110 120
90 100 110 120 130 140
pF1KE2 QGQQQNMESSGSQGGRAP-SYDQPDYGQQDSYDQQSGYDQHQGSYDEQSNYDQQHD----
::: . : .. : :::: .:.::..: : :.: : :.:: .::.: ::
CCDS54 YGQQPAATAPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQ-QSSYGQQSSYGQQPPTSYP
130 140 150 160 170 180
150 160 170 180
pF1KE2 ----SYSQNQQSYHSQRENYSHHT---QDDRRDVSRYGEDNRGYGG-----SQGG----G
:::: ..: .: .:.... :: ... ::... :..: :..: :
CCDS54 PQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRG
190 200 210 220 230 240
190 200 210 220 230
pF1KE2 RGRGGYDKDG--RGPMTGSSGG-----DRGGFKNFGGHRDYGPRTDADSESD---NSDNN
:::::.:. : :: :. :: .::::.. :: : :: : : .:::.
CCDS54 RGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNS
250 260 270 280 290 300
240 250 260 270 280 290
pF1KE2 TIFVQGLGEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPP
.:.::::...:. :....:::: :..: ::.::.:::..: ::.::::::.::::..:::
CCDS54 AIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPP
310 320 330 340 350 360
300 310 320 330
pF1KE2 SAKAAIDWFDGKEFHGNIIKVSFATRRPEF--MRGG--------------------GSGG
.::::..:::::.:.:. .:::.: ..: . :::: :. :
CCDS54 TAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPG
370 380 390 400 410 420
340 350 360 370
pF1KE2 GRRGRGGYRG--RGGFQGRG-----GDP--------KSGDWVCPNPSCGNMNFARRNSCN
: :: : :: :::: :: :.: ..::: ::::.:::.::: :. ::
CCDS54 GPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECN
430 440 450 460 470 480
380 390 400 410 420 430
pF1KE2 QCNEPRPEDSRPS-----GGDFRGRGYGGERGYRGRGGRGG--DRGGYGGDRSGGGYGGD
::. :.:: : ::: :: :: :.: ::::: :::: :: :: :::
CCDS54 QCKAPKPEGFLPPPFPPPGGD---RGRGGPGGMR--GGRGGLMDRGGPGGMFRGG-RGGD
490 500 510 520 530
440 450 460 470 480
pF1KE2 RSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGYGGDRGGGYGGDRGGGYGGDRGGYGG-D
: ::. : : : :: ::.:: : :: :: : . .. :: : ::: : :
CCDS54 R---GGFRG-----GRGMDR--GGFGGGRRGGPGGPPGPLM--EQMGGRRGGRGGPGKMD
540 550 560 570 580
490 500 510 520 530 540
pF1KE2 RGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSGYGGDRSGGY
.:
CCDS54 KGEHRQERRDRPY
590 600
>>CCDS54513.1 EWSR1 gene_id:2130|Hs108|chr22 (655 aa)
initn: 913 init1: 460 opt: 989 Z-score: 546.3 bits: 111.2 E(32554): 4.1e-24
Smith-Waterman score: 1213; 41.7% identity (61.1% similar) in 561 aa overlap (2-491:107-644)
10 20
pF1KE2 MSDSGSYG-QSG-GEQQSYSTYGNPGSQGYG
. ..::. ::. : : .: .: :.: .
CCDS54 YTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAY---GQQPAA
80 90 100 110 120 130
30 40 50 60 70 80
pF1KE2 QASQSYSGYGQTTDSSYGQNYSGYSSYGQSQSGYSQSYGGYENQKQSSYSQQPYNNQGQQ
: . .. :..: :. .: .:.: . ::.:: .: : .:: .:: . .
CCDS54 TAPTRPQDGNKPTETSQPQSSTG--GYNQPSLGYGQSNYSYP-QVPGSYPMQPVTAPPSY
140 150 160 170 180 190
90 100 110 120 130 140
pF1KE2 QNMESSGSQGGRAPSYDQPDYGQQDSYDQQSGYDQHQGSYDEQSNYDQQHD--------S
:..: :::: .:.::..: : :.: : :.:: .::.: :: :
CCDS54 PPTSYSSTQ---PTSYDQSSYSQQNTYGQPSSYGQ-QSSYGQQSSYGQQPPTSYPPQTGS
200 210 220 230 240
150 160 170 180
pF1KE2 YSQNQQSYHSQRENYSHHT---QDDRRDVSRYGEDNRGYGG-----SQGG----GRGRGG
::: ..: .: .:.... :: ... ::... :..: :..: ::::::
CCDS54 YSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGG
250 260 270 280 290 300
190 200 210 220 230 240
pF1KE2 YDKDG--RGPMTGSSGG----DRGGFKNFGGHRDYGPRTDADSESD---NSDNNTIFVQG
.:. : :: :. :: .::::.. :: : :: : : .:::..:.:::
CCDS54 FDRGGMSRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQG
310 320 330 340 350 360
250 260 270 280 290 300
pF1KE2 LGEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAI
:...:. :....:::: :..: ::.::.:::..: ::.::::::.::::..:::.::::.
CCDS54 LNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAV
370 380 390 400 410 420
310 320 330
pF1KE2 DWFDGKEFHGNIIKVSFATRRPEF--MRGG--------------------GSGGGRRGRG
.:::::.:.:. .:::.: ..: . :::: :. :: ::
CCDS54 EWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRM
430 440 450 460 470 480
340 350 360 370 380
pF1KE2 GYRG--RGGFQGRG-----GDP--------KSGDWVCPNPSCGNMNFARRNSCNQCNEPR
: :: :::: :: :.: ..::: ::::.:::.::: :. ::::. :.
CCDS54 GGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPK
490 500 510 520 530 540
390 400 410 420 430 440
pF1KE2 PEDSRPSGGDFRGRGYGGERGYRGRGGRGGDRGGYGGDRSGGGYGGDRSSGGGYSGDRSG
:: : : : : ::::: :: ::: :: . :: :: :: .:::.:
CCDS54 PEGFLPP--PFPPPG-----GDRGRGGPGGMRGGRGGLMDRGGPGGMFR--GGRGGDRGG
550 560 570 580 590
450 460 470 480 490 500
pF1KE2 --GGYGGDRSGGGYGGDRGGGYGGDRGGGYGGDRGGGYGGDRGGYGG-DRGGGYGGDRGG
:: : :: ::.:: : :: :: : . .. :: : ::: : :.:
CCDS54 FRGGRGMDR--GGFGGGRRGGPGGPPGPLM--EQMGGRRGGRGGPGKMDKGEHRQERRDR
600 610 620 630 640 650
510 520 530 540 550 560
pF1KE2 YGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSGYGGDRSGGYGGDRSGGGYGG
CCDS54 PY
>>CCDS13852.2 EWSR1 gene_id:2130|Hs108|chr22 (661 aa)
initn: 913 init1: 460 opt: 989 Z-score: 546.3 bits: 111.2 E(32554): 4.2e-24
Smith-Waterman score: 1213; 41.7% identity (61.1% similar) in 561 aa overlap (2-491:113-650)
10 20
pF1KE2 MSDSGSYG-QSG-GEQQSYSTYGNPGSQGYG
. ..::. ::. : : .: .: :.: .
CCDS13 YTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAY---GQQPAA
90 100 110 120 130
30 40 50 60 70 80
pF1KE2 QASQSYSGYGQTTDSSYGQNYSGYSSYGQSQSGYSQSYGGYENQKQSSYSQQPYNNQGQQ
: . .. :..: :. .: .:.: . ::.:: .: : .:: .:: . .
CCDS13 TAPTRPQDGNKPTETSQPQSSTG--GYNQPSLGYGQSNYSYP-QVPGSYPMQPVTAPPSY
140 150 160 170 180 190
90 100 110 120 130 140
pF1KE2 QNMESSGSQGGRAPSYDQPDYGQQDSYDQQSGYDQHQGSYDEQSNYDQQHD--------S
:..: :::: .:.::..: : :.: : :.:: .::.: :: :
CCDS13 PPTSYSSTQ---PTSYDQSSYSQQNTYGQPSSYGQ-QSSYGQQSSYGQQPPTSYPPQTGS
200 210 220 230 240 250
150 160 170 180
pF1KE2 YSQNQQSYHSQRENYSHHT---QDDRRDVSRYGEDNRGYGG-----SQGG----GRGRGG
::: ..: .: .:.... :: ... ::... :..: :..: ::::::
CCDS13 YSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGG
260 270 280 290 300 310
190 200 210 220 230 240
pF1KE2 YDKDG--RGPMTGSSGG----DRGGFKNFGGHRDYGPRTDADSESD---NSDNNTIFVQG
.:. : :: :. :: .::::.. :: : :: : : .:::..:.:::
CCDS13 FDRGGMSRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQG
320 330 340 350 360 370
250 260 270 280 290 300
pF1KE2 LGEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAI
:...:. :....:::: :..: ::.::.:::..: ::.::::::.::::..:::.::::.
CCDS13 LNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAV
380 390 400 410 420 430
310 320 330
pF1KE2 DWFDGKEFHGNIIKVSFATRRPEF--MRGG--------------------GSGGGRRGRG
.:::::.:.:. .:::.: ..: . :::: :. :: ::
CCDS13 EWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRM
440 450 460 470 480 490
340 350 360 370 380
pF1KE2 GYRG--RGGFQGRG-----GDP--------KSGDWVCPNPSCGNMNFARRNSCNQCNEPR
: :: :::: :: :.: ..::: ::::.:::.::: :. ::::. :.
CCDS13 GGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPK
500 510 520 530 540 550
390 400 410 420 430 440
pF1KE2 PEDSRPSGGDFRGRGYGGERGYRGRGGRGGDRGGYGGDRSGGGYGGDRSSGGGYSGDRSG
:: : : : : ::::: :: ::: :: . :: :: :: .:::.:
CCDS13 PEGFLPP--PFPPPG-----GDRGRGGPGGMRGGRGGLMDRGGPGGMFR--GGRGGDRGG
560 570 580 590 600
450 460 470 480 490 500
pF1KE2 --GGYGGDRSGGGYGGDRGGGYGGDRGGGYGGDRGGGYGGDRGGYGG-DRGGGYGGDRGG
:: : :: ::.:: : :: :: : . .. :: : ::: : :.:
CCDS13 FRGGRGMDR--GGFGGGRRGGPGGPPGPLM--EQMGGRRGGRGGPGKMDKGEHRQERRDR
610 620 630 640 650
510 520 530 540 550 560
pF1KE2 YGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSGYGGDRSGGYGGDRSGGGYGG
CCDS13 PY
660
>>CCDS13851.1 EWSR1 gene_id:2130|Hs108|chr22 (656 aa)
initn: 927 init1: 474 opt: 987 Z-score: 545.3 bits: 111.0 E(32554): 4.7e-24
Smith-Waterman score: 1211; 41.6% identity (61.0% similar) in 562 aa overlap (2-491:107-645)
10 20
pF1KE2 MSDSGSYG-QSG-GEQQSYSTYGNPGSQGYG
. ..::. ::. : : .: .: :.: .
CCDS13 YTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAY---GQQPAA
80 90 100 110 120 130
30 40 50 60 70 80
pF1KE2 QASQSYSGYGQTTDSSYGQNYSGYSSYGQSQSGYSQSYGGYENQKQSSYSQQPYNNQGQQ
: . .. :..: :. .: .:.: . ::.:: .: : .:: .:: . .
CCDS13 TAPTRPQDGNKPTETSQPQSSTG--GYNQPSLGYGQSNYSYP-QVPGSYPMQPVTAPPSY
140 150 160 170 180 190
90 100 110 120 130 140
pF1KE2 QNMESSGSQGGRAPSYDQPDYGQQDSYDQQSGYDQHQGSYDEQSNYDQQHD--------S
:..: :::: .:.::..: : :.: : :.:: .::.: :: :
CCDS13 PPTSYSSTQ---PTSYDQSSYSQQNTYGQPSSYGQ-QSSYGQQSSYGQQPPTSYPPQTGS
200 210 220 230 240
150 160 170 180
pF1KE2 YSQNQQSYHSQRENYSHHT---QDDRRDVSRYGEDNRGYGG-----SQGG----GRGRGG
::: ..: .: .:.... :: ... ::... :..: :..: ::::::
CCDS13 YSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGG
250 260 270 280 290 300
190 200 210 220 230
pF1KE2 YDKDG--RGPMTGSSGG-----DRGGFKNFGGHRDYGPRTDADSESD---NSDNNTIFVQ
.:. : :: :. :: .::::.. :: : :: : : .:::..:.::
CCDS13 FDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQ
310 320 330 340 350 360
240 250 260 270 280 290
pF1KE2 GLGEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAA
::...:. :....:::: :..: ::.::.:::..: ::.::::::.::::..:::.::::
CCDS13 GLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAA
370 380 390 400 410 420
300 310 320 330
pF1KE2 IDWFDGKEFHGNIIKVSFATRRPEF--MRGG--------------------GSGGGRRGR
..:::::.:.:. .:::.: ..: . :::: :. :: ::
CCDS13 VEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGR
430 440 450 460 470 480
340 350 360 370 380
pF1KE2 GGYRG--RGGFQGRG-----GDP--------KSGDWVCPNPSCGNMNFARRNSCNQCNEP
: :: :::: :: :.: ..::: ::::.:::.::: :. ::::. :
CCDS13 MGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAP
490 500 510 520 530 540
390 400 410 420 430 440
pF1KE2 RPEDSRPSGGDFRGRGYGGERGYRGRGGRGGDRGGYGGDRSGGGYGGDRSSGGGYSGDRS
.:: : : : : ::::: :: ::: :: . :: :: :: .:::.
CCDS13 KPEGFLPP--PFPPPG-----GDRGRGGPGGMRGGRGGLMDRGGPGGMFR--GGRGGDRG
550 560 570 580 590
450 460 470 480 490
pF1KE2 G--GGYGGDRSGGGYGGDRGGGYGGDRGGGYGGDRGGGYGGDRGGYGG-DRGGGYGGDRG
: :: : :: ::.:: : :: :: : . .. :: : ::: : :.:
CCDS13 GFRGGRGMDR--GGFGGGRRGGPGGPPGPLM--EQMGGRRGGRGGPGKMDKGEHRQERRD
600 610 620 630 640 650
500 510 520 530 540 550
pF1KE2 GYGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSGYGGDRSGGYGGDRSGGGYG
CCDS13 RPY
592 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 12:15:03 2016 done: Sun Nov 6 12:15:04 2016
Total Scan time: 2.940 Total Display time: 0.080
Function used was FASTA [36.3.4 Apr, 2011]