FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5906, 526 aa
1>>>pF1KB5906 526 - 526 aa - 526 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.0556+/-0.00137; mu= 0.6969+/- 0.083
mean_var=460.3733+/-95.446, 0's: 0 Z-trim(113.1): 117 B-trim: 0 in 0/52
Lambda= 0.059775
statistics sampled from 13710 (13813) to 13710 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.712), E-opt: 0.2 (0.424), width: 16
Scan time: 3.350
The best scores are: opt bits E(32554)
CCDS10707.1 FUS gene_id:2521|Hs108|chr16 ( 526) 3790 341.5 1.4e-93
CCDS58454.1 FUS gene_id:2521|Hs108|chr16 ( 525) 3767 339.5 5.6e-93
CCDS32623.1 TAF15 gene_id:8148|Hs108|chr17 ( 592) 1214 119.4 1.1e-26
CCDS59279.1 TAF15 gene_id:8148|Hs108|chr17 ( 589) 1202 118.4 2.3e-26
CCDS54514.1 EWSR1 gene_id:2130|Hs108|chr22 ( 600) 1132 112.4 1.6e-24
CCDS54513.1 EWSR1 gene_id:2130|Hs108|chr22 ( 655) 1060 106.2 1.2e-22
CCDS13852.2 EWSR1 gene_id:2130|Hs108|chr22 ( 661) 1060 106.2 1.2e-22
CCDS13851.1 EWSR1 gene_id:2130|Hs108|chr22 ( 656) 1059 106.1 1.3e-22
>>CCDS10707.1 FUS gene_id:2521|Hs108|chr16 (526 aa)
initn: 3790 init1: 3790 opt: 3790 Z-score: 1793.4 bits: 341.5 E(32554): 1.4e-93
Smith-Waterman score: 3790; 100.0% identity (100.0% similar) in 526 aa overlap (1-526:1-526)
10 20 30 40 50 60
pF1KB5 MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQ
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 SQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 SYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 QSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 QSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 PRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIES
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 VADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 GNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQ
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB5 QRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGYD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 QRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGYD
430 440 450 460 470 480
490 500 510 520
pF1KB5 RGGYRGRGGDRGGFRGGRGGGDRGGFGPGKMDSRGEHRQDRRERPY
::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RGGYRGRGGDRGGFRGGRGGGDRGGFGPGKMDSRGEHRQDRRERPY
490 500 510 520
>>CCDS58454.1 FUS gene_id:2521|Hs108|chr16 (525 aa)
initn: 3353 init1: 3353 opt: 3767 Z-score: 1782.7 bits: 339.5 E(32554): 5.6e-93
Smith-Waterman score: 3767; 99.6% identity (99.8% similar) in 526 aa overlap (1-526:1-525)
10 20 30 40 50 60
pF1KB5 MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQ
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 SQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSS
:::. :::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 SQNS-YGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSS
70 80 90 100 110
130 140 150 160 170 180
pF1KB5 SYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 SYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQD
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB5 QSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 QSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYE
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB5 PRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 PRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIES
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB5 VADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 VADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFS
300 310 320 330 340 350
370 380 390 400 410 420
pF1KB5 GNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 GNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQ
360 370 380 390 400 410
430 440 450 460 470 480
pF1KB5 QRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGYD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 QRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGYD
420 430 440 450 460 470
490 500 510 520
pF1KB5 RGGYRGRGGDRGGFRGGRGGGDRGGFGPGKMDSRGEHRQDRRERPY
::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 RGGYRGRGGDRGGFRGGRGGGDRGGFGPGKMDSRGEHRQDRRERPY
480 490 500 510 520
>>CCDS32623.1 TAF15 gene_id:8148|Hs108|chr17 (592 aa)
initn: 693 init1: 693 opt: 1214 Z-score: 592.2 bits: 119.4 E(32554): 1.1e-26
Smith-Waterman score: 1429; 51.0% identity (66.8% similar) in 533 aa overlap (3-521:4-459)
10 20 30 40 50
pF1KB5 MASNDYTQQA--TQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQ--SSY
:..: :.. :::..: . .:::.: : ::::::.:.::.: ::: :.:
CCDS32 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQAS------QSYSGYGQTTDSS-YGQNYSGY
10 20 30 40 50
60 70 80 90 100 110
pF1KB5 SSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGS
::::::: .::. :.: ::: ... ::::.:: : . ::: : ::: :
CCDS32 SSYGQSQ-SGYS-----QSY---GGYENQK--QSSYSQQP-YNNQGQQQNMES-SGSQG-
60 70 80 90
120 130 140 150 160 170
pF1KB5 SSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQG-YGQQNQYNSSSGGGGGGGGG
... :: .::.:: ::.:: ::..:. :: : .:..:...
CCDS32 -GRAPSY---------DQPDYG-QQDSYDQQSGYDQHQGSYDEQSNYDQQHD--------
100 110 120 130 140
180 190 200 210 220 230
pF1KB5 GNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNR
.:.:.:.:. : . .:... :. . ::... :: ::: ::: :
CCDS32 -SYSQNQQSYHS---QRENYSHHTQDDRRDVSRYGEDN---RGYGGSQGGG--------R
150 160 170 180
240 250 260 270 280 290
pF1KB5 SSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD--SEQDNSDNNTIFVQGL
. :::. ::: :. :: :::::..::: :: : : : ::.:::::::::::::
CCDS32 GRGGYDKDGRGPMTGSSGG----DRGGFKNFGGHRDYGPRTDADSESDNSDNNTIFVQGL
190 200 210 220 230 240
300 310 320 330 340 350
pF1KB5 GENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAID
::.:. ..:...::::::::::::::.::::::::..::: :::::::::::::::::::
CCDS32 GEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAID
250 260 270 280 290 300
360 370 380 390 400 410
pF1KB5 WFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPS
::::::: :: ::::::::: .: ::::.: : ::::: ::::. : ::: :
CCDS32 WFDGKEFHGNIIKVSFATRRPEFMRGGGSGGGRRGRGGYRGRGGFQG-------RGGDP-
310 320 330 340 350
420 430 440 450 460
pF1KB5 GGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDG--PGGGP-GGSHMGGNYG
..::: ::::.: ::::. :: ::::. :.:. :.:: : .::. :
CCDS32 ---------KSGDWVCPNPSCGNMNFARRNSCNQCNEPRPEDSRPSGGDFRGRGYGGERG
360 370 380 390 400
470 480 490 500 510 520
pF1KB5 DDRRGGRGGYDRGGYRG--RGGDRGGFRGGRGG--GDRGGFGPGKMDSRGEHRQDRRERP
:::::: ::::: : :: :: :.. :: :::.: : : : : . ::
CCDS32 YRGRGGRGG-DRGGYGGDRSGGGYGGDRSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGY
410 420 430 440 450 460
pF1KB5 Y
CCDS32 GGDRGGGYGGDRGGGYGGDRGGYGGDRGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYG
470 480 490 500 510 520
>>CCDS59279.1 TAF15 gene_id:8148|Hs108|chr17 (589 aa)
initn: 699 init1: 699 opt: 1202 Z-score: 586.7 bits: 118.4 E(32554): 2.3e-26
Smith-Waterman score: 1410; 50.3% identity (65.9% similar) in 533 aa overlap (3-521:4-456)
10 20 30 40 50
pF1KB5 MASNDYTQQA--TQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQ--SSY
:..: :.. :::..: . .:::.: : ::::::.:.::.: ::: :.:
CCDS59 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQAS------QSYSGYGQTTDSS-YGQNYSGY
10 20 30 40 50
60 70 80 90 100 110
pF1KB5 SSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGS
:::::: . .:: :: ... ::::.:: : . ::: : ::: :
CCDS59 SSYGQSYSQSYG------------GYENQK--QSSYSQQP-YNNQGQQQNMES-SGSQG-
60 70 80 90
120 130 140 150 160 170
pF1KB5 SSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQG-YGQQNQYNSSSGGGGGGGGG
... :: .::.:: ::.:: ::..:. :: : .:..:...
CCDS59 -GRAPSY---------DQPDYG-QQDSYDQQSGYDQHQGSYDEQSNYDQQHD--------
100 110 120 130
180 190 200 210 220 230
pF1KB5 GNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNR
.:.:.:.:. : . .:... :. . ::... :: ::: ::: :
CCDS59 -SYSQNQQSYHS---QRENYSHHTQDDRRDVSRYGEDN---RGYGGSQGGG--------R
140 150 160 170 180
240 250 260 270 280 290
pF1KB5 SSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD--SEQDNSDNNTIFVQGL
. :::. ::: :. :: :::::..::: :: : : : ::.:::::::::::::
CCDS59 GRGGYDKDGRGPMTGSSGG----DRGGFKNFGGHRDYGPRTDADSESDNSDNNTIFVQGL
190 200 210 220 230
300 310 320 330 340 350
pF1KB5 GENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAID
::.:. ..:...::::::::::::::.::::::::..::: :::::::::::::::::::
CCDS59 GEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAID
240 250 260 270 280 290
360 370 380 390 400 410
pF1KB5 WFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPS
::::::: :: ::::::::: .: ::::.: : ::::: ::::. : ::: :
CCDS59 WFDGKEFHGNIIKVSFATRRPEFMRGGGSGGGRRGRGGYRGRGGFQG-------RGGDP-
300 310 320 330 340 350
420 430 440 450 460
pF1KB5 GGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDG--PGGGP-GGSHMGGNYG
..::: ::::.: ::::. :: ::::. :.:. :.:: : .::. :
CCDS59 ---------KSGDWVCPNPSCGNMNFARRNSCNQCNEPRPEDSRPSGGDFRGRGYGGERG
360 370 380 390 400
470 480 490 500 510 520
pF1KB5 DDRRGGRGGYDRGGYRG--RGGDRGGFRGGRGG--GDRGGFGPGKMDSRGEHRQDRRERP
:::::: ::::: : :: :: :.. :: :::.: : : : : . ::
CCDS59 YRGRGGRGG-DRGGYGGDRSGGGYGGDRSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGY
410 420 430 440 450 460
pF1KB5 Y
CCDS59 GGDRGGGYGGDRGGGYGGDRGGYGGDRGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYG
470 480 490 500 510 520
>>CCDS54514.1 EWSR1 gene_id:2130|Hs108|chr22 (600 aa)
initn: 684 init1: 529 opt: 1132 Z-score: 554.0 bits: 112.4 E(32554): 1.6e-24
Smith-Waterman score: 1593; 48.5% identity (68.3% similar) in 586 aa overlap (1-515:1-563)
10 20 30 40
pF1KB5 MASNDYTQQ----ATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTD--------TS
:::.::. : :.:.:: .:: :::.: ..: ::::::. :.: :: :.
CCDS54 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQ-TTQAYGQQSYGTYGQPTDVSYTQAQTTA
10 20 30 40 50
50 60 70 80 90
pF1KB5 GYGQSSY-SSYGQSQNTGYGTQSTPQGYGS-TGGYGS---------------SQSSQSSY
:::..: .:::: ::: : ..::.:.. . :::. : ..::.:
CCDS54 TYGQTAYATSYGQPP-TGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAY
60 70 80 90 100 110
100 110 120 130 140 150
pF1KB5 GQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNP
: : .::.:::::: .. . :: ::.: .:: : .::::: .:: : .:::::.::.
CCDS54 GTQPAYPAYGQQPAATAPT-SY-SSTQPTSYDQ---SSYSQQNTYG-QPSSYGQQSSYGQ
120 130 140 150 160 170
160 170 180 190 200
pF1KB5 PQGYGQQ--NQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYG
..:::: ..: ..: .:.: :..:. ..: : .. :. .. : ::
CCDS54 QSSYGQQPPTSYPPQTG---------SYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYG
180 190 200 210 220
210 220 230 240 250 260
pF1KB5 QQDRG----GRGRGGSGGGGGGGG-GGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNK
:.. : :..:. :: . : : ::..: ::. :::::::: :. : .::::::
CCDS54 QESGGFSGPGENRSMSGPDNRGRGRGGFDR--GGMSRGGRGGGRGGMGSAG--ERGGFNK
230 240 250 260 270
270 280 290 300 310
pF1KB5 FGGPRDQGSRHD-----SEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQ
::: :.: : . ...:::..:.::::...::....::.::: :..: ::.:::
CCDS54 PGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQ
280 290 300 310 320 330
320 330 340 350 360 370
pF1KB5 PMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFN--R
:::..: :.:::: ::.::::..:::.::::..:::::.:.:. .:::.: .. .: :
CCDS54 PMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMR
340 350 360 370 380 390
380 390 400 410
pF1KB5 GGGNGRGGRG-----RGGPMGRGGYGGG----GSGGGGRGGFPSGG---------GGGGG
:: : ::: :::: : :: :: :. :: ::::: : :::.
CCDS54 GGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNV
400 410 420 430 440 450
420 430 440 450 460 470
pF1KB5 QQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDG----PGGGPGGSHMGGNYGDDRRGG
:.:::::.:::: : :.::.::.::::::::::.: : :::.. :. : :::
CCDS54 QHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGG-MRGG
460 470 480 490 500 510
480 490 500 510 520
pF1KB5 RGG-YDRGG----YRG-RGGDRGGFRGGRGGGDRGGFGPGKMDSRGEHRQDRRERPY
::: .:::: .:: ::::::::::::: :::::: :. . :
CCDS54 RGGLMDRGGPGGMFRGGRGGDRGGFRGGRGM-DRGGFGGGRRGGPGGPPGPLMEQMGGRR
520 530 540 550 560 570
CCDS54 GGRGGPGKMDKGEHRQERRDRPY
580 590 600
>>CCDS54513.1 EWSR1 gene_id:2130|Hs108|chr22 (655 aa)
initn: 717 init1: 562 opt: 1060 Z-score: 520.0 bits: 106.2 E(32554): 1.2e-22
Smith-Waterman score: 1461; 45.3% identity (66.4% similar) in 583 aa overlap (33-515:44-618)
10 20 30 40 50 60
pF1KB5 SNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSY-SSYGQS
::: . .:.:. :. :::..: .::::
CCDS54 AQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQP
20 30 40 50 60 70
70 80 90 100
pF1KB5 QNTGYGTQSTPQGYGS-TGGYGS---------------SQSSQSSYGQQSSYPGYGQQPA
::: : ..::.:.. . :::. : ..::.:: : .::.::::::
CCDS54 P-TGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPA
80 90 100 110 120 130
110 120 130
pF1KB5 ------------------PSSTSGSYGSSSQS---SSYGQPQ-SGSYSQQP---------
:.:..:.:.. : . :.:. :: ::: .::
CCDS54 ATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPP
140 150 160 170 180 190
140 150 160 170 180
pF1KB5 -SYGG------QQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGG-----GNYGQDQS
::.. .:.::.::..:. :..::::..:...:. : . :.:.: :
CCDS54 TSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPS
200 210 220 230 240 250
190 200 210 220 230
pF1KB5 SMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRG----GRGRGGSGGGGGGGG-GGYNRSSG
..:. ..: : .. :. .. : :::.. : :..:. :: . : : ::..: :
CCDS54 QYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDR--G
260 270 280 290 300 310
240 250 260 270 280 290
pF1KB5 GYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD-----SEQDNSDNNTIFVQGL
:. .::: :::::::...:::::: ::: :.: : . ...:::..:.::::
CCDS54 GM---SRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGL
320 330 340 350 360
300 310 320 330 340 350
pF1KB5 GENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAID
...::....::.::: :..: ::.::::::..: :.:::: ::.::::..:::.::::..
CCDS54 NDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVE
370 380 390 400 410 420
360 370 380 390 400
pF1KB5 WFDGKEFSGNPIKVSFATRRADFN--RGGGNGRGGRG-----RGGPMGRGGYGGG----G
:::::.:.:. .:::.: .. .: ::: : ::: :::: : :: :: :
CCDS54 WFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMG
430 440 450 460 470 480
410 420 430 440 450
pF1KB5 SGGGGRGGFPSGG---------GGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKP
. :: ::::: : :::. :.:::::.:::: : :.::.::.::::::::::
CCDS54 GRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKP
490 500 510 520 530 540
460 470 480 490 500
pF1KB5 DG----PGGGPGGSHMGGNYGDDRRGGRGG-YDRGG----YRG-RGGDRGGFRGGRGGGD
.: : :::.. :. : :::::: .:::: .:: ::::::::::::: :
CCDS54 EGFLPPPFPPPGGDRGRGGPGG-MRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGM-D
550 560 570 580 590 600
510 520
pF1KB5 RGGFGPGKMDSRGEHRQDRRERPY
::::: :. . :
CCDS54 RGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY
610 620 630 640 650
>>CCDS13852.2 EWSR1 gene_id:2130|Hs108|chr22 (661 aa)
initn: 717 init1: 562 opt: 1060 Z-score: 520.0 bits: 106.2 E(32554): 1.2e-22
Smith-Waterman score: 1436; 45.3% identity (65.9% similar) in 581 aa overlap (41-515:52-624)
20 30 40 50 60
pF1KB5 TQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSY-SSYGQ-----SQNT
:.:. :. :::..: .:::: . .:
CCDS13 TAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTVEGTST
30 40 50 60 70 80
70 80 90 100
pF1KB5 GYGTQSTPQ-------GYGSTGGYGS----------SQSSQSSYGQQSSYPGYGQQPA--
:: : ..:: ::: ::.: . : ..::.:: : .::.::::::
CCDS13 GYTTPTAPQAYSQPVQGYG-TGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAAT
90 100 110 120 130 140
110 120 130
pF1KB5 ----------------PSSTSGSYGSSSQS---SSYGQPQ-SGSYSQQP----------S
:.:..:.:.. : . :.:. :: ::: .:: :
CCDS13 APTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTS
150 160 170 180 190 200
140 150 160 170 180
pF1KB5 YGG------QQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGG-----GNYGQDQSSM
:.. .:.::.::..:. :..::::..:...:. : . :.:.: :..
CCDS13 YSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQY
210 220 230 240 250 260
190 200 210 220 230
pF1KB5 SSGGGSGGGYGNQDQSGGGGSGGYGQQDRG----GRGRGGSGGGGGGGG-GGYNRSSGGY
:. ..: : .. :. .. : :::.. : :..:. :: . : : ::..: ::.
CCDS13 SQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDR--GGM
270 280 290 300 310
240 250 260 270 280 290
pF1KB5 EPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD-----SEQDNSDNNTIFVQGLGE
.::: :::::::...:::::: ::: :.: : . ...:::..:.::::..
CCDS13 ---SRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLND
320 330 340 350 360 370
300 310 320 330 340 350
pF1KB5 NVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWF
.::....::.::: :..: ::.::::::..: :.:::: ::.::::..:::.::::..::
CCDS13 SVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWF
380 390 400 410 420 430
360 370 380 390 400
pF1KB5 DGKEFSGNPIKVSFATRRADFN--RGGGNGRGGRG-----RGGPMGRGGYGGG----GSG
:::.:.:. .:::.: .. .: ::: : ::: :::: : :: :: :.
CCDS13 DGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGR
440 450 460 470 480 490
410 420 430 440 450
pF1KB5 GGGRGGFPSGG---------GGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDG
:: ::::: : :::. :.:::::.:::: : :.::.::.::::::::::.:
CCDS13 GGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEG
500 510 520 530 540 550
460 470 480 490 500
pF1KB5 ----PGGGPGGSHMGGNYGDDRRGGRGG-YDRGG----YRG-RGGDRGGFRGGRGGGDRG
: :::.. :. : :::::: .:::: .:: ::::::::::::: :::
CCDS13 FLPPPFPPPGGDRGRGGPGG-MRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGM-DRG
560 570 580 590 600 610
510 520
pF1KB5 GFGPGKMDSRGEHRQDRRERPY
::: :. . :
CCDS13 GFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY
620 630 640 650 660
>>CCDS13851.1 EWSR1 gene_id:2130|Hs108|chr22 (656 aa)
initn: 684 init1: 529 opt: 1059 Z-score: 519.5 bits: 106.1 E(32554): 1.3e-22
Smith-Waterman score: 1452; 45.2% identity (66.0% similar) in 582 aa overlap (34-515:45-619)
10 20 30 40 50 60
pF1KB5 NDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSY-SSYGQSQ
:: . .:.:. :. :::..: .::::
CCDS13 QQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPP
20 30 40 50 60 70
70 80 90 100
pF1KB5 NTGYGTQSTPQGYGS-TGGYGS---------------SQSSQSSYGQQSSYPGYGQQPA-
::: : ..::.:.. . :::. : ..::.:: : .::.::::::
CCDS13 -TGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAA
80 90 100 110 120 130
110 120 130
pF1KB5 -----------------PSSTSGSYGSSSQS---SSYGQPQ-SGSYSQQP----------
:.:..:.:.. : . :.:. :: ::: .::
CCDS13 TAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPT
140 150 160 170 180 190
140 150 160 170 180
pF1KB5 SYGG------QQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGG-----GNYGQDQSS
::.. .:.::.::..:. :..::::..:...:. : . :.:.: :.
CCDS13 SYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQ
200 210 220 230 240 250
190 200 210 220 230
pF1KB5 MSSGGGSGGGYGNQDQSGGGGSGGYGQQDRG----GRGRGGSGGGGGGGG-GGYNRSSGG
.:. ..: : .. :. .. : :::.. : :..:. :: . : : ::..: ::
CCDS13 YSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDR--GG
260 270 280 290 300 310
240 250 260 270 280 290
pF1KB5 YEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD-----SEQDNSDNNTIFVQGLG
. :::::::: :. : .:::::: ::: :.: : . ...:::..:.::::.
CCDS13 MSRGGRGGGRGGMGSAG--ERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLN
320 330 340 350 360
300 310 320 330 340 350
pF1KB5 ENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDW
..::....::.::: :..: ::.::::::..: :.:::: ::.::::..:::.::::..:
CCDS13 DSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEW
370 380 390 400 410 420
360 370 380 390 400
pF1KB5 FDGKEFSGNPIKVSFATRRADFN--RGGGNGRGGRG-----RGGPMGRGGYGGG----GS
::::.:.:. .:::.: .. .: ::: : ::: :::: : :: :: :.
CCDS13 FDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGG
430 440 450 460 470 480
410 420 430 440 450
pF1KB5 GGGGRGGFPSGG---------GGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPD
:: ::::: : :::. :.:::::.:::: : :.::.::.::::::::::.
CCDS13 RGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPE
490 500 510 520 530 540
460 470 480 490 500
pF1KB5 G----PGGGPGGSHMGGNYGDDRRGGRGG-YDRGG----YRG-RGGDRGGFRGGRGGGDR
: : :::.. :. : :::::: .:::: .:: ::::::::::::: ::
CCDS13 GFLPPPFPPPGGDRGRGGPGG-MRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGM-DR
550 560 570 580 590 600
510 520
pF1KB5 GGFGPGKMDSRGEHRQDRRERPY
:::: :. . :
CCDS13 GGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY
610 620 630 640 650
526 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 15:30:42 2016 done: Sat Nov 5 15:30:42 2016
Total Scan time: 3.350 Total Display time: 0.090
Function used was FASTA [36.3.4 Apr, 2011]