FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2015, 592 aa 1>>>pF1KE2015 592 - 592 aa - 592 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.0979+/-0.00155; mu= 4.7167+/- 0.094 mean_var=360.2436+/-74.129, 0's: 0 Z-trim(108.9): 184 B-trim: 0 in 0/50 Lambda= 0.067573 statistics sampled from 10333 (10507) to 10333 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.626), E-opt: 0.2 (0.323), width: 16 Scan time: 2.940 The best scores are: opt bits E(32554) CCDS32623.1 TAF15 gene_id:8148|Hs108|chr17 ( 592) 4321 436.0 6.4e-122 CCDS59279.1 TAF15 gene_id:8148|Hs108|chr17 ( 589) 4285 432.5 7.3e-121 CCDS58454.1 FUS gene_id:2521|Hs108|chr16 ( 525) 1225 134.1 4.3e-31 CCDS10707.1 FUS gene_id:2521|Hs108|chr16 ( 526) 1214 133.0 9e-31 CCDS54514.1 EWSR1 gene_id:2130|Hs108|chr22 ( 600) 1000 112.3 1.9e-24 CCDS54513.1 EWSR1 gene_id:2130|Hs108|chr22 ( 655) 989 111.2 4.1e-24 CCDS13852.2 EWSR1 gene_id:2130|Hs108|chr22 ( 661) 989 111.2 4.2e-24 CCDS13851.1 EWSR1 gene_id:2130|Hs108|chr22 ( 656) 987 111.0 4.7e-24 >>CCDS32623.1 TAF15 gene_id:8148|Hs108|chr17 (592 aa) initn: 4321 init1: 4321 opt: 4321 Z-score: 2302.3 bits: 436.0 E(32554): 6.4e-122 Smith-Waterman score: 4321; 100.0% identity (100.0% similar) in 592 aa overlap (1-592:1-592) 10 20 30 40 50 60 pF1KE2 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQASQSYSGYGQTTDSSYGQNYSGYSSYGQSQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQASQSYSGYGQTTDSSYGQNYSGYSSYGQSQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 SGYSQSYGGYENQKQSSYSQQPYNNQGQQQNMESSGSQGGRAPSYDQPDYGQQDSYDQQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 SGYSQSYGGYENQKQSSYSQQPYNNQGQQQNMESSGSQGGRAPSYDQPDYGQQDSYDQQS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 GYDQHQGSYDEQSNYDQQHDSYSQNQQSYHSQRENYSHHTQDDRRDVSRYGEDNRGYGGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 GYDQHQGSYDEQSNYDQQHDSYSQNQQSYHSQRENYSHHTQDDRRDVSRYGEDNRGYGGS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 QGGGRGRGGYDKDGRGPMTGSSGGDRGGFKNFGGHRDYGPRTDADSESDNSDNNTIFVQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 QGGGRGRGGYDKDGRGPMTGSSGGDRGGFKNFGGHRDYGPRTDADSESDNSDNNTIFVQG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 LGEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LGEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 DWFDGKEFHGNIIKVSFATRRPEFMRGGGSGGGRRGRGGYRGRGGFQGRGGDPKSGDWVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 DWFDGKEFHGNIIKVSFATRRPEFMRGGGSGGGRRGRGGYRGRGGFQGRGGDPKSGDWVC 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 PNPSCGNMNFARRNSCNQCNEPRPEDSRPSGGDFRGRGYGGERGYRGRGGRGGDRGGYGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PNPSCGNMNFARRNSCNQCNEPRPEDSRPSGGDFRGRGYGGERGYRGRGGRGGDRGGYGG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 DRSGGGYGGDRSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGYGGDRGGGYGGDRGGGYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 DRSGGGYGGDRSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGYGGDRGGGYGGDRGGGYG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 GDRGGYGGDRGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 GDRGGYGGDRGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSG 490 500 510 520 530 540 550 560 570 580 590 pF1KE2 YGGDRSGGYGGDRSGGGYGGDRGGGYGGDRGGYGGKMGGRNDYRNDQRNRPY :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 YGGDRSGGYGGDRSGGGYGGDRGGGYGGDRGGYGGKMGGRNDYRNDQRNRPY 550 560 570 580 590 >>CCDS59279.1 TAF15 gene_id:8148|Hs108|chr17 (589 aa) initn: 3918 init1: 3918 opt: 4285 Z-score: 2283.4 bits: 432.5 E(32554): 7.3e-121 Smith-Waterman score: 4285; 99.5% identity (99.5% similar) in 592 aa overlap (1-592:1-589) 10 20 30 40 50 60 pF1KE2 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQASQSYSGYGQTTDSSYGQNYSGYSSYGQSQ ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQASQSYSGYGQTTDSSYGQNYSGYSSYGQS- 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 SGYSQSYGGYENQKQSSYSQQPYNNQGQQQNMESSGSQGGRAPSYDQPDYGQQDSYDQQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 --YSQSYGGYENQKQSSYSQQPYNNQGQQQNMESSGSQGGRAPSYDQPDYGQQDSYDQQS 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 GYDQHQGSYDEQSNYDQQHDSYSQNQQSYHSQRENYSHHTQDDRRDVSRYGEDNRGYGGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 GYDQHQGSYDEQSNYDQQHDSYSQNQQSYHSQRENYSHHTQDDRRDVSRYGEDNRGYGGS 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE2 QGGGRGRGGYDKDGRGPMTGSSGGDRGGFKNFGGHRDYGPRTDADSESDNSDNNTIFVQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 QGGGRGRGGYDKDGRGPMTGSSGGDRGGFKNFGGHRDYGPRTDADSESDNSDNNTIFVQG 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE2 LGEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 LGEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAI 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE2 DWFDGKEFHGNIIKVSFATRRPEFMRGGGSGGGRRGRGGYRGRGGFQGRGGDPKSGDWVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 DWFDGKEFHGNIIKVSFATRRPEFMRGGGSGGGRRGRGGYRGRGGFQGRGGDPKSGDWVC 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE2 PNPSCGNMNFARRNSCNQCNEPRPEDSRPSGGDFRGRGYGGERGYRGRGGRGGDRGGYGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 PNPSCGNMNFARRNSCNQCNEPRPEDSRPSGGDFRGRGYGGERGYRGRGGRGGDRGGYGG 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE2 DRSGGGYGGDRSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGYGGDRGGGYGGDRGGGYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 DRSGGGYGGDRSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGYGGDRGGGYGGDRGGGYG 420 430 440 450 460 470 490 500 510 520 530 540 pF1KE2 GDRGGYGGDRGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 GDRGGYGGDRGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSG 480 490 500 510 520 530 550 560 570 580 590 pF1KE2 YGGDRSGGYGGDRSGGGYGGDRGGGYGGDRGGYGGKMGGRNDYRNDQRNRPY :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 YGGDRSGGYGGDRSGGGYGGDRGGGYGGDRGGYGGKMGGRNDYRNDQRNRPY 540 550 560 570 580 >>CCDS58454.1 FUS gene_id:2521|Hs108|chr16 (525 aa) initn: 675 init1: 675 opt: 1225 Z-score: 671.7 bits: 134.1 E(32554): 4.3e-31 Smith-Waterman score: 1421; 51.8% identity (67.0% similar) in 515 aa overlap (15-459:20-520) 10 20 30 40 50 pF1KE2 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQASQSYSGYGQTTDSS-YGQNYSGYS : . :.. .:: ::: ::::::.:.::.: ::: :.:: CCDS58 MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQ--QSYSGYSQSTDTSGYGQ--SSYS 10 20 30 40 50 60 70 80 90 100 pF1KE2 SYGQSQSGYS-----QSYG---GYENQK--QSSYSQQP-YNNQGQQQNMES-SGSQGG-- ::::::..:. :.:: :: ... ::::.:: : . ::: : ::: :. CCDS58 SYGQSQNSYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSS 60 70 80 90 100 110 110 120 130 140 pF1KE2 RAPSYDQPD---YGQQDSYD-QQSGYDQHQGSYDEQSNYDQQHD---------------S .. :: ::. :.:: :: ::..: :.: ::. ..: ::.. . CCDS58 QSSSYGQPQSGSYSQQPSYGGQQQSYGQQQ-SYNPPQGYGQQNQYNSSSGGGGGGGGGGN 120 130 140 150 160 170 150 160 170 180 pF1KE2 YSQNQQSYHS---QRENYSHHTQDDRRDVSRYGEDNRG---YGGSQGGG--------RGR :.:.:.:. : . .:... :. . ::...:: ::: ::: :. CCDS58 YGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSS 180 190 200 210 220 230 190 200 210 220 230 240 pF1KE2 GGYDKDGRGPMTGSSGG----DRGGFKNFGGHRDYGPRTDADSESDNSDNNTIFVQGLGE :::. ::: :. :: :::::..::: :: : : : ::.::::::::::::::: CCDS58 GGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD--SEQDNSDNNTIFVQGLGE 240 250 260 270 280 290 250 260 270 280 290 300 pF1KE2 GVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAIDWF .:. ..:...::::::::::::::.::::::::..::: ::::::::::::::::::::: CCDS58 NVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWF 300 310 320 330 340 350 310 320 330 340 350 pF1KE2 DGKEFHGNIIKVSFATRRPEFMRGGGSGGGRRGRGGYRGRGGFQG-------RGGDP--- ::::: :: ::::::::: .: ::::.: : ::::: ::::. : ::: : CCDS58 DGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGG 360 370 380 390 400 410 360 370 380 390 400 pF1KE2 -------KSGDWVCPNPSCGNMNFARRNSCNQCNEPRPEDSRPSGGDFRGRGYGGERGYR ..::: ::::.: ::::. :: ::::. :.:. :.:: : .::. : CCDS58 GGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDG--PGGGP-GGSHMGGNYGDD 420 430 440 450 460 470 410 420 430 440 450 460 pF1KE2 GRGGRGG-DRGGYGGDRSGGGYGGDRSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGYGG :::::: ::::: : :: :: :.. :: :::.: : : : : . :: CCDS58 RRGGRGGYDRGGYRG--RGGDRGGFRGGRGG--GDRGGFGPGKMDSRGEHRQDRRERPY 480 490 500 510 520 470 480 490 500 510 520 pF1KE2 DRGGGYGGDRGGGYGGDRGGYGGDRGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYGGD >>CCDS10707.1 FUS gene_id:2521|Hs108|chr16 (526 aa) initn: 693 init1: 693 opt: 1214 Z-score: 665.9 bits: 133.0 E(32554): 9e-31 Smith-Waterman score: 1418; 51.9% identity (66.9% similar) in 516 aa overlap (15-459:20-521) 10 20 30 40 50 pF1KE2 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQASQSYSGYGQTTDSS-YGQNYSGYS : . :.. .:: ::: ::::::.:.::.: ::: :.:: CCDS10 MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQ--QSYSGYSQSTDTSGYGQ--SSYS 10 20 30 40 50 60 70 80 90 100 pF1KE2 SYGQSQ-SGYS-----QSYG---GYENQK--QSSYSQQP-YNNQGQQQNMES-SGSQGG- :::::: .::. :.:: :: ... ::::.:: : . ::: : ::: :. CCDS10 SYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSS 60 70 80 90 100 110 110 120 130 140 pF1KE2 -RAPSYDQPD---YGQQDSYD-QQSGYDQHQGSYDEQSNYDQQHD--------------- .. :: ::. :.:: :: ::..: :.: ::. ..: ::.. CCDS10 SQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQ-SYNPPQGYGQQNQYNSSSGGGGGGGGGG 120 130 140 150 160 170 150 160 170 180 pF1KE2 SYSQNQQSYHS---QRENYSHHTQDDRRDVSRYGEDNRG---YGGSQGGG--------RG .:.:.:.:. : . .:... :. . ::...:: ::: ::: :. CCDS10 NYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRS 180 190 200 210 220 230 190 200 210 220 230 240 pF1KE2 RGGYDKDGRGPMTGSSGG----DRGGFKNFGGHRDYGPRTDADSESDNSDNNTIFVQGLG :::. ::: :. :: :::::..::: :: : : : ::.:::::::::::::: CCDS10 SGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD--SEQDNSDNNTIFVQGLG 240 250 260 270 280 290 250 260 270 280 290 300 pF1KE2 EGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAIDW :.:. ..:...::::::::::::::.::::::::..::: :::::::::::::::::::: CCDS10 ENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDW 300 310 320 330 340 350 310 320 330 340 350 pF1KE2 FDGKEFHGNIIKVSFATRRPEFMRGGGSGGGRRGRGGYRGRGGFQG-------RGGDP-- :::::: :: ::::::::: .: ::::.: : ::::: ::::. : ::: : CCDS10 FDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSG 360 370 380 390 400 410 360 370 380 390 400 pF1KE2 --------KSGDWVCPNPSCGNMNFARRNSCNQCNEPRPEDSRPSGGDFRGRGYGGERGY ..::: ::::.: ::::. :: ::::. :.:. :.:: : .::. : CCDS10 GGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDG--PGGGP-GGSHMGGNYGD 420 430 440 450 460 470 410 420 430 440 450 460 pF1KE2 RGRGGRGG-DRGGYGGDRSGGGYGGDRSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGYG :::::: ::::: : :: :: :.. :: :::.: : : : : . :: CCDS10 DRRGGRGGYDRGGYRG--RGGDRGGFRGGRGG--GDRGGFGPGKMDSRGEHRQDRRERPY 480 490 500 510 520 470 480 490 500 510 520 pF1KE2 GDRGGGYGGDRGGGYGGDRGGYGGDRGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYGG >>CCDS54514.1 EWSR1 gene_id:2130|Hs108|chr22 (600 aa) initn: 927 init1: 474 opt: 1000 Z-score: 552.5 bits: 112.3 E(32554): 1.9e-24 Smith-Waterman score: 1262; 42.8% identity (60.8% similar) in 572 aa overlap (16-491:40-589) 10 20 30 40 pF1KE2 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQASQSYSGYGQTT-DS ::.:::.: . .: :: :. . ::::. . CCDS54 SQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQA-QTTATYGQTAYAT 10 20 30 40 50 60 50 60 70 80 pF1KE2 SYGQNYSGYSS------YGQSQSGYSQSYGGYENQK------------QSSYSQQP-YNN :::: .::.. :.: .::. :.:.. ::.:. :: : CCDS54 SYGQPPTGYTTPTAPQAYSQPVQGYGT--GAYDTTTATVTTTQASYAAQSAYGTQPAYPA 70 80 90 100 110 120 90 100 110 120 130 140 pF1KE2 QGQQQNMESSGSQGGRAP-SYDQPDYGQQDSYDQQSGYDQHQGSYDEQSNYDQQHD---- ::: . : .. : :::: .:.::..: : :.: : :.:: .::.: :: CCDS54 YGQQPAATAPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQ-QSSYGQQSSYGQQPPTSYP 130 140 150 160 170 180 150 160 170 180 pF1KE2 ----SYSQNQQSYHSQRENYSHHT---QDDRRDVSRYGEDNRGYGG-----SQGG----G :::: ..: .: .:.... :: ... ::... :..: :..: : CCDS54 PQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRG 190 200 210 220 230 240 190 200 210 220 230 pF1KE2 RGRGGYDKDG--RGPMTGSSGG-----DRGGFKNFGGHRDYGPRTDADSESD---NSDNN :::::.:. : :: :. :: .::::.. :: : :: : : .:::. CCDS54 RGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNS 250 260 270 280 290 300 240 250 260 270 280 290 pF1KE2 TIFVQGLGEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPP .:.::::...:. :....:::: :..: ::.::.:::..: ::.::::::.::::..::: CCDS54 AIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPP 310 320 330 340 350 360 300 310 320 330 pF1KE2 SAKAAIDWFDGKEFHGNIIKVSFATRRPEF--MRGG--------------------GSGG .::::..:::::.:.:. .:::.: ..: . :::: :. : CCDS54 TAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPG 370 380 390 400 410 420 340 350 360 370 pF1KE2 GRRGRGGYRG--RGGFQGRG-----GDP--------KSGDWVCPNPSCGNMNFARRNSCN : :: : :: :::: :: :.: ..::: ::::.:::.::: :. :: CCDS54 GPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECN 430 440 450 460 470 480 380 390 400 410 420 430 pF1KE2 QCNEPRPEDSRPS-----GGDFRGRGYGGERGYRGRGGRGG--DRGGYGGDRSGGGYGGD ::. :.:: : ::: :: :: :.: ::::: :::: :: :: ::: CCDS54 QCKAPKPEGFLPPPFPPPGGD---RGRGGPGGMR--GGRGGLMDRGGPGGMFRGG-RGGD 490 500 510 520 530 440 450 460 470 480 pF1KE2 RSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGYGGDRGGGYGGDRGGGYGGDRGGYGG-D : ::. : : : :: ::.:: : :: :: : . .. :: : ::: : : CCDS54 R---GGFRG-----GRGMDR--GGFGGGRRGGPGGPPGPLM--EQMGGRRGGRGGPGKMD 540 550 560 570 580 490 500 510 520 530 540 pF1KE2 RGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSGYGGDRSGGY .: CCDS54 KGEHRQERRDRPY 590 600 >>CCDS54513.1 EWSR1 gene_id:2130|Hs108|chr22 (655 aa) initn: 913 init1: 460 opt: 989 Z-score: 546.3 bits: 111.2 E(32554): 4.1e-24 Smith-Waterman score: 1213; 41.7% identity (61.1% similar) in 561 aa overlap (2-491:107-644) 10 20 pF1KE2 MSDSGSYG-QSG-GEQQSYSTYGNPGSQGYG . ..::. ::. : : .: .: :.: . CCDS54 YTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAY---GQQPAA 80 90 100 110 120 130 30 40 50 60 70 80 pF1KE2 QASQSYSGYGQTTDSSYGQNYSGYSSYGQSQSGYSQSYGGYENQKQSSYSQQPYNNQGQQ : . .. :..: :. .: .:.: . ::.:: .: : .:: .:: . . CCDS54 TAPTRPQDGNKPTETSQPQSSTG--GYNQPSLGYGQSNYSYP-QVPGSYPMQPVTAPPSY 140 150 160 170 180 190 90 100 110 120 130 140 pF1KE2 QNMESSGSQGGRAPSYDQPDYGQQDSYDQQSGYDQHQGSYDEQSNYDQQHD--------S :..: :::: .:.::..: : :.: : :.:: .::.: :: : CCDS54 PPTSYSSTQ---PTSYDQSSYSQQNTYGQPSSYGQ-QSSYGQQSSYGQQPPTSYPPQTGS 200 210 220 230 240 150 160 170 180 pF1KE2 YSQNQQSYHSQRENYSHHT---QDDRRDVSRYGEDNRGYGG-----SQGG----GRGRGG ::: ..: .: .:.... :: ... ::... :..: :..: :::::: CCDS54 YSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGG 250 260 270 280 290 300 190 200 210 220 230 240 pF1KE2 YDKDG--RGPMTGSSGG----DRGGFKNFGGHRDYGPRTDADSESD---NSDNNTIFVQG .:. : :: :. :: .::::.. :: : :: : : .:::..:.::: CCDS54 FDRGGMSRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQG 310 320 330 340 350 360 250 260 270 280 290 300 pF1KE2 LGEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAI :...:. :....:::: :..: ::.::.:::..: ::.::::::.::::..:::.::::. CCDS54 LNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAV 370 380 390 400 410 420 310 320 330 pF1KE2 DWFDGKEFHGNIIKVSFATRRPEF--MRGG--------------------GSGGGRRGRG .:::::.:.:. .:::.: ..: . :::: :. :: :: CCDS54 EWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRM 430 440 450 460 470 480 340 350 360 370 380 pF1KE2 GYRG--RGGFQGRG-----GDP--------KSGDWVCPNPSCGNMNFARRNSCNQCNEPR : :: :::: :: :.: ..::: ::::.:::.::: :. ::::. :. CCDS54 GGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPK 490 500 510 520 530 540 390 400 410 420 430 440 pF1KE2 PEDSRPSGGDFRGRGYGGERGYRGRGGRGGDRGGYGGDRSGGGYGGDRSSGGGYSGDRSG :: : : : : ::::: :: ::: :: . :: :: :: .:::.: CCDS54 PEGFLPP--PFPPPG-----GDRGRGGPGGMRGGRGGLMDRGGPGGMFR--GGRGGDRGG 550 560 570 580 590 450 460 470 480 490 500 pF1KE2 --GGYGGDRSGGGYGGDRGGGYGGDRGGGYGGDRGGGYGGDRGGYGG-DRGGGYGGDRGG :: : :: ::.:: : :: :: : . .. :: : ::: : :.: CCDS54 FRGGRGMDR--GGFGGGRRGGPGGPPGPLM--EQMGGRRGGRGGPGKMDKGEHRQERRDR 600 610 620 630 640 650 510 520 530 540 550 560 pF1KE2 YGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSGYGGDRSGGYGGDRSGGGYGG CCDS54 PY >>CCDS13852.2 EWSR1 gene_id:2130|Hs108|chr22 (661 aa) initn: 913 init1: 460 opt: 989 Z-score: 546.3 bits: 111.2 E(32554): 4.2e-24 Smith-Waterman score: 1213; 41.7% identity (61.1% similar) in 561 aa overlap (2-491:113-650) 10 20 pF1KE2 MSDSGSYG-QSG-GEQQSYSTYGNPGSQGYG . ..::. ::. : : .: .: :.: . CCDS13 YTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAY---GQQPAA 90 100 110 120 130 30 40 50 60 70 80 pF1KE2 QASQSYSGYGQTTDSSYGQNYSGYSSYGQSQSGYSQSYGGYENQKQSSYSQQPYNNQGQQ : . .. :..: :. .: .:.: . ::.:: .: : .:: .:: . . CCDS13 TAPTRPQDGNKPTETSQPQSSTG--GYNQPSLGYGQSNYSYP-QVPGSYPMQPVTAPPSY 140 150 160 170 180 190 90 100 110 120 130 140 pF1KE2 QNMESSGSQGGRAPSYDQPDYGQQDSYDQQSGYDQHQGSYDEQSNYDQQHD--------S :..: :::: .:.::..: : :.: : :.:: .::.: :: : CCDS13 PPTSYSSTQ---PTSYDQSSYSQQNTYGQPSSYGQ-QSSYGQQSSYGQQPPTSYPPQTGS 200 210 220 230 240 250 150 160 170 180 pF1KE2 YSQNQQSYHSQRENYSHHT---QDDRRDVSRYGEDNRGYGG-----SQGG----GRGRGG ::: ..: .: .:.... :: ... ::... :..: :..: :::::: CCDS13 YSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGG 260 270 280 290 300 310 190 200 210 220 230 240 pF1KE2 YDKDG--RGPMTGSSGG----DRGGFKNFGGHRDYGPRTDADSESD---NSDNNTIFVQG .:. : :: :. :: .::::.. :: : :: : : .:::..:.::: CCDS13 FDRGGMSRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQG 320 330 340 350 360 370 250 260 270 280 290 300 pF1KE2 LGEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAI :...:. :....:::: :..: ::.::.:::..: ::.::::::.::::..:::.::::. CCDS13 LNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAV 380 390 400 410 420 430 310 320 330 pF1KE2 DWFDGKEFHGNIIKVSFATRRPEF--MRGG--------------------GSGGGRRGRG .:::::.:.:. .:::.: ..: . :::: :. :: :: CCDS13 EWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRM 440 450 460 470 480 490 340 350 360 370 380 pF1KE2 GYRG--RGGFQGRG-----GDP--------KSGDWVCPNPSCGNMNFARRNSCNQCNEPR : :: :::: :: :.: ..::: ::::.:::.::: :. ::::. :. CCDS13 GGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPK 500 510 520 530 540 550 390 400 410 420 430 440 pF1KE2 PEDSRPSGGDFRGRGYGGERGYRGRGGRGGDRGGYGGDRSGGGYGGDRSSGGGYSGDRSG :: : : : : ::::: :: ::: :: . :: :: :: .:::.: CCDS13 PEGFLPP--PFPPPG-----GDRGRGGPGGMRGGRGGLMDRGGPGGMFR--GGRGGDRGG 560 570 580 590 600 450 460 470 480 490 500 pF1KE2 --GGYGGDRSGGGYGGDRGGGYGGDRGGGYGGDRGGGYGGDRGGYGG-DRGGGYGGDRGG :: : :: ::.:: : :: :: : . .. :: : ::: : :.: CCDS13 FRGGRGMDR--GGFGGGRRGGPGGPPGPLM--EQMGGRRGGRGGPGKMDKGEHRQERRDR 610 620 630 640 650 510 520 530 540 550 560 pF1KE2 YGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSGYGGDRSGGYGGDRSGGGYGG CCDS13 PY 660 >>CCDS13851.1 EWSR1 gene_id:2130|Hs108|chr22 (656 aa) initn: 927 init1: 474 opt: 987 Z-score: 545.3 bits: 111.0 E(32554): 4.7e-24 Smith-Waterman score: 1211; 41.6% identity (61.0% similar) in 562 aa overlap (2-491:107-645) 10 20 pF1KE2 MSDSGSYG-QSG-GEQQSYSTYGNPGSQGYG . ..::. ::. : : .: .: :.: . CCDS13 YTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAY---GQQPAA 80 90 100 110 120 130 30 40 50 60 70 80 pF1KE2 QASQSYSGYGQTTDSSYGQNYSGYSSYGQSQSGYSQSYGGYENQKQSSYSQQPYNNQGQQ : . .. :..: :. .: .:.: . ::.:: .: : .:: .:: . . CCDS13 TAPTRPQDGNKPTETSQPQSSTG--GYNQPSLGYGQSNYSYP-QVPGSYPMQPVTAPPSY 140 150 160 170 180 190 90 100 110 120 130 140 pF1KE2 QNMESSGSQGGRAPSYDQPDYGQQDSYDQQSGYDQHQGSYDEQSNYDQQHD--------S :..: :::: .:.::..: : :.: : :.:: .::.: :: : CCDS13 PPTSYSSTQ---PTSYDQSSYSQQNTYGQPSSYGQ-QSSYGQQSSYGQQPPTSYPPQTGS 200 210 220 230 240 150 160 170 180 pF1KE2 YSQNQQSYHSQRENYSHHT---QDDRRDVSRYGEDNRGYGG-----SQGG----GRGRGG ::: ..: .: .:.... :: ... ::... :..: :..: :::::: CCDS13 YSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGG 250 260 270 280 290 300 190 200 210 220 230 pF1KE2 YDKDG--RGPMTGSSGG-----DRGGFKNFGGHRDYGPRTDADSESD---NSDNNTIFVQ .:. : :: :. :: .::::.. :: : :: : : .:::..:.:: CCDS13 FDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQ 310 320 330 340 350 360 240 250 260 270 280 290 pF1KE2 GLGEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAA ::...:. :....:::: :..: ::.::.:::..: ::.::::::.::::..:::.:::: CCDS13 GLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAA 370 380 390 400 410 420 300 310 320 330 pF1KE2 IDWFDGKEFHGNIIKVSFATRRPEF--MRGG--------------------GSGGGRRGR ..:::::.:.:. .:::.: ..: . :::: :. :: :: CCDS13 VEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGR 430 440 450 460 470 480 340 350 360 370 380 pF1KE2 GGYRG--RGGFQGRG-----GDP--------KSGDWVCPNPSCGNMNFARRNSCNQCNEP : :: :::: :: :.: ..::: ::::.:::.::: :. ::::. : CCDS13 MGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAP 490 500 510 520 530 540 390 400 410 420 430 440 pF1KE2 RPEDSRPSGGDFRGRGYGGERGYRGRGGRGGDRGGYGGDRSGGGYGGDRSSGGGYSGDRS .:: : : : : ::::: :: ::: :: . :: :: :: .:::. CCDS13 KPEGFLPP--PFPPPG-----GDRGRGGPGGMRGGRGGLMDRGGPGGMFR--GGRGGDRG 550 560 570 580 590 450 460 470 480 490 pF1KE2 G--GGYGGDRSGGGYGGDRGGGYGGDRGGGYGGDRGGGYGGDRGGYGG-DRGGGYGGDRG : :: : :: ::.:: : :: :: : . .. :: : ::: : :.: CCDS13 GFRGGRGMDR--GGFGGGRRGGPGGPPGPLM--EQMGGRRGGRGGPGKMDKGEHRQERRD 600 610 620 630 640 650 500 510 520 530 540 550 pF1KE2 GYGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSGYGGDRSGGYGGDRSGGGYG CCDS13 RPY 592 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 12:15:03 2016 done: Sun Nov 6 12:15:04 2016 Total Scan time: 2.940 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]