FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5874, 494 aa
1>>>pF1KB5874 494 - 494 aa - 494 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.8510+/-0.0014; mu= 2.4436+/- 0.085
mean_var=456.2730+/-92.315, 0's: 0 Z-trim(110.5): 167 B-trim: 206 in 1/54
Lambda= 0.060043
statistics sampled from 11533 (11685) to 11533 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.651), E-opt: 0.2 (0.359), width: 16
Scan time: 3.270
The best scores are: opt bits E(32554)
CCDS333.1 SRSF4 gene_id:6429|Hs108|chr1 ( 494) 3163 288.7 9.9e-78
CCDS13318.1 SRSF6 gene_id:6431|Hs108|chr20 ( 344) 1385 134.5 1.8e-31
CCDS32109.1 SRSF5 gene_id:6430|Hs108|chr14 ( 272) 1020 102.7 5.3e-22
CCDS11600.1 SRSF1 gene_id:6426|Hs108|chr17 ( 248) 599 66.2 4.8e-11
CCDS46095.1 SRRM5 gene_id:100170229|Hs108|chr19 ( 715) 606 67.4 5.8e-11
>>CCDS333.1 SRSF4 gene_id:6429|Hs108|chr1 (494 aa)
initn: 3163 init1: 3163 opt: 3163 Z-score: 1509.0 bits: 288.7 E(32554): 9.9e-78
Smith-Waterman score: 3163; 99.8% identity (100.0% similar) in 494 aa overlap (1-494:1-494)
10 20 30 40 50 60
pF1KB5 MPRVYIGRLSYQARERDVERFFKGYGKILEVDLKNGYGFVEFDDLRDADDAVYELNGKDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MPRVYIGRLSYQARERDVERFFKGYGKILEVDLKNGYGFVEFDDLRDADDAVYELNGKDL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 CGERVIVEHARGPRRDGSYGSGRSGYGYRRSGRDKYGPPTRTEYRLIVENLSSRCSWQDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 CGERVIVEHARGPRRDGSYGSGRSGYGYRRSGRDKYGPPTRTEYRLIVENLSSRCSWQDL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 KDYMRQAGEVTYADAHKGRKNEGVIEFVSYSDMKRALEKLDGTEVNGRKIRLVEDKPGSR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KDYMRQAGEVTYADAHKGRKNEGVIEFVSYSDMKRALEKLDGTEVNGRKIRLVEDKPGSR
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 RRRSYSRSRSHSRSRSRSRHSRKSRSRSGSSKSSHSKSRSRSRSGSRSRSKSRSRSQSRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RRRSYSRSRSHSRSRSRSRHSRKSRSRSGSSKSSHSKSRSRSRSGSRSRSKSRSRSQSRS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 RSKKEKSRSPSKDKSRSRSHSAGKSRSKSKDQAEEKIQNNDNVGKPKSRSPSRHKSKSKS
::::::::::::.:::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RSKKEKSRSPSKEKSRSRSHSAGKSRSKSKDQAEEKIQNNDNVGKPKSRSPSRHKSKSKS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 RSRSQERRVEEEKRGSVSRGRSQEKSLRQSRSRSRSKGGSRSRSRSRSKSKDKRKGRKRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RSRSQERRVEEEKRGSVSRGRSQEKSLRQSRSRSRSKGGSRSRSRSRSKSKDKRKGRKRS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 REESRSRSRSRSKSERSRKRGSKRDSKAGSSKKKKKEDTDRSQSRSPSRSVSKEREHAKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 REESRSRSRSRSKSERSRKRGSKRDSKAGSSKKKKKEDTDRSQSRSPSRSVSKEREHAKS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB5 ESSQREGRGESENAGTNQETRSRSRSNSKSKPNLPSESRSRSKSASKTRSRSKSRSRSAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ESSQREGRGESENAGTNQETRSRSRSNSKSKPNLPSESRSRSKSASKTRSRSKSRSRSAS
430 440 450 460 470 480
490
pF1KB5 RSPSRSRSRSHSRS
::::::::::::::
CCDS33 RSPSRSRSRSHSRS
490
>>CCDS13318.1 SRSF6 gene_id:6431|Hs108|chr20 (344 aa)
initn: 841 init1: 841 opt: 1385 Z-score: 678.3 bits: 134.5 E(32554): 1.8e-31
Smith-Waterman score: 1427; 66.5% identity (80.9% similar) in 361 aa overlap (1-352:1-344)
10 20 30 40 50 60
pF1KB5 MPRVYIGRLSYQARERDVERFFKGYGKILEVDLKNGYGFVEFDDLRDADDAVYELNGKDL
:::::::::::..::.:..:::.:::..::::::::::::::.: :::::::::::::.:
CCDS13 MPRVYIGRLSYNVREKDIQRFFSGYGRLLEVDLKNGYGFVEFEDSRDADDAVYELNGKEL
10 20 30 40 50 60
70 80 90 100 110
pF1KB5 CGERVIVEHARGPRRD--G-SYGSGRSGYGY---RRSGRDKYGPPTRTEYRLIVENLSSR
:::::::::::::::: : :::: .: :: : :::::::::.::::::::::::::
CCDS13 CGERVIVEHARGPRRDRDGYSYGSRSGGGGYSSRRTSGRDKYGPPVRTEYRLIVENLSSR
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB5 CSWQDLKDYMRQAGEVTYADAHKGRKNEGVIEFVSYSDMKRALEKLDGTEVNGRKIRLVE
::::::::.:::::::::::::: : ::::::: :::::::::.::::::.:::.:::.:
CCDS13 CSWQDLKDFMRQAGEVTYADAHKERTNEGVIEFRSYSDMKRALDKLDGTEINGRNIRLIE
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB5 DKPGSRRRRSYSRSRSHSRSRSRSRHSRKSRSRSGSSKSSHSKSRSRSRSGSRSRSKSRS
::: . .::::: :::.:::: ::: :::: .: .::::: : :::::.:::
CCDS13 DKPRTSHRRSYSGSRSRSRSRRRSR----SRSRRSS------RSRSRSISKSRSRSRSRS
190 200 210 220 230
240 250 260 270 280 290
pF1KB5 RSQSRSRSKKEKSRSPSKDKSRSRSHSAGKSRSKSKDQAEEKIQNNDNVGKPKSRSPSRH
...:::::: .:::: ::.: .: : ..:::.:::. :. . .. .::::...
CCDS13 KGRSRSRSKGRKSRSKSKSKPKSDRGSHSHSRSRSKDEYEK------SRSRSRSRSPKEN
240 250 260 270 280
300 310 320 330 340 350
pF1KB5 KS---KSKSRSRSQERRVEEEKRGSVSRGRSQEKSLRQSRSRSRSKGGSRSRSRSRSKSK
. ::::::::: : :..:: ... :::::.. :.:::::::.:.
CCDS13 GKGDIKSKSRSRSQSRSNSPLPVPP-SKARSVSPPPKRATSRSRSRSRSKSRSRSRSSSR
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB5 DKRKGRKRSREESRSRSRSRSKSERSRKRGSKRDSKAGSSKKKKKEDTDRSQSRSPSRSV
:
CCDS13 D
>>CCDS32109.1 SRSF5 gene_id:6430|Hs108|chr14 (272 aa)
initn: 1381 init1: 525 opt: 1020 Z-score: 508.5 bits: 102.7 E(32554): 5.3e-22
Smith-Waterman score: 1020; 61.0% identity (81.2% similar) in 277 aa overlap (3-271:5-269)
10 20 30 40 50
pF1KB5 MPRVYIGRLSYQARERDVERFFKGYGKILEVDLKNGYGFVEFDDLRDADDAVYELNGK
::.::::. :::.::::::::::.: ..::: :.:::::.: ::::::::::.::
CCDS32 MSGCRVFIGRLNPAAREKDVERFFKGYGRIRDIDLKRGFGFVEFEDPRDADDAVYELDGK
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB5 DLCGERVIVEHARGPRRDGSYGSGRSG--YGYRRSGRDKYG-PPTRTEYRLIVENLSSRC
.::.::: .::::. : :. : :: . .. :: :. . ::.::: ::::::::::
CCDS32 ELCSERVTIEHARA-RSRGGRGRGRYSDRFSSRRPRNDRRNAPPVRTENRLIVENLSSRV
70 80 90 100 110
120 130 140 150 160 170
pF1KB5 SWQDLKDYMRQAGEVTYADAHKGRKNEGVIEFVSYSDMKRALEKLDGTEVNGRKIRLVED
:::::::.::::::::.::::. . ::::.::.::.:.: :.:::.: :.:::::.:.:
CCDS32 SWQDLKDFMRQAGEVTFADAHRPKLNEGVVEFASYGDLKNAIEKLSGKEINGRKIKLIE-
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 KPGSRRRRSYSRSRSHSRSRSRSRHSRKSRSRSGSSKSSHSKSRSRSRSGSRSRSKSRSR
::.: .:::::.::::.:: .::::: :..:.:.::::::: :::.:.: ::
CCDS32 --GSKR---HSRSRSRSRSRTRSSSRSRSRSRS-RSRKSYSRSRSRSRSRSRSKSRSVSR
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB5 S----QSRSRSKKEKSRSP-SKDKSRSRSHSAGKSRSKSKDQAEEKIQNNDNVGKPKSRS
: .:..:... .:.:: : :..:::: .:::.: :
CCDS32 SPVPEKSQKRGSSSRSKSPASVDRQRSRS----RSRSRSVDSGN
240 250 260 270
300 310 320 330 340 350
pF1KB5 PSRHKSKSKSRSRSQERRVEEEKRGSVSRGRSQEKSLRQSRSRSRSKGGSRSRSRSRSKS
>>CCDS11600.1 SRSF1 gene_id:6426|Hs108|chr17 (248 aa)
initn: 711 init1: 184 opt: 599 Z-score: 311.8 bits: 66.2 E(32554): 4.8e-11
Smith-Waterman score: 599; 46.5% identity (65.1% similar) in 241 aa overlap (3-232:17-248)
10 20 30 40
pF1KB5 MPRVYIGRLSYQARERDVERFFKGYGKILEVDLKNGYG-----FVE
:.:.: : . : .:.: : :: : ..:::: : :::
CCDS11 MSGGGVIRGPAGNNDCRIYVGNLPPDIRTKDIEDVFYKYGAIRDIDLKNRRGGPPFAFVE
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB5 FDDLRDADDAVYELNGKDLCGERVIVEHARGPRRDGSYGSGRSGYGYRRSGRDKYGPPTR
:.: :::.:::: .: : : :. :: :. : : :.: .: : . : .::::.:
CCDS11 FEDPRDAEDAVYGRDGYDYDGYRLRVEFPRSGRGTGRGGGGGGGGG---APRGRYGPPSR
70 80 90 100 110
110 120 130 140 150 160
pF1KB5 -TEYRLIVENLSSRCSWQDLKDYMRQAGEVTYADAHKGRKNEGVIEFVSYSDMKRALEKL
.: :..: .: :::::::.::.::.: :::.. : . ::.::: :: :..::
CCDS11 RSENRVVVSGLPPSGSWQDLKDHMREAGDVCYADVY--RDGTGVVEFVRKEDMTYAVRKL
120 130 140 150 160 170
170 180 190 200 210
pF1KB5 DGTEVNGRK-----IRLVEDKPGSRRRRSYSRSRSHSRSRSRSRHSRKSRSRSGSSKSSH
:.:. ... ::. : : : ::.::::.:::::::: .::::: : . :.
CCDS11 DNTKFRSHEGETAYIRVKVDGP---RSPSYGRSRSRSRSRSRSRSRSNSRSRSYSPRRSR
180 190 200 210 220 230
220 230 240 250 260 270
pF1KB5 SKSRSRSRSGSRSRSKSRSRSQSRSRSKKEKSRSPSKDKSRSRSHSAGKSRSKSKDQAEE
.. : : :::::..
CCDS11 GSPRYSPRH-SRSRSRT
240
>>CCDS46095.1 SRRM5 gene_id:100170229|Hs108|chr19 (715 aa)
initn: 502 init1: 502 opt: 606 Z-score: 310.2 bits: 67.4 E(32554): 5.8e-11
Smith-Waterman score: 618; 37.1% identity (67.0% similar) in 345 aa overlap (163-494:260-586)
140 150 160 170 180 190
pF1KB5 ADAHKGRKNEGVIEFVSYSDMKRALEKLDGTEVNGRKIRLVEDKPGSRRRRSYSRSRSHS
::...: .. .. : .:.:.:::
CCDS46 KSDNPSPSSSRKVKSYGQMIIPSREKSYSPTEMSSR-VKSYNQASTRSRPQSHSQSRSPR
230 240 250 260 270 280
200 210 220 230 240
pF1KB5 RSRSRSRHSRKSRSRSGSSKSSHSKSRSRSRSG--------SRSRSKSRSRSQSRSRS-K
:::: :.. .:: :: : : .::..:::.:.: :.:::.:...::..::. .
CCDS46 RSRSGSQKRTHSRVRSHSWKRNHSRARSRTRKGILSQMGRHSQSRSHSKGKSQNQSRTPR
290 300 310 320 330 340
250 260 270 280 290 300
pF1KB5 KEKSRSPSKDKSRSRSHSAGKSRSKSKDQAEEKIQNNDNVGKPKSRSPSRHKSKSKSRSR
. .:.. :.. :. :::: ..: :: .:. . ... :. .: ::......:.:::
CCDS46 RGRSHNWSRNPSKERSHSHSRSSSKERDHRGSSSPRKES-GRSQSGSPNKQRDHSRSRSP
350 360 370 380 390 400
310 320 330 340 350 360
pF1KB5 SQERRVEEEKRGSVSRGRSQEKSLRQSRSRSRSKGGSRSRSRSRSKSKDKRKGRKRSREE
.. : . . .: ::. .: ..:. :::.. ..:.::::.: .: . ..:::
CCDS46 NKARDRSRSRSPYKARDRSRSRSPNKARDCSRSRSPYKARDRSRSRSPNKARDHSRSRSP
410 420 430 440 450 460
370 380 390 400 410
pF1KB5 SRSRSRSRSKSERSRKRGSKRDSKAGSSKKKKKEDTDRSQSRS----PSRSVSKEREHAK
...:.::::.: :..: :. :: .:.. . .:: :. ::: ::::.: .
CCDS46 NKARDRSRSRSP-SKERD---HSQLGSPSKERDHRRSRSPSKERQCRQSRSSSKERDHRR
470 480 490 500 510 520
420 430 440 450 460 470
pF1KB5 SESSQREGRGESENAGTNQETRSRSRSNSKSKPNLPSESRSRSKSASKTRSRSKSRSRSA
:.: ..: : . .. . :.: :.::.:.: ::: : . .: :: :: :.:
CCDS46 SRSPSKE-RQRRQSRSPNKE---RDRSQSRS----PSEEREHRQS----RSPSKERDRRR
530 540 550 560 570
480 490
pF1KB5 SRSPSRSRSRSHSRS
::::. : : .:::
CCDS46 WRSPSKERERRQSRSSSEERDHSRSRSPNKQSGYSRPRASSKEKAHSRSRTPSKEGNHSQ
580 590 600 610 620 630
494 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 15:25:45 2016 done: Sat Nov 5 15:25:46 2016
Total Scan time: 3.270 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]