FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3259, 617 aa
1>>>pF1KE3259 617 - 617 aa - 617 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.6890+/-0.000404; mu= 4.3873+/- 0.026
mean_var=231.7744+/-45.999, 0's: 0 Z-trim(118.8): 10 B-trim: 57 in 1/56
Lambda= 0.084244
statistics sampled from 32039 (32049) to 32039 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.693), E-opt: 0.2 (0.376), width: 16
Scan time: 10.290
The best scores are: opt bits E(85289)
NP_001307489 (OMIM: 606458) cysteine/serine-rich n ( 589) 952 129.2 4.1e-29
XP_016862537 (OMIM: 606458) PREDICTED: cysteine/se ( 589) 952 129.2 4.1e-29
NP_149016 (OMIM: 606458) cysteine/serine-rich nucl ( 589) 952 129.2 4.1e-29
NP_001307488 (OMIM: 606458) cysteine/serine-rich n ( 609) 952 129.2 4.2e-29
XP_016862538 (OMIM: 606458) PREDICTED: cysteine/se ( 329) 256 44.3 0.00078
>>NP_001307489 (OMIM: 606458) cysteine/serine-rich nucle (589 aa)
initn: 964 init1: 567 opt: 952 Z-score: 643.7 bits: 129.2 E(85289): 4.1e-29
Smith-Waterman score: 984; 37.1% identity (61.2% similar) in 544 aa overlap (33-526:1-538)
10 20 30 40 50
pF1KE3 CALFLRVKILQRVCRSRYIVHAGTCDSTAAMSGILKRKFEEVD----------GSSPCSS
:.:.:::::...: .:: :.:
NP_001 MTGLLKRKFDQLDEDNSSVSSSSSSSGCQS
10 20 30
60 70 80 90 100
pF1KE3 VRESDDEVSSSESADS---G--DSVN-PSTS----SHFTPSSILKREKRLRTKNVHFSCV
: . : :.. :: : :.. :. . ::: ::::: .: : : :. .
NP_001 -RSCSPSSSVSRAWDSEEEGPWDQMPLPDRDFCGPRSFTPLSILKRARRERPGRVAFDGI
40 50 60 70 80
110 120 130 140 150 160
pF1KE3 TVYYFTRRQGFTSVPSQGGSTLGMSSRHNSVRQYTLGEFAREQERLHREMLREHLREEKL
::.:: : ::::::::.:: ::::. ::.. :...:.:::.:: : ..: ::..:.::::
NP_001 TVFYFPRCQGFTSVPSRGGCTLGMALRHSACRRFSLAEFAQEQARARHEKLRQRLKEEKL
90 100 110 120 130 140
170 180 190 200 210
pF1KE3 NSLKLKMTKNGTVESEEASTLTLDDISDDDIDLD------NTEVDEYFFLQPLPTKKRRA
. :. :.. :. ..: . ..: :.: ... : . ...: :::: :...:::
NP_001 EMLQWKLSAAGVPQAEAGLPPVVDAIDDASVEEDLAVAVAGGRLEEVSFLQPYPARRRRA
150 160 170 180 190 200
220 230 240 250 260 270
pF1KE3 LLRASGVKKIDVEEKHELRAIRLSREDCGCDCRVFCDPDTCTCSLAGIKCQVDRMSFPCG
:::::::..:: :::.::.:.: ::::::: : .:::.::.:::::::::.:. .::::
NP_001 LLRASGVRRIDREEKRELQALRQSREDCGCHCDRICDPETCSCSLAGIKCQMDHTAFPCG
210 220 230 240 250 260
280 290 300 310 320 330
pF1KE3 CTKEGCSNTAGRIEFNPIRVRTHFLHTIMKLELEKN----REQQIPTLNGCHSEISAHSS
: .::: : ::.::: ::.:::.::. .:.::.. :: . :. .. :
NP_001 CCREGCENPMGRVEFNQARVQTHFIHTLTRLQLEQEAESFRELEAPAQGSPPSPGEEALV
270 280 290 300 310 320
340 350 360 370 380
pF1KE3 SMGPVAHS-VEYSIAD---SFEIETEPQAAVLHLQSAEELDCQGEEEEEEEDGSSFCSGV
:.:. .. ..: : .. :. ..: :: . : .: ::
NP_001 PTFPLAKPPMNNELGDNSCSSDMTDSSTASSSASGTSEAPDCP---THPGLPGPGFQPGV
330 340 350 360 370 380
390 400 410 420 430 440
pF1KE3 TDSS-TQSLAPSESDEEEEEEEEEEEEEDDDDD-----KGDGF-VEGLGTHAEVVPLPSV
:.: .. :. :.:: ::::::: . :. .: : . : : . :
NP_001 DDDSLARILSFSDSDFGGEEEEEEEGSVGNLDNLSCFHPADIFGTSDPGGLASWTHSYSG
390 400 410 420 430 440
450 460 470 480 490
pF1KE3 LCYSDGTAVHESHAKNASFYANSSTLYYQIDSHIPGTPNQISENYSERDTVKNGT-----
...:. . :. .:: . :.. : . .. .::: : . .. ..: .
NP_001 CSFTSGV-LDENANLDASCFLNGG-LEGSREGSLPGTSVPPSMDAGRSSSVDLSLSSCDS
450 460 470 480 490 500
500 510 520 530 540 550
pF1KE3 ---LSLVP-YTMTPEQFVDYARQAEEAYGASHYPAANPSVIVCCSSSENDSGVPCNSLYP
:. .: :.. :. . . .. . : :.:
NP_001 FELLQALPDYSLGPHYTSQKVSDSLDNIEAPHFPLPGLSPPGDASSCFLESLMGFSEPAA
510 520 530 540 550 560
560 570 580 590 600 610
pF1KE3 EHRSNHPQVEFHSYLKGPSQEGFVSALNGDSHISEHPAENSLSLAEKSILHEECIKSPVV
NP_001 EALDPFIDSQFEDTVPASLMEPVPV
570 580
>>XP_016862537 (OMIM: 606458) PREDICTED: cysteine/serine (589 aa)
initn: 964 init1: 567 opt: 952 Z-score: 643.7 bits: 129.2 E(85289): 4.1e-29
Smith-Waterman score: 984; 37.1% identity (61.2% similar) in 544 aa overlap (33-526:1-538)
10 20 30 40 50
pF1KE3 CALFLRVKILQRVCRSRYIVHAGTCDSTAAMSGILKRKFEEVD----------GSSPCSS
:.:.:::::...: .:: :.:
XP_016 MTGLLKRKFDQLDEDNSSVSSSSSSSGCQS
10 20 30
60 70 80 90 100
pF1KE3 VRESDDEVSSSESADS---G--DSVN-PSTS----SHFTPSSILKREKRLRTKNVHFSCV
: . : :.. :: : :.. :. . ::: ::::: .: : : :. .
XP_016 -RSCSPSSSVSRAWDSEEEGPWDQMPLPDRDFCGPRSFTPLSILKRARRERPGRVAFDGI
40 50 60 70 80
110 120 130 140 150 160
pF1KE3 TVYYFTRRQGFTSVPSQGGSTLGMSSRHNSVRQYTLGEFAREQERLHREMLREHLREEKL
::.:: : ::::::::.:: ::::. ::.. :...:.:::.:: : ..: ::..:.::::
XP_016 TVFYFPRCQGFTSVPSRGGCTLGMALRHSACRRFSLAEFAQEQARARHEKLRQRLKEEKL
90 100 110 120 130 140
170 180 190 200 210
pF1KE3 NSLKLKMTKNGTVESEEASTLTLDDISDDDIDLD------NTEVDEYFFLQPLPTKKRRA
. :. :.. :. ..: . ..: :.: ... : . ...: :::: :...:::
XP_016 EMLQWKLSAAGVPQAEAGLPPVVDAIDDASVEEDLAVAVAGGRLEEVSFLQPYPARRRRA
150 160 170 180 190 200
220 230 240 250 260 270
pF1KE3 LLRASGVKKIDVEEKHELRAIRLSREDCGCDCRVFCDPDTCTCSLAGIKCQVDRMSFPCG
:::::::..:: :::.::.:.: ::::::: : .:::.::.:::::::::.:. .::::
XP_016 LLRASGVRRIDREEKRELQALRQSREDCGCHCDRICDPETCSCSLAGIKCQMDHTAFPCG
210 220 230 240 250 260
280 290 300 310 320 330
pF1KE3 CTKEGCSNTAGRIEFNPIRVRTHFLHTIMKLELEKN----REQQIPTLNGCHSEISAHSS
: .::: : ::.::: ::.:::.::. .:.::.. :: . :. .. :
XP_016 CCREGCENPMGRVEFNQARVQTHFIHTLTRLQLEQEAESFRELEAPAQGSPPSPGEEALV
270 280 290 300 310 320
340 350 360 370 380
pF1KE3 SMGPVAHS-VEYSIAD---SFEIETEPQAAVLHLQSAEELDCQGEEEEEEEDGSSFCSGV
:.:. .. ..: : .. :. ..: :: . : .: ::
XP_016 PTFPLAKPPMNNELGDNSCSSDMTDSSTASSSASGTSEAPDCP---THPGLPGPGFQPGV
330 340 350 360 370 380
390 400 410 420 430 440
pF1KE3 TDSS-TQSLAPSESDEEEEEEEEEEEEEDDDDD-----KGDGF-VEGLGTHAEVVPLPSV
:.: .. :. :.:: ::::::: . :. .: : . : : . :
XP_016 DDDSLARILSFSDSDFGGEEEEEEEGSVGNLDNLSCFHPADIFGTSDPGGLASWTHSYSG
390 400 410 420 430 440
450 460 470 480 490
pF1KE3 LCYSDGTAVHESHAKNASFYANSSTLYYQIDSHIPGTPNQISENYSERDTVKNGT-----
...:. . :. .:: . :.. : . .. .::: : . .. ..: .
XP_016 CSFTSGV-LDENANLDASCFLNGG-LEGSREGSLPGTSVPPSMDAGRSSSVDLSLSSCDS
450 460 470 480 490 500
500 510 520 530 540 550
pF1KE3 ---LSLVP-YTMTPEQFVDYARQAEEAYGASHYPAANPSVIVCCSSSENDSGVPCNSLYP
:. .: :.. :. . . .. . : :.:
XP_016 FELLQALPDYSLGPHYTSQKVSDSLDNIEAPHFPLPGLSPPGDASSCFLESLMGFSEPAA
510 520 530 540 550 560
560 570 580 590 600 610
pF1KE3 EHRSNHPQVEFHSYLKGPSQEGFVSALNGDSHISEHPAENSLSLAEKSILHEECIKSPVV
XP_016 EALDPFIDSQFEDTVPASLMEPVPV
570 580
>>NP_149016 (OMIM: 606458) cysteine/serine-rich nuclear (589 aa)
initn: 964 init1: 567 opt: 952 Z-score: 643.7 bits: 129.2 E(85289): 4.1e-29
Smith-Waterman score: 984; 37.1% identity (61.2% similar) in 544 aa overlap (33-526:1-538)
10 20 30 40 50
pF1KE3 CALFLRVKILQRVCRSRYIVHAGTCDSTAAMSGILKRKFEEVD----------GSSPCSS
:.:.:::::...: .:: :.:
NP_149 MTGLLKRKFDQLDEDNSSVSSSSSSSGCQS
10 20 30
60 70 80 90 100
pF1KE3 VRESDDEVSSSESADS---G--DSVN-PSTS----SHFTPSSILKREKRLRTKNVHFSCV
: . : :.. :: : :.. :. . ::: ::::: .: : : :. .
NP_149 -RSCSPSSSVSRAWDSEEEGPWDQMPLPDRDFCGPRSFTPLSILKRARRERPGRVAFDGI
40 50 60 70 80
110 120 130 140 150 160
pF1KE3 TVYYFTRRQGFTSVPSQGGSTLGMSSRHNSVRQYTLGEFAREQERLHREMLREHLREEKL
::.:: : ::::::::.:: ::::. ::.. :...:.:::.:: : ..: ::..:.::::
NP_149 TVFYFPRCQGFTSVPSRGGCTLGMALRHSACRRFSLAEFAQEQARARHEKLRQRLKEEKL
90 100 110 120 130 140
170 180 190 200 210
pF1KE3 NSLKLKMTKNGTVESEEASTLTLDDISDDDIDLD------NTEVDEYFFLQPLPTKKRRA
. :. :.. :. ..: . ..: :.: ... : . ...: :::: :...:::
NP_149 EMLQWKLSAAGVPQAEAGLPPVVDAIDDASVEEDLAVAVAGGRLEEVSFLQPYPARRRRA
150 160 170 180 190 200
220 230 240 250 260 270
pF1KE3 LLRASGVKKIDVEEKHELRAIRLSREDCGCDCRVFCDPDTCTCSLAGIKCQVDRMSFPCG
:::::::..:: :::.::.:.: ::::::: : .:::.::.:::::::::.:. .::::
NP_149 LLRASGVRRIDREEKRELQALRQSREDCGCHCDRICDPETCSCSLAGIKCQMDHTAFPCG
210 220 230 240 250 260
280 290 300 310 320 330
pF1KE3 CTKEGCSNTAGRIEFNPIRVRTHFLHTIMKLELEKN----REQQIPTLNGCHSEISAHSS
: .::: : ::.::: ::.:::.::. .:.::.. :: . :. .. :
NP_149 CCREGCENPMGRVEFNQARVQTHFIHTLTRLQLEQEAESFRELEAPAQGSPPSPGEEALV
270 280 290 300 310 320
340 350 360 370 380
pF1KE3 SMGPVAHS-VEYSIAD---SFEIETEPQAAVLHLQSAEELDCQGEEEEEEEDGSSFCSGV
:.:. .. ..: : .. :. ..: :: . : .: ::
NP_149 PTFPLAKPPMNNELGDNSCSSDMTDSSTASSSASGTSEAPDCP---THPGLPGPGFQPGV
330 340 350 360 370 380
390 400 410 420 430 440
pF1KE3 TDSS-TQSLAPSESDEEEEEEEEEEEEEDDDDD-----KGDGF-VEGLGTHAEVVPLPSV
:.: .. :. :.:: ::::::: . :. .: : . : : . :
NP_149 DDDSLARILSFSDSDFGGEEEEEEEGSVGNLDNLSCFHPADIFGTSDPGGLASWTHSYSG
390 400 410 420 430 440
450 460 470 480 490
pF1KE3 LCYSDGTAVHESHAKNASFYANSSTLYYQIDSHIPGTPNQISENYSERDTVKNGT-----
...:. . :. .:: . :.. : . .. .::: : . .. ..: .
NP_149 CSFTSGV-LDENANLDASCFLNGG-LEGSREGSLPGTSVPPSMDAGRSSSVDLSLSSCDS
450 460 470 480 490 500
500 510 520 530 540 550
pF1KE3 ---LSLVP-YTMTPEQFVDYARQAEEAYGASHYPAANPSVIVCCSSSENDSGVPCNSLYP
:. .: :.. :. . . .. . : :.:
NP_149 FELLQALPDYSLGPHYTSQKVSDSLDNIEAPHFPLPGLSPPGDASSCFLESLMGFSEPAA
510 520 530 540 550 560
560 570 580 590 600 610
pF1KE3 EHRSNHPQVEFHSYLKGPSQEGFVSALNGDSHISEHPAENSLSLAEKSILHEECIKSPVV
NP_149 EALDPFIDSQFEDTVPASLMEPVPV
570 580
>>NP_001307488 (OMIM: 606458) cysteine/serine-rich nucle (609 aa)
initn: 964 init1: 567 opt: 952 Z-score: 643.5 bits: 129.2 E(85289): 4.2e-29
Smith-Waterman score: 990; 36.8% identity (60.5% similar) in 560 aa overlap (17-526:5-558)
10 20 30 40 50
pF1KE3 MKCALFLRVKILQRVCRSRYIVHAGTCDSTAAMSGILKRKFEEVD----------GSSPC
: : : : ..:.:.:::::...: .:: :
NP_001 MSETRLRLSVPRPQSTSGTTMTGLLKRKFDQLDEDNSSVSSSSSSSGC
10 20 30 40
60 70 80 90 100
pF1KE3 SSVRESDDEVSSSESADS---G--DSVN-PSTS----SHFTPSSILKREKRLRTKNVHFS
.: : . : :.. :: : :.. :. . ::: ::::: .: : : :.
NP_001 QS-RSCSPSSSVSRAWDSEEEGPWDQMPLPDRDFCGPRSFTPLSILKRARRERPGRVAFD
50 60 70 80 90 100
110 120 130 140 150 160
pF1KE3 CVTVYYFTRRQGFTSVPSQGGSTLGMSSRHNSVRQYTLGEFAREQERLHREMLREHLREE
.::.:: : ::::::::.:: ::::. ::.. :...:.:::.:: : ..: ::..:.::
NP_001 GITVFYFPRCQGFTSVPSRGGCTLGMALRHSACRRFSLAEFAQEQARARHEKLRQRLKEE
110 120 130 140 150 160
170 180 190 200 210
pF1KE3 KLNSLKLKMTKNGTVESEEASTLTLDDISDDDIDLD------NTEVDEYFFLQPLPTKKR
::. :. :.. :. ..: . ..: :.: ... : . ...: :::: :...:
NP_001 KLEMLQWKLSAAGVPQAEAGLPPVVDAIDDASVEEDLAVAVAGGRLEEVSFLQPYPARRR
170 180 190 200 210 220
220 230 240 250 260 270
pF1KE3 RALLRASGVKKIDVEEKHELRAIRLSREDCGCDCRVFCDPDTCTCSLAGIKCQVDRMSFP
:::::::::..:: :::.::.:.: ::::::: : .:::.::.:::::::::.:. .::
NP_001 RALLRASGVRRIDREEKRELQALRQSREDCGCHCDRICDPETCSCSLAGIKCQMDHTAFP
230 240 250 260 270 280
280 290 300 310 320 330
pF1KE3 CGCTKEGCSNTAGRIEFNPIRVRTHFLHTIMKLELEKN----REQQIPTLNGCHSEISAH
::: .::: : ::.::: ::.:::.::. .:.::.. :: . :. .. :
NP_001 CGCCREGCENPMGRVEFNQARVQTHFIHTLTRLQLEQEAESFRELEAPAQGSPPSPGEEA
290 300 310 320 330 340
340 350 360 370 380
pF1KE3 SSSMGPVAHS-VEYSIAD---SFEIETEPQAAVLHLQSAEELDCQGEEEEEEEDGSSFCS
:.:. .. ..: : .. :. ..: :: . : .:
NP_001 LVPTFPLAKPPMNNELGDNSCSSDMTDSSTASSSASGTSEAPDCP---THPGLPGPGFQP
350 360 370 380 390 400
390 400 410 420 430
pF1KE3 GVTDSS-TQSLAPSESDEEEEEEEEEEEEEDDDDD-----KGDGF-VEGLGTHAEVVPLP
:: :.: .. :. :.:: ::::::: . :. .: : . : : .
NP_001 GVDDDSLARILSFSDSDFGGEEEEEEEGSVGNLDNLSCFHPADIFGTSDPGGLASWTHSY
410 420 430 440 450 460
440 450 460 470 480 490
pF1KE3 SVLCYSDGTAVHESHAKNASFYANSSTLYYQIDSHIPGTPNQISENYSERDTVKNGT---
: ...:. . :. .:: . :.. : . .. .::: : . .. ..: .
NP_001 SGCSFTSGV-LDENANLDASCFLNGG-LEGSREGSLPGTSVPPSMDAGRSSSVDLSLSSC
470 480 490 500 510 520
500 510 520 530 540 550
pF1KE3 -----LSLVP-YTMTPEQFVDYARQAEEAYGASHYPAANPSVIVCCSSSENDSGVPCNSL
:. .: :.. :. . . .. . : :.:
NP_001 DSFELLQALPDYSLGPHYTSQKVSDSLDNIEAPHFPLPGLSPPGDASSCFLESLMGFSEP
530 540 550 560 570 580
560 570 580 590 600 610
pF1KE3 YPEHRSNHPQVEFHSYLKGPSQEGFVSALNGDSHISEHPAENSLSLAEKSILHEECIKSP
NP_001 AAEALDPFIDSQFEDTVPASLMEPVPV
590 600
>>XP_016862538 (OMIM: 606458) PREDICTED: cysteine/serine (329 aa)
initn: 262 init1: 213 opt: 256 Z-score: 189.8 bits: 44.3 E(85289): 0.00078
Smith-Waterman score: 262; 27.6% identity (52.3% similar) in 283 aa overlap (268-526:1-278)
240 250 260 270 280 290
pF1KE3 RLSREDCGCDCRVFCDPDTCTCSLAGIKCQVDRMSFPCGCTKEGCSNTAGRIEFNPIRVR
.:. .::::: .::: : ::.::: ::.
XP_016 MDHTAFPCGCCREGCENPMGRVEFNQARVQ
10 20 30
300 310 320 330 340
pF1KE3 THFLHTIMKLELEKN----REQQIPTLNGCHSEISAHSSSMGPVAHS-VEYSIAD---SF
:::.::. .:.::.. :: . :. .. : :.:. .. ..: :
XP_016 THFIHTLTRLQLEQEAESFRELEAPAQGSPPSPGEEALVPTFPLAKPPMNNELGDNSCSS
40 50 60 70 80 90
350 360 370 380 390 400
pF1KE3 EIETEPQAAVLHLQSAEELDCQGEEEEEEEDGSSFCSGVTDSS-TQSLAPSESDEEEEEE
.. :. ..: :: . : .: :: :.: .. :. :.:: :::
XP_016 DMTDSSTASSSASGTSEAPDCP---THPGLPGPGFQPGVDDDSLARILSFSDSDFGGEEE
100 110 120 130 140
410 420 430 440 450 460
pF1KE3 EEEEEEEDDDDD-----KGDGF-VEGLGTHAEVVPLPSVLCYSDGTAVHESHAKNASFYA
:::: . :. .: : . : : . : ...:. . :. .:: .
XP_016 EEEEGSVGNLDNLSCFHPADIFGTSDPGGLASWTHSYSGCSFTSGV-LDENANLDASCFL
150 160 170 180 190 200
470 480 490 500 510
pF1KE3 NSSTLYYQIDSHIPGTPNQISENYSERDTVKNGT--------LSLVP-YTMTPEQFVDYA
:.. : . .. .::: : . .. ..: . :. .: :.. :. . .
XP_016 NGG-LEGSREGSLPGTSVPPSMDAGRSSSVDLSLSSCDSFELLQALPDYSLGPHYTSQKV
210 220 230 240 250 260
520 530 540 550 560 570
pF1KE3 RQAEEAYGASHYPAANPSVIVCCSSSENDSGVPCNSLYPEHRSNHPQVEFHSYLKGPSQE
.. . : :.:
XP_016 SDSLDNIEAPHFPLPGLSPPGDASSCFLESLMGFSEPAAEALDPFIDSQFEDTVPASLME
270 280 290 300 310 320
617 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 16:35:17 2016 done: Mon Nov 7 16:35:18 2016
Total Scan time: 10.290 Total Display time: 0.040
Function used was FASTA [36.3.4 Apr, 2011]