FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3259, 617 aa 1>>>pF1KE3259 617 - 617 aa - 617 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.6890+/-0.000404; mu= 4.3873+/- 0.026 mean_var=231.7744+/-45.999, 0's: 0 Z-trim(118.8): 10 B-trim: 57 in 1/56 Lambda= 0.084244 statistics sampled from 32039 (32049) to 32039 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.693), E-opt: 0.2 (0.376), width: 16 Scan time: 10.290 The best scores are: opt bits E(85289) NP_001307489 (OMIM: 606458) cysteine/serine-rich n ( 589) 952 129.2 4.1e-29 XP_016862537 (OMIM: 606458) PREDICTED: cysteine/se ( 589) 952 129.2 4.1e-29 NP_149016 (OMIM: 606458) cysteine/serine-rich nucl ( 589) 952 129.2 4.1e-29 NP_001307488 (OMIM: 606458) cysteine/serine-rich n ( 609) 952 129.2 4.2e-29 XP_016862538 (OMIM: 606458) PREDICTED: cysteine/se ( 329) 256 44.3 0.00078 >>NP_001307489 (OMIM: 606458) cysteine/serine-rich nucle (589 aa) initn: 964 init1: 567 opt: 952 Z-score: 643.7 bits: 129.2 E(85289): 4.1e-29 Smith-Waterman score: 984; 37.1% identity (61.2% similar) in 544 aa overlap (33-526:1-538) 10 20 30 40 50 pF1KE3 CALFLRVKILQRVCRSRYIVHAGTCDSTAAMSGILKRKFEEVD----------GSSPCSS :.:.:::::...: .:: :.: NP_001 MTGLLKRKFDQLDEDNSSVSSSSSSSGCQS 10 20 30 60 70 80 90 100 pF1KE3 VRESDDEVSSSESADS---G--DSVN-PSTS----SHFTPSSILKREKRLRTKNVHFSCV : . : :.. :: : :.. :. . ::: ::::: .: : : :. . NP_001 -RSCSPSSSVSRAWDSEEEGPWDQMPLPDRDFCGPRSFTPLSILKRARRERPGRVAFDGI 40 50 60 70 80 110 120 130 140 150 160 pF1KE3 TVYYFTRRQGFTSVPSQGGSTLGMSSRHNSVRQYTLGEFAREQERLHREMLREHLREEKL ::.:: : ::::::::.:: ::::. ::.. :...:.:::.:: : ..: ::..:.:::: NP_001 TVFYFPRCQGFTSVPSRGGCTLGMALRHSACRRFSLAEFAQEQARARHEKLRQRLKEEKL 90 100 110 120 130 140 170 180 190 200 210 pF1KE3 NSLKLKMTKNGTVESEEASTLTLDDISDDDIDLD------NTEVDEYFFLQPLPTKKRRA . :. :.. :. ..: . ..: :.: ... : . ...: :::: :...::: NP_001 EMLQWKLSAAGVPQAEAGLPPVVDAIDDASVEEDLAVAVAGGRLEEVSFLQPYPARRRRA 150 160 170 180 190 200 220 230 240 250 260 270 pF1KE3 LLRASGVKKIDVEEKHELRAIRLSREDCGCDCRVFCDPDTCTCSLAGIKCQVDRMSFPCG :::::::..:: :::.::.:.: ::::::: : .:::.::.:::::::::.:. .:::: NP_001 LLRASGVRRIDREEKRELQALRQSREDCGCHCDRICDPETCSCSLAGIKCQMDHTAFPCG 210 220 230 240 250 260 280 290 300 310 320 330 pF1KE3 CTKEGCSNTAGRIEFNPIRVRTHFLHTIMKLELEKN----REQQIPTLNGCHSEISAHSS : .::: : ::.::: ::.:::.::. .:.::.. :: . :. .. : NP_001 CCREGCENPMGRVEFNQARVQTHFIHTLTRLQLEQEAESFRELEAPAQGSPPSPGEEALV 270 280 290 300 310 320 340 350 360 370 380 pF1KE3 SMGPVAHS-VEYSIAD---SFEIETEPQAAVLHLQSAEELDCQGEEEEEEEDGSSFCSGV :.:. .. ..: : .. :. ..: :: . : .: :: NP_001 PTFPLAKPPMNNELGDNSCSSDMTDSSTASSSASGTSEAPDCP---THPGLPGPGFQPGV 330 340 350 360 370 380 390 400 410 420 430 440 pF1KE3 TDSS-TQSLAPSESDEEEEEEEEEEEEEDDDDD-----KGDGF-VEGLGTHAEVVPLPSV :.: .. :. :.:: ::::::: . :. .: : . : : . : NP_001 DDDSLARILSFSDSDFGGEEEEEEEGSVGNLDNLSCFHPADIFGTSDPGGLASWTHSYSG 390 400 410 420 430 440 450 460 470 480 490 pF1KE3 LCYSDGTAVHESHAKNASFYANSSTLYYQIDSHIPGTPNQISENYSERDTVKNGT----- ...:. . :. .:: . :.. : . .. .::: : . .. ..: . NP_001 CSFTSGV-LDENANLDASCFLNGG-LEGSREGSLPGTSVPPSMDAGRSSSVDLSLSSCDS 450 460 470 480 490 500 500 510 520 530 540 550 pF1KE3 ---LSLVP-YTMTPEQFVDYARQAEEAYGASHYPAANPSVIVCCSSSENDSGVPCNSLYP :. .: :.. :. . . .. . : :.: NP_001 FELLQALPDYSLGPHYTSQKVSDSLDNIEAPHFPLPGLSPPGDASSCFLESLMGFSEPAA 510 520 530 540 550 560 560 570 580 590 600 610 pF1KE3 EHRSNHPQVEFHSYLKGPSQEGFVSALNGDSHISEHPAENSLSLAEKSILHEECIKSPVV NP_001 EALDPFIDSQFEDTVPASLMEPVPV 570 580 >>XP_016862537 (OMIM: 606458) PREDICTED: cysteine/serine (589 aa) initn: 964 init1: 567 opt: 952 Z-score: 643.7 bits: 129.2 E(85289): 4.1e-29 Smith-Waterman score: 984; 37.1% identity (61.2% similar) in 544 aa overlap (33-526:1-538) 10 20 30 40 50 pF1KE3 CALFLRVKILQRVCRSRYIVHAGTCDSTAAMSGILKRKFEEVD----------GSSPCSS :.:.:::::...: .:: :.: XP_016 MTGLLKRKFDQLDEDNSSVSSSSSSSGCQS 10 20 30 60 70 80 90 100 pF1KE3 VRESDDEVSSSESADS---G--DSVN-PSTS----SHFTPSSILKREKRLRTKNVHFSCV : . : :.. :: : :.. :. . ::: ::::: .: : : :. . XP_016 -RSCSPSSSVSRAWDSEEEGPWDQMPLPDRDFCGPRSFTPLSILKRARRERPGRVAFDGI 40 50 60 70 80 110 120 130 140 150 160 pF1KE3 TVYYFTRRQGFTSVPSQGGSTLGMSSRHNSVRQYTLGEFAREQERLHREMLREHLREEKL ::.:: : ::::::::.:: ::::. ::.. :...:.:::.:: : ..: ::..:.:::: XP_016 TVFYFPRCQGFTSVPSRGGCTLGMALRHSACRRFSLAEFAQEQARARHEKLRQRLKEEKL 90 100 110 120 130 140 170 180 190 200 210 pF1KE3 NSLKLKMTKNGTVESEEASTLTLDDISDDDIDLD------NTEVDEYFFLQPLPTKKRRA . :. :.. :. ..: . ..: :.: ... : . ...: :::: :...::: XP_016 EMLQWKLSAAGVPQAEAGLPPVVDAIDDASVEEDLAVAVAGGRLEEVSFLQPYPARRRRA 150 160 170 180 190 200 220 230 240 250 260 270 pF1KE3 LLRASGVKKIDVEEKHELRAIRLSREDCGCDCRVFCDPDTCTCSLAGIKCQVDRMSFPCG :::::::..:: :::.::.:.: ::::::: : .:::.::.:::::::::.:. .:::: XP_016 LLRASGVRRIDREEKRELQALRQSREDCGCHCDRICDPETCSCSLAGIKCQMDHTAFPCG 210 220 230 240 250 260 280 290 300 310 320 330 pF1KE3 CTKEGCSNTAGRIEFNPIRVRTHFLHTIMKLELEKN----REQQIPTLNGCHSEISAHSS : .::: : ::.::: ::.:::.::. .:.::.. :: . :. .. : XP_016 CCREGCENPMGRVEFNQARVQTHFIHTLTRLQLEQEAESFRELEAPAQGSPPSPGEEALV 270 280 290 300 310 320 340 350 360 370 380 pF1KE3 SMGPVAHS-VEYSIAD---SFEIETEPQAAVLHLQSAEELDCQGEEEEEEEDGSSFCSGV :.:. .. ..: : .. :. ..: :: . : .: :: XP_016 PTFPLAKPPMNNELGDNSCSSDMTDSSTASSSASGTSEAPDCP---THPGLPGPGFQPGV 330 340 350 360 370 380 390 400 410 420 430 440 pF1KE3 TDSS-TQSLAPSESDEEEEEEEEEEEEEDDDDD-----KGDGF-VEGLGTHAEVVPLPSV :.: .. :. :.:: ::::::: . :. .: : . : : . : XP_016 DDDSLARILSFSDSDFGGEEEEEEEGSVGNLDNLSCFHPADIFGTSDPGGLASWTHSYSG 390 400 410 420 430 440 450 460 470 480 490 pF1KE3 LCYSDGTAVHESHAKNASFYANSSTLYYQIDSHIPGTPNQISENYSERDTVKNGT----- ...:. . :. .:: . :.. : . .. .::: : . .. ..: . XP_016 CSFTSGV-LDENANLDASCFLNGG-LEGSREGSLPGTSVPPSMDAGRSSSVDLSLSSCDS 450 460 470 480 490 500 500 510 520 530 540 550 pF1KE3 ---LSLVP-YTMTPEQFVDYARQAEEAYGASHYPAANPSVIVCCSSSENDSGVPCNSLYP :. .: :.. :. . . .. . : :.: XP_016 FELLQALPDYSLGPHYTSQKVSDSLDNIEAPHFPLPGLSPPGDASSCFLESLMGFSEPAA 510 520 530 540 550 560 560 570 580 590 600 610 pF1KE3 EHRSNHPQVEFHSYLKGPSQEGFVSALNGDSHISEHPAENSLSLAEKSILHEECIKSPVV XP_016 EALDPFIDSQFEDTVPASLMEPVPV 570 580 >>NP_149016 (OMIM: 606458) cysteine/serine-rich nuclear (589 aa) initn: 964 init1: 567 opt: 952 Z-score: 643.7 bits: 129.2 E(85289): 4.1e-29 Smith-Waterman score: 984; 37.1% identity (61.2% similar) in 544 aa overlap (33-526:1-538) 10 20 30 40 50 pF1KE3 CALFLRVKILQRVCRSRYIVHAGTCDSTAAMSGILKRKFEEVD----------GSSPCSS :.:.:::::...: .:: :.: NP_149 MTGLLKRKFDQLDEDNSSVSSSSSSSGCQS 10 20 30 60 70 80 90 100 pF1KE3 VRESDDEVSSSESADS---G--DSVN-PSTS----SHFTPSSILKREKRLRTKNVHFSCV : . : :.. :: : :.. :. . ::: ::::: .: : : :. . NP_149 -RSCSPSSSVSRAWDSEEEGPWDQMPLPDRDFCGPRSFTPLSILKRARRERPGRVAFDGI 40 50 60 70 80 110 120 130 140 150 160 pF1KE3 TVYYFTRRQGFTSVPSQGGSTLGMSSRHNSVRQYTLGEFAREQERLHREMLREHLREEKL ::.:: : ::::::::.:: ::::. ::.. :...:.:::.:: : ..: ::..:.:::: NP_149 TVFYFPRCQGFTSVPSRGGCTLGMALRHSACRRFSLAEFAQEQARARHEKLRQRLKEEKL 90 100 110 120 130 140 170 180 190 200 210 pF1KE3 NSLKLKMTKNGTVESEEASTLTLDDISDDDIDLD------NTEVDEYFFLQPLPTKKRRA . :. :.. :. ..: . ..: :.: ... : . ...: :::: :...::: NP_149 EMLQWKLSAAGVPQAEAGLPPVVDAIDDASVEEDLAVAVAGGRLEEVSFLQPYPARRRRA 150 160 170 180 190 200 220 230 240 250 260 270 pF1KE3 LLRASGVKKIDVEEKHELRAIRLSREDCGCDCRVFCDPDTCTCSLAGIKCQVDRMSFPCG :::::::..:: :::.::.:.: ::::::: : .:::.::.:::::::::.:. .:::: NP_149 LLRASGVRRIDREEKRELQALRQSREDCGCHCDRICDPETCSCSLAGIKCQMDHTAFPCG 210 220 230 240 250 260 280 290 300 310 320 330 pF1KE3 CTKEGCSNTAGRIEFNPIRVRTHFLHTIMKLELEKN----REQQIPTLNGCHSEISAHSS : .::: : ::.::: ::.:::.::. .:.::.. :: . :. .. : NP_149 CCREGCENPMGRVEFNQARVQTHFIHTLTRLQLEQEAESFRELEAPAQGSPPSPGEEALV 270 280 290 300 310 320 340 350 360 370 380 pF1KE3 SMGPVAHS-VEYSIAD---SFEIETEPQAAVLHLQSAEELDCQGEEEEEEEDGSSFCSGV :.:. .. ..: : .. :. ..: :: . : .: :: NP_149 PTFPLAKPPMNNELGDNSCSSDMTDSSTASSSASGTSEAPDCP---THPGLPGPGFQPGV 330 340 350 360 370 380 390 400 410 420 430 440 pF1KE3 TDSS-TQSLAPSESDEEEEEEEEEEEEEDDDDD-----KGDGF-VEGLGTHAEVVPLPSV :.: .. :. :.:: ::::::: . :. .: : . : : . : NP_149 DDDSLARILSFSDSDFGGEEEEEEEGSVGNLDNLSCFHPADIFGTSDPGGLASWTHSYSG 390 400 410 420 430 440 450 460 470 480 490 pF1KE3 LCYSDGTAVHESHAKNASFYANSSTLYYQIDSHIPGTPNQISENYSERDTVKNGT----- ...:. . :. .:: . :.. : . .. .::: : . .. ..: . NP_149 CSFTSGV-LDENANLDASCFLNGG-LEGSREGSLPGTSVPPSMDAGRSSSVDLSLSSCDS 450 460 470 480 490 500 500 510 520 530 540 550 pF1KE3 ---LSLVP-YTMTPEQFVDYARQAEEAYGASHYPAANPSVIVCCSSSENDSGVPCNSLYP :. .: :.. :. . . .. . : :.: NP_149 FELLQALPDYSLGPHYTSQKVSDSLDNIEAPHFPLPGLSPPGDASSCFLESLMGFSEPAA 510 520 530 540 550 560 560 570 580 590 600 610 pF1KE3 EHRSNHPQVEFHSYLKGPSQEGFVSALNGDSHISEHPAENSLSLAEKSILHEECIKSPVV NP_149 EALDPFIDSQFEDTVPASLMEPVPV 570 580 >>NP_001307488 (OMIM: 606458) cysteine/serine-rich nucle (609 aa) initn: 964 init1: 567 opt: 952 Z-score: 643.5 bits: 129.2 E(85289): 4.2e-29 Smith-Waterman score: 990; 36.8% identity (60.5% similar) in 560 aa overlap (17-526:5-558) 10 20 30 40 50 pF1KE3 MKCALFLRVKILQRVCRSRYIVHAGTCDSTAAMSGILKRKFEEVD----------GSSPC : : : : ..:.:.:::::...: .:: : NP_001 MSETRLRLSVPRPQSTSGTTMTGLLKRKFDQLDEDNSSVSSSSSSSGC 10 20 30 40 60 70 80 90 100 pF1KE3 SSVRESDDEVSSSESADS---G--DSVN-PSTS----SHFTPSSILKREKRLRTKNVHFS .: : . : :.. :: : :.. :. . ::: ::::: .: : : :. NP_001 QS-RSCSPSSSVSRAWDSEEEGPWDQMPLPDRDFCGPRSFTPLSILKRARRERPGRVAFD 50 60 70 80 90 100 110 120 130 140 150 160 pF1KE3 CVTVYYFTRRQGFTSVPSQGGSTLGMSSRHNSVRQYTLGEFAREQERLHREMLREHLREE .::.:: : ::::::::.:: ::::. ::.. :...:.:::.:: : ..: ::..:.:: NP_001 GITVFYFPRCQGFTSVPSRGGCTLGMALRHSACRRFSLAEFAQEQARARHEKLRQRLKEE 110 120 130 140 150 160 170 180 190 200 210 pF1KE3 KLNSLKLKMTKNGTVESEEASTLTLDDISDDDIDLD------NTEVDEYFFLQPLPTKKR ::. :. :.. :. ..: . ..: :.: ... : . ...: :::: :...: NP_001 KLEMLQWKLSAAGVPQAEAGLPPVVDAIDDASVEEDLAVAVAGGRLEEVSFLQPYPARRR 170 180 190 200 210 220 220 230 240 250 260 270 pF1KE3 RALLRASGVKKIDVEEKHELRAIRLSREDCGCDCRVFCDPDTCTCSLAGIKCQVDRMSFP :::::::::..:: :::.::.:.: ::::::: : .:::.::.:::::::::.:. .:: NP_001 RALLRASGVRRIDREEKRELQALRQSREDCGCHCDRICDPETCSCSLAGIKCQMDHTAFP 230 240 250 260 270 280 280 290 300 310 320 330 pF1KE3 CGCTKEGCSNTAGRIEFNPIRVRTHFLHTIMKLELEKN----REQQIPTLNGCHSEISAH ::: .::: : ::.::: ::.:::.::. .:.::.. :: . :. .. : NP_001 CGCCREGCENPMGRVEFNQARVQTHFIHTLTRLQLEQEAESFRELEAPAQGSPPSPGEEA 290 300 310 320 330 340 340 350 360 370 380 pF1KE3 SSSMGPVAHS-VEYSIAD---SFEIETEPQAAVLHLQSAEELDCQGEEEEEEEDGSSFCS :.:. .. ..: : .. :. ..: :: . : .: NP_001 LVPTFPLAKPPMNNELGDNSCSSDMTDSSTASSSASGTSEAPDCP---THPGLPGPGFQP 350 360 370 380 390 400 390 400 410 420 430 pF1KE3 GVTDSS-TQSLAPSESDEEEEEEEEEEEEEDDDDD-----KGDGF-VEGLGTHAEVVPLP :: :.: .. :. :.:: ::::::: . :. .: : . : : . NP_001 GVDDDSLARILSFSDSDFGGEEEEEEEGSVGNLDNLSCFHPADIFGTSDPGGLASWTHSY 410 420 430 440 450 460 440 450 460 470 480 490 pF1KE3 SVLCYSDGTAVHESHAKNASFYANSSTLYYQIDSHIPGTPNQISENYSERDTVKNGT--- : ...:. . :. .:: . :.. : . .. .::: : . .. ..: . NP_001 SGCSFTSGV-LDENANLDASCFLNGG-LEGSREGSLPGTSVPPSMDAGRSSSVDLSLSSC 470 480 490 500 510 520 500 510 520 530 540 550 pF1KE3 -----LSLVP-YTMTPEQFVDYARQAEEAYGASHYPAANPSVIVCCSSSENDSGVPCNSL :. .: :.. :. . . .. . : :.: NP_001 DSFELLQALPDYSLGPHYTSQKVSDSLDNIEAPHFPLPGLSPPGDASSCFLESLMGFSEP 530 540 550 560 570 580 560 570 580 590 600 610 pF1KE3 YPEHRSNHPQVEFHSYLKGPSQEGFVSALNGDSHISEHPAENSLSLAEKSILHEECIKSP NP_001 AAEALDPFIDSQFEDTVPASLMEPVPV 590 600 >>XP_016862538 (OMIM: 606458) PREDICTED: cysteine/serine (329 aa) initn: 262 init1: 213 opt: 256 Z-score: 189.8 bits: 44.3 E(85289): 0.00078 Smith-Waterman score: 262; 27.6% identity (52.3% similar) in 283 aa overlap (268-526:1-278) 240 250 260 270 280 290 pF1KE3 RLSREDCGCDCRVFCDPDTCTCSLAGIKCQVDRMSFPCGCTKEGCSNTAGRIEFNPIRVR .:. .::::: .::: : ::.::: ::. XP_016 MDHTAFPCGCCREGCENPMGRVEFNQARVQ 10 20 30 300 310 320 330 340 pF1KE3 THFLHTIMKLELEKN----REQQIPTLNGCHSEISAHSSSMGPVAHS-VEYSIAD---SF :::.::. .:.::.. :: . :. .. : :.:. .. ..: : XP_016 THFIHTLTRLQLEQEAESFRELEAPAQGSPPSPGEEALVPTFPLAKPPMNNELGDNSCSS 40 50 60 70 80 90 350 360 370 380 390 400 pF1KE3 EIETEPQAAVLHLQSAEELDCQGEEEEEEEDGSSFCSGVTDSS-TQSLAPSESDEEEEEE .. :. ..: :: . : .: :: :.: .. :. :.:: ::: XP_016 DMTDSSTASSSASGTSEAPDCP---THPGLPGPGFQPGVDDDSLARILSFSDSDFGGEEE 100 110 120 130 140 410 420 430 440 450 460 pF1KE3 EEEEEEEDDDDD-----KGDGF-VEGLGTHAEVVPLPSVLCYSDGTAVHESHAKNASFYA :::: . :. .: : . : : . : ...:. . :. .:: . XP_016 EEEEGSVGNLDNLSCFHPADIFGTSDPGGLASWTHSYSGCSFTSGV-LDENANLDASCFL 150 160 170 180 190 200 470 480 490 500 510 pF1KE3 NSSTLYYQIDSHIPGTPNQISENYSERDTVKNGT--------LSLVP-YTMTPEQFVDYA :.. : . .. .::: : . .. ..: . :. .: :.. :. . . XP_016 NGG-LEGSREGSLPGTSVPPSMDAGRSSSVDLSLSSCDSFELLQALPDYSLGPHYTSQKV 210 220 230 240 250 260 520 530 540 550 560 570 pF1KE3 RQAEEAYGASHYPAANPSVIVCCSSSENDSGVPCNSLYPEHRSNHPQVEFHSYLKGPSQE .. . : :.: XP_016 SDSLDNIEAPHFPLPGLSPPGDASSCFLESLMGFSEPAAEALDPFIDSQFEDTVPASLME 270 280 290 300 310 320 617 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 16:35:17 2016 done: Mon Nov 7 16:35:18 2016 Total Scan time: 10.290 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]