FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3685, 320 aa 1>>>pF1KE3685 320 - 320 aa - 320 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.2750+/-0.000429; mu= -16.0828+/- 0.027 mean_var=406.6061+/-82.046, 0's: 0 Z-trim(122.9): 251 B-trim: 0 in 0/58 Lambda= 0.063604 statistics sampled from 41557 (41845) to 41557 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.766), E-opt: 0.2 (0.491), width: 16 Scan time: 9.300 The best scores are: opt bits E(85289) NP_005446 (OMIM: 604347) zinc finger Ran-binding d ( 320) 2093 205.5 1.2e-52 NP_976225 (OMIM: 604347) zinc finger Ran-binding d ( 330) 2022 199.0 1.1e-50 XP_006722006 (OMIM: 609434) PREDICTED: luc7-like p ( 413) 322 43.1 0.0012 NP_006098 (OMIM: 609434) luc7-like protein 3 isofo ( 432) 322 43.1 0.0012 NP_057508 (OMIM: 609434) luc7-like protein 3 isofo ( 432) 322 43.1 0.0012 XP_005257506 (OMIM: 609434) PREDICTED: luc7-like p ( 472) 322 43.2 0.0013 NP_001317259 (OMIM: 609434) luc7-like protein 3 is ( 489) 322 43.2 0.0014 NP_001278340 (OMIM: 182465,617140) protein SON iso (2108) 326 44.0 0.0033 NP_115571 (OMIM: 182465,617140) protein SON isofor (2303) 326 44.0 0.0035 NP_620305 (OMIM: 182465,617140) protein SON isofor (2426) 326 44.0 0.0037 XP_005257509 (OMIM: 609434) PREDICTED: luc7-like p ( 442) 293 40.5 0.0079 NP_006266 (OMIM: 601944) serine/arginine-rich spli ( 344) 288 39.9 0.0089 >>NP_005446 (OMIM: 604347) zinc finger Ran-binding domai (320 aa) initn: 2093 init1: 2093 opt: 2093 Z-score: 1066.4 bits: 205.5 E(85289): 1.2e-52 Smith-Waterman score: 2093; 99.7% identity (99.7% similar) in 320 aa overlap (1-320:1-320) 10 20 30 40 50 60 pF1KE3 MSTKNFRVSDGDWICPDKKCGNVNFARRTSCNRCGREKTTEAKMMKAGGTEIGKTLAEKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_005 MSTKNFRVSDGDWICPDKKCGNVNFARRTSCNRCGREKTTEAKMMKAGGTEIGKTLAEKS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 RGLFSANDWQCKTCSNVNWARRSECNMCNTPKYAKLEERTGYGGGFNERENVEYIEREES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_005 RGLFSANDWQCKTCSNVNWARRSECNMCNTPKYAKLEERTGYGGGFNERENVEYIEREES 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 DGEYDEFGRKKKKYRGKAVGPASILKEVEDKESEGEEEDEDEDLSKYKLDEDEDEDDADL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_005 DGEYDEFGRKKKKYRGKAVGPASILKEVEDKESEGEEEDEDEDLSKYKLDEDEDEDDADL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 SKYNLDASEEEDSNKKKSNRRSRSKSGSSHSRSSSRSSSPSSSRSRSRSRSRSSSSSQSR :::::::::::::::::::::::::: ::::::::::::::::::::::::::::::::: NP_005 SKYNLDASEEEDSNKKKSNRRSRSKSRSSHSRSSSRSSSPSSSRSRSRSRSRSSSSSQSR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 SRSSSRERSRSRGSKSRSSSRSHRGSSSPRKRSYSSSSSSPERNRKRSRSRSSSSGDRKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_005 SRSSSRERSRSRGSKSRSSSRSHRGSSSPRKRSYSSSSSSPERNRKRSRSRSSSSGDRKK 250 260 270 280 290 300 310 320 pF1KE3 RRTRSRSPESQVIGENTKQP :::::::::::::::::::: NP_005 RRTRSRSPESQVIGENTKQP 310 320 >>NP_976225 (OMIM: 604347) zinc finger Ran-binding domai (330 aa) initn: 2022 init1: 2022 opt: 2022 Z-score: 1031.0 bits: 199.0 E(85289): 1.1e-50 Smith-Waterman score: 2022; 99.7% identity (99.7% similar) in 309 aa overlap (1-309:1-309) 10 20 30 40 50 60 pF1KE3 MSTKNFRVSDGDWICPDKKCGNVNFARRTSCNRCGREKTTEAKMMKAGGTEIGKTLAEKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_976 MSTKNFRVSDGDWICPDKKCGNVNFARRTSCNRCGREKTTEAKMMKAGGTEIGKTLAEKS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 RGLFSANDWQCKTCSNVNWARRSECNMCNTPKYAKLEERTGYGGGFNERENVEYIEREES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_976 RGLFSANDWQCKTCSNVNWARRSECNMCNTPKYAKLEERTGYGGGFNERENVEYIEREES 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 DGEYDEFGRKKKKYRGKAVGPASILKEVEDKESEGEEEDEDEDLSKYKLDEDEDEDDADL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_976 DGEYDEFGRKKKKYRGKAVGPASILKEVEDKESEGEEEDEDEDLSKYKLDEDEDEDDADL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 SKYNLDASEEEDSNKKKSNRRSRSKSGSSHSRSSSRSSSPSSSRSRSRSRSRSSSSSQSR :::::::::::::::::::::::::: ::::::::::::::::::::::::::::::::: NP_976 SKYNLDASEEEDSNKKKSNRRSRSKSRSSHSRSSSRSSSPSSSRSRSRSRSRSSSSSQSR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 SRSSSRERSRSRGSKSRSSSRSHRGSSSPRKRSYSSSSSSPERNRKRSRSRSSSSGDRKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_976 SRSSSRERSRSRGSKSRSSSRSHRGSSSPRKRSYSSSSSSPERNRKRSRSRSSSSGDRKK 250 260 270 280 290 300 310 320 pF1KE3 RRTRSRSPESQVIGENTKQP ::::::::: NP_976 RRTRSRSPERRHRSSSGSSHSGSRSSSKKK 310 320 330 >>XP_006722006 (OMIM: 609434) PREDICTED: luc7-like prote (413 aa) initn: 995 init1: 192 opt: 322 Z-score: 186.5 bits: 43.1 E(85289): 0.0012 Smith-Waterman score: 322; 35.9% identity (64.6% similar) in 192 aa overlap (132-318:139-330) 110 120 130 140 150 160 pF1KE3 YGGGFNERENVEYIEREESDGEYDEFGRKKKKYRGKAVGPASILKEVEDKESEGEEEDED :.. : : :.. . : ... :: :.: XP_006 QEKQMEVCEVCGAFLIVGDAQSRVDDHLMGKQHMGYAKIKATVEELKEKLRKRTEEPDRD 110 120 130 140 150 160 170 180 190 200 210 pF1KE3 EDLSKYKLDEDEDEDDADLSKYNLDAS---EEEDSNKKKSNRRSRSKSGSSHSRSSSRSS : :.: : ...: : . . . . . . :::. .:... : : : . :.:: :::.: XP_006 ERLKKEKQEREEREKEREREREERERKRRREEEEREKERARDRERRKRSRSRSRHSSRTS 170 180 190 200 210 220 220 230 240 250 260 270 pF1KE3 SPSSSRSRSRSRSRSSSSSQSRSRSSSRERSRSRGS-KSRSSSRSHRGSSSPRKRSYSSS . ::::...:::: .::::. : ::..:. : :: ::..: :.: ..::. XP_006 DRRCSRSRDHKRSRSRERRRSRSRDRRRSRSHDRSERKHRSRSRDRRRSKSRDRKSYKHR 230 240 250 260 270 280 280 290 300 310 320 pF1KE3 SSSPERNRKR-SRSRSSSSGDRKKRRTRSRSPESQVIGENTKQP :.: .:.. : :. . . ..: :: ..: : :.: ::. XP_006 SKSRDREQDRKSKEKEKRGSDDKKSSVKSGSREKQSEDTNTESKESDTKNEVNGTSEDIK 290 300 310 320 330 340 XP_006 SEVQRKYAQMKMELSRVRRHTKASSEGKDSVVLQNILRYIVLSQLFCSRLVPPLVCLFGN 350 360 370 380 390 400 >>NP_006098 (OMIM: 609434) luc7-like protein 3 isoform 1 (432 aa) initn: 995 init1: 192 opt: 322 Z-score: 186.3 bits: 43.1 E(85289): 0.0012 Smith-Waterman score: 322; 35.9% identity (64.6% similar) in 192 aa overlap (132-318:215-406) 110 120 130 140 150 160 pF1KE3 YGGGFNERENVEYIEREESDGEYDEFGRKKKKYRGKAVGPASILKEVEDKESEGEEEDED :.. : : :.. . : ... :: :.: NP_006 QEKQMEVCEVCGAFLIVGDAQSRVDDHLMGKQHMGYAKIKATVEELKEKLRKRTEEPDRD 190 200 210 220 230 240 170 180 190 200 210 pF1KE3 EDLSKYKLDEDEDEDDADLSKYNLDAS---EEEDSNKKKSNRRSRSKSGSSHSRSSSRSS : :.: : ...: : . . . . . . :::. .:... : : : . :.:: :::.: NP_006 ERLKKEKQEREEREKEREREREERERKRRREEEEREKERARDRERRKRSRSRSRHSSRTS 250 260 270 280 290 300 220 230 240 250 260 270 pF1KE3 SPSSSRSRSRSRSRSSSSSQSRSRSSSRERSRSRGS-KSRSSSRSHRGSSSPRKRSYSSS . ::::...:::: .::::. : ::..:. : :: ::..: :.: ..::. NP_006 DRRCSRSRDHKRSRSRERRRSRSRDRRRSRSHDRSERKHRSRSRDRRRSKSRDRKSYKHR 310 320 330 340 350 360 280 290 300 310 320 pF1KE3 SSSPERNRKR-SRSRSSSSGDRKKRRTRSRSPESQVIGENTKQP :.: .:.. : :. . . ..: :: ..: : :.: ::. NP_006 SKSRDREQDRKSKEKEKRGSDDKKSSVKSGSREKQSEDTNTESKESDTKNEVNGTSEDIK 370 380 390 400 410 420 NP_006 SEGDTQSN 430 >>NP_057508 (OMIM: 609434) luc7-like protein 3 isoform 1 (432 aa) initn: 995 init1: 192 opt: 322 Z-score: 186.3 bits: 43.1 E(85289): 0.0012 Smith-Waterman score: 322; 35.9% identity (64.6% similar) in 192 aa overlap (132-318:215-406) 110 120 130 140 150 160 pF1KE3 YGGGFNERENVEYIEREESDGEYDEFGRKKKKYRGKAVGPASILKEVEDKESEGEEEDED :.. : : :.. . : ... :: :.: NP_057 QEKQMEVCEVCGAFLIVGDAQSRVDDHLMGKQHMGYAKIKATVEELKEKLRKRTEEPDRD 190 200 210 220 230 240 170 180 190 200 210 pF1KE3 EDLSKYKLDEDEDEDDADLSKYNLDAS---EEEDSNKKKSNRRSRSKSGSSHSRSSSRSS : :.: : ...: : . . . . . . :::. .:... : : : . :.:: :::.: NP_057 ERLKKEKQEREEREKEREREREERERKRRREEEEREKERARDRERRKRSRSRSRHSSRTS 250 260 270 280 290 300 220 230 240 250 260 270 pF1KE3 SPSSSRSRSRSRSRSSSSSQSRSRSSSRERSRSRGS-KSRSSSRSHRGSSSPRKRSYSSS . ::::...:::: .::::. : ::..:. : :: ::..: :.: ..::. NP_057 DRRCSRSRDHKRSRSRERRRSRSRDRRRSRSHDRSERKHRSRSRDRRRSKSRDRKSYKHR 310 320 330 340 350 360 280 290 300 310 320 pF1KE3 SSSPERNRKR-SRSRSSSSGDRKKRRTRSRSPESQVIGENTKQP :.: .:.. : :. . . ..: :: ..: : :.: ::. NP_057 SKSRDREQDRKSKEKEKRGSDDKKSSVKSGSREKQSEDTNTESKESDTKNEVNGTSEDIK 370 380 390 400 410 420 NP_057 SEGDTQSN 430 >>XP_005257506 (OMIM: 609434) PREDICTED: luc7-like prote (472 aa) initn: 995 init1: 192 opt: 322 Z-score: 185.7 bits: 43.2 E(85289): 0.0013 Smith-Waterman score: 322; 35.9% identity (64.6% similar) in 192 aa overlap (132-318:215-406) 110 120 130 140 150 160 pF1KE3 YGGGFNERENVEYIEREESDGEYDEFGRKKKKYRGKAVGPASILKEVEDKESEGEEEDED :.. : : :.. . : ... :: :.: XP_005 QEKQMEVCEVCGAFLIVGDAQSRVDDHLMGKQHMGYAKIKATVEELKEKLRKRTEEPDRD 190 200 210 220 230 240 170 180 190 200 210 pF1KE3 EDLSKYKLDEDEDEDDADLSKYNLDAS---EEEDSNKKKSNRRSRSKSGSSHSRSSSRSS : :.: : ...: : . . . . . . :::. .:... : : : . :.:: :::.: XP_005 ERLKKEKQEREEREKEREREREERERKRRREEEEREKERARDRERRKRSRSRSRHSSRTS 250 260 270 280 290 300 220 230 240 250 260 270 pF1KE3 SPSSSRSRSRSRSRSSSSSQSRSRSSSRERSRSRGS-KSRSSSRSHRGSSSPRKRSYSSS . ::::...:::: .::::. : ::..:. : :: ::..: :.: ..::. XP_005 DRRCSRSRDHKRSRSRERRRSRSRDRRRSRSHDRSERKHRSRSRDRRRSKSRDRKSYKHR 310 320 330 340 350 360 280 290 300 310 320 pF1KE3 SSSPERNRKR-SRSRSSSSGDRKKRRTRSRSPESQVIGENTKQP :.: .:.. : :. . . ..: :: ..: : :.: ::. XP_005 SKSRDREQDRKSKEKEKRGSDDKKSSVKSGSREKQSEDTNTESKESDTKNEVNGTSEDIK 370 380 390 400 410 420 XP_005 SEVQRKYAQMKMELSRVRRHTKASSEGKDSVVLQNILRTTVRRFLEEY 430 440 450 460 470 >>NP_001317259 (OMIM: 609434) luc7-like protein 3 isofor (489 aa) initn: 995 init1: 192 opt: 322 Z-score: 185.5 bits: 43.2 E(85289): 0.0014 Smith-Waterman score: 322; 35.9% identity (64.6% similar) in 192 aa overlap (132-318:215-406) 110 120 130 140 150 160 pF1KE3 YGGGFNERENVEYIEREESDGEYDEFGRKKKKYRGKAVGPASILKEVEDKESEGEEEDED :.. : : :.. . : ... :: :.: NP_001 QEKQMEVCEVCGAFLIVGDAQSRVDDHLMGKQHMGYAKIKATVEELKEKLRKRTEEPDRD 190 200 210 220 230 240 170 180 190 200 210 pF1KE3 EDLSKYKLDEDEDEDDADLSKYNLDAS---EEEDSNKKKSNRRSRSKSGSSHSRSSSRSS : :.: : ...: : . . . . . . :::. .:... : : : . :.:: :::.: NP_001 ERLKKEKQEREEREKEREREREERERKRRREEEEREKERARDRERRKRSRSRSRHSSRTS 250 260 270 280 290 300 220 230 240 250 260 270 pF1KE3 SPSSSRSRSRSRSRSSSSSQSRSRSSSRERSRSRGS-KSRSSSRSHRGSSSPRKRSYSSS . ::::...:::: .::::. : ::..:. : :: ::..: :.: ..::. NP_001 DRRCSRSRDHKRSRSRERRRSRSRDRRRSRSHDRSERKHRSRSRDRRRSKSRDRKSYKHR 310 320 330 340 350 360 280 290 300 310 320 pF1KE3 SSSPERNRKR-SRSRSSSSGDRKKRRTRSRSPESQVIGENTKQP :.: .:.. : :. . . ..: :: ..: : :.: ::. NP_001 SKSRDREQDRKSKEKEKRGSDDKKSSVKSGSREKQSEDTNTESKESDTKNEVNGTSEDIK 370 380 390 400 410 420 NP_001 SEVQRKYAQMKMELSRVRRHTKASSEGKDSVVLQNILRYIVLSQLFCSRLVPPLVCLFGN 430 440 450 460 470 480 >>NP_001278340 (OMIM: 182465,617140) protein SON isoform (2108 aa) initn: 490 init1: 221 opt: 326 Z-score: 178.6 bits: 44.0 E(85289): 0.0033 Smith-Waterman score: 326; 45.3% identity (67.9% similar) in 159 aa overlap (152-308:1781-1925) 130 140 150 160 170 180 pF1KE3 GEYDEFGRKKKKYRGKAVGPASILKEVEDKESEGEEEDEDEDLSKYKLDEDEDEDDADLS :: .::.:. : . : : : . : NP_001 GIEGPLLASDVGRDRSAASPVVSSMPERASESSSEEKDDYEIFVKVK-------DTHEKS 1760 1770 1780 1790 1800 190 200 210 220 230 240 pF1KE3 KYNLDASEEEDSNKKKSNRRSRSK-SGSSHSRSSSRSSSPSSSRSRSRSRSRSSSSSQSR : : . .. : .:. :. ::::: : ::. .: .:.: ::::.:.:: .:.: .:. NP_001 KKNKNRDKGEKEKKRDSSLRSRSKRSKSSEHKSRKRTSE---SRSRARKRSSKSKSHRSQ 1810 1820 1830 1840 1850 1860 250 260 270 280 290 pF1KE3 SRSSSRERSRSRGSKSRSSSRSHRG-SSSPRKRSYSSSSSSPERNRKRSRSRSSSSGDRK .:: :: : : :.:.:::.::..:. :. :::: . :.: ::.:::: ::. .:: NP_001 TRSRSRSRRRRRSSRSRSKSRGRRSVSKEKRKRSPKHRSKSRERKRKRSSSRD----NRK 1870 1880 1890 1900 1910 300 310 320 pF1KE3 KRRTRSRSPESQVIGENTKQP :.:::.: NP_001 TVRARSRTPSRRSRSHTPSRRRRSRSVGRRRSFSISPSRRSRTPSRRSRTPSRRSRTPSR 1920 1930 1940 1950 1960 1970 >>NP_115571 (OMIM: 182465,617140) protein SON isoform B (2303 aa) initn: 490 init1: 221 opt: 326 Z-score: 178.1 bits: 44.0 E(85289): 0.0035 Smith-Waterman score: 326; 45.3% identity (67.9% similar) in 159 aa overlap (152-308:1781-1925) 130 140 150 160 170 180 pF1KE3 GEYDEFGRKKKKYRGKAVGPASILKEVEDKESEGEEEDEDEDLSKYKLDEDEDEDDADLS :: .::.:. : . : : : . : NP_115 GIEGPLLASDVGRDRSAASPVVSSMPERASESSSEEKDDYEIFVKVK-------DTHEKS 1760 1770 1780 1790 1800 190 200 210 220 230 240 pF1KE3 KYNLDASEEEDSNKKKSNRRSRSK-SGSSHSRSSSRSSSPSSSRSRSRSRSRSSSSSQSR : : . .. : .:. :. ::::: : ::. .: .:.: ::::.:.:: .:.: .:. NP_115 KKNKNRDKGEKEKKRDSSLRSRSKRSKSSEHKSRKRTSE---SRSRARKRSSKSKSHRSQ 1810 1820 1830 1840 1850 1860 250 260 270 280 290 pF1KE3 SRSSSRERSRSRGSKSRSSSRSHRG-SSSPRKRSYSSSSSSPERNRKRSRSRSSSSGDRK .:: :: : : :.:.:::.::..:. :. :::: . :.: ::.:::: ::. .:: NP_115 TRSRSRSRRRRRSSRSRSKSRGRRSVSKEKRKRSPKHRSKSRERKRKRSSSRD----NRK 1870 1880 1890 1900 1910 300 310 320 pF1KE3 KRRTRSRSPESQVIGENTKQP :.:::.: NP_115 TVRARSRTPSRRSRSHTPSRRRRSRSVGRRRSFSISPSRRSRTPSRRSRTPSRRSRTPSR 1920 1930 1940 1950 1960 1970 >>NP_620305 (OMIM: 182465,617140) protein SON isoform F (2426 aa) initn: 490 init1: 221 opt: 326 Z-score: 177.8 bits: 44.0 E(85289): 0.0037 Smith-Waterman score: 326; 45.3% identity (67.9% similar) in 159 aa overlap (152-308:1781-1925) 130 140 150 160 170 180 pF1KE3 GEYDEFGRKKKKYRGKAVGPASILKEVEDKESEGEEEDEDEDLSKYKLDEDEDEDDADLS :: .::.:. : . : : : . : NP_620 GIEGPLLASDVGRDRSAASPVVSSMPERASESSSEEKDDYEIFVKVK-------DTHEKS 1760 1770 1780 1790 1800 190 200 210 220 230 240 pF1KE3 KYNLDASEEEDSNKKKSNRRSRSK-SGSSHSRSSSRSSSPSSSRSRSRSRSRSSSSSQSR : : . .. : .:. :. ::::: : ::. .: .:.: ::::.:.:: .:.: .:. NP_620 KKNKNRDKGEKEKKRDSSLRSRSKRSKSSEHKSRKRTSE---SRSRARKRSSKSKSHRSQ 1810 1820 1830 1840 1850 1860 250 260 270 280 290 pF1KE3 SRSSSRERSRSRGSKSRSSSRSHRG-SSSPRKRSYSSSSSSPERNRKRSRSRSSSSGDRK .:: :: : : :.:.:::.::..:. :. :::: . :.: ::.:::: ::. .:: NP_620 TRSRSRSRRRRRSSRSRSKSRGRRSVSKEKRKRSPKHRSKSRERKRKRSSSRD----NRK 1870 1880 1890 1900 1910 300 310 320 pF1KE3 KRRTRSRSPESQVIGENTKQP :.:::.: NP_620 TVRARSRTPSRRSRSHTPSRRRRSRSVGRRRSFSISPSRRSRTPSRRSRTPSRRSRTPSR 1920 1930 1940 1950 1960 1970 320 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 03:28:09 2016 done: Mon Nov 7 03:28:10 2016 Total Scan time: 9.300 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]