FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2557, 947 aa 1>>>pF1KE2557 947 - 947 aa - 947 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.1971+/-0.000922; mu= 16.2309+/- 0.056 mean_var=76.8036+/-15.660, 0's: 0 Z-trim(106.5): 25 B-trim: 510 in 1/50 Lambda= 0.146347 statistics sampled from 8970 (8991) to 8970 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.643), E-opt: 0.2 (0.276), width: 16 Scan time: 4.720 The best scores are: opt bits E(32554) CCDS65615.1 MOV10 gene_id:4343|Hs108|chr1 ( 947) 6393 1359.8 0 CCDS853.1 MOV10 gene_id:4343|Hs108|chr1 (1003) 6393 1359.9 0 CCDS54541.1 MOV10L1 gene_id:54456|Hs108|chr22 (1165) 932 206.9 1.9e-52 CCDS54542.1 MOV10L1 gene_id:54456|Hs108|chr22 (1165) 932 206.9 1.9e-52 CCDS14084.1 MOV10L1 gene_id:54456|Hs108|chr22 (1211) 932 206.9 2e-52 CCDS54543.1 MOV10L1 gene_id:54456|Hs108|chr22 ( 338) 640 145.1 2.2e-34 CCDS82192.1 HELZ gene_id:9931|Hs108|chr17 (1943) 361 86.4 5.9e-16 CCDS42374.1 HELZ gene_id:9931|Hs108|chr17 (1942) 299 73.3 5.2e-12 >>CCDS65615.1 MOV10 gene_id:4343|Hs108|chr1 (947 aa) initn: 6393 init1: 6393 opt: 6393 Z-score: 7287.9 bits: 1359.8 E(32554): 0 Smith-Waterman score: 6393; 100.0% identity (100.0% similar) in 947 aa overlap (1-947:1-947) 10 20 30 40 50 60 pF1KE2 MLYGMKIANLAYVTKTRVRFFRLDRWADVRFPEKRRMKLGSDISKHHKSLLAKIFYDRAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 MLYGMKIANLAYVTKTRVRFFRLDRWADVRFPEKRRMKLGSDISKHHKSLLAKIFYDRAE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 YLHGKHGVDVEVQGPHEARDGQLLIRLDLNRKEVLTLRLRNGGTQSVTLTHLFPLCRTPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 YLHGKHGVDVEVQGPHEARDGQLLIRLDLNRKEVLTLRLRNGGTQSVTLTHLFPLCRTPQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 FAFYNEDQELPCPLGPGECYELHVHCKTSFVGYFPATVLWELLGPGESGSEGAGTFYIAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 FAFYNEDQELPCPLGPGECYELHVHCKTSFVGYFPATVLWELLGPGESGSEGAGTFYIAR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 FLAAVAHSPLAAQLKPMTPFKRTRITGNPVVTNRIEEGERPDRAKGYDLELSMALGTYYP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 FLAAVAHSPLAAQLKPMTPFKRTRITGNPVVTNRIEEGERPDRAKGYDLELSMALGTYYP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 PPRLRQLLPMLLQGTSIFTAPKEIAEIKAQLETALKWRNYEVKLRLLLHLEELQMEHDIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 PPRLRQLLPMLLQGTSIFTAPKEIAEIKAQLETALKWRNYEVKLRLLLHLEELQMEHDIR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 HYDLESVPMTWDPVDQNPRLLTLEVPGVTESRPSVLRGDHLFALLSSETHQEDPITYKGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 HYDLESVPMTWDPVDQNPRLLTLEVPGVTESRPSVLRGDHLFALLSSETHQEDPITYKGF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 VHKVELDRVKLSFSMSLLSRFVDGLTFKVNFTFNRQPLRVQHRALELTGRWLLWPMLFPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 VHKVELDRVKLSFSMSLLSRFVDGLTFKVNFTFNRQPLRVQHRALELTGRWLLWPMLFPV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 APRDVPLLPSDVKLKLYDRSLESNPEQLQAMRHIVTGTTRPAPYIIFGPPGTGKTVTLVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 APRDVPLLPSDVKLKLYDRSLESNPEQLQAMRHIVTGTTRPAPYIIFGPPGTGKTVTLVE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 AIKQVVKHLPKAHILACAPSNSGADLLCQRLRVHLPSSIYRLLAPSRDIRMVPEDIKPCC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 AIKQVVKHLPKAHILACAPSNSGADLLCQRLRVHLPSSIYRLLAPSRDIRMVPEDIKPCC 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 NWDAKKGEYVFPAKKKLQEYRVLITTLITAGRLVSAQFPIDHFTHIFIDEAGHCMEPESL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 NWDAKKGEYVFPAKKKLQEYRVLITTLITAGRLVSAQFPIDHFTHIFIDEAGHCMEPESL 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 VAIAGLMEVKETGDPGGQLVLAGDPRQLGPVLRSPLTQKHGLGYSLLERLLTYNSLYKKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 VAIAGLMEVKETGDPGGQLVLAGDPRQLGPVLRSPLTQKHGLGYSLLERLLTYNSLYKKG 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 PDGYDPQFITKLLRNYRSHPTILDIPNQLYYEGELQACADVVDRERFCRWAGLPRQGFPI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 PDGYDPQFITKLLRNYRSHPTILDIPNQLYYEGELQACADVVDRERFCRWAGLPRQGFPI 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 IFHGVMGKDEREGNSPSFFNPEEAATVTSYLKLLLAPSSKKGKARLSPRSVGVISPYRKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 IFHGVMGKDEREGNSPSFFNPEEAATVTSYLKLLLAPSSKKGKARLSPRSVGVISPYRKQ 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE2 VEKIRYCITKLDRELRGLDDIKDLKVGSVEEFQGQERSVILISTVRSSQSFVQLDLDFNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 VEKIRYCITKLDRELRGLDDIKDLKVGSVEEFQGQERSVILISTVRSSQSFVQLDLDFNL 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE2 GFLKNPKRFNVAVTRAKALLIIVGNPLLLGHDPDWKVFLEFCKENGGYTGCPFPAKLDLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 GFLKNPKRFNVAVTRAKALLIIVGNPLLLGHDPDWKVFLEFCKENGGYTGCPFPAKLDLQ 850 860 870 880 890 900 910 920 930 940 pF1KE2 QGQNLLQGLSKLSPSTSGPHSHDYLPQEREGEGGLSLQVEPEWRNEL ::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 QGQNLLQGLSKLSPSTSGPHSHDYLPQEREGEGGLSLQVEPEWRNEL 910 920 930 940 >>CCDS853.1 MOV10 gene_id:4343|Hs108|chr1 (1003 aa) initn: 6393 init1: 6393 opt: 6393 Z-score: 7287.5 bits: 1359.9 E(32554): 0 Smith-Waterman score: 6393; 100.0% identity (100.0% similar) in 947 aa overlap (1-947:57-1003) 10 20 30 pF1KE2 MLYGMKIANLAYVTKTRVRFFRLDRWADVR :::::::::::::::::::::::::::::: CCDS85 DMETDRERLRTIYNRDFKISFGTPAPGFSSMLYGMKIANLAYVTKTRVRFFRLDRWADVR 30 40 50 60 70 80 40 50 60 70 80 90 pF1KE2 FPEKRRMKLGSDISKHHKSLLAKIFYDRAEYLHGKHGVDVEVQGPHEARDGQLLIRLDLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 FPEKRRMKLGSDISKHHKSLLAKIFYDRAEYLHGKHGVDVEVQGPHEARDGQLLIRLDLN 90 100 110 120 130 140 100 110 120 130 140 150 pF1KE2 RKEVLTLRLRNGGTQSVTLTHLFPLCRTPQFAFYNEDQELPCPLGPGECYELHVHCKTSF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 RKEVLTLRLRNGGTQSVTLTHLFPLCRTPQFAFYNEDQELPCPLGPGECYELHVHCKTSF 150 160 170 180 190 200 160 170 180 190 200 210 pF1KE2 VGYFPATVLWELLGPGESGSEGAGTFYIARFLAAVAHSPLAAQLKPMTPFKRTRITGNPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 VGYFPATVLWELLGPGESGSEGAGTFYIARFLAAVAHSPLAAQLKPMTPFKRTRITGNPV 210 220 230 240 250 260 220 230 240 250 260 270 pF1KE2 VTNRIEEGERPDRAKGYDLELSMALGTYYPPPRLRQLLPMLLQGTSIFTAPKEIAEIKAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 VTNRIEEGERPDRAKGYDLELSMALGTYYPPPRLRQLLPMLLQGTSIFTAPKEIAEIKAQ 270 280 290 300 310 320 280 290 300 310 320 330 pF1KE2 LETALKWRNYEVKLRLLLHLEELQMEHDIRHYDLESVPMTWDPVDQNPRLLTLEVPGVTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 LETALKWRNYEVKLRLLLHLEELQMEHDIRHYDLESVPMTWDPVDQNPRLLTLEVPGVTE 330 340 350 360 370 380 340 350 360 370 380 390 pF1KE2 SRPSVLRGDHLFALLSSETHQEDPITYKGFVHKVELDRVKLSFSMSLLSRFVDGLTFKVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 SRPSVLRGDHLFALLSSETHQEDPITYKGFVHKVELDRVKLSFSMSLLSRFVDGLTFKVN 390 400 410 420 430 440 400 410 420 430 440 450 pF1KE2 FTFNRQPLRVQHRALELTGRWLLWPMLFPVAPRDVPLLPSDVKLKLYDRSLESNPEQLQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 FTFNRQPLRVQHRALELTGRWLLWPMLFPVAPRDVPLLPSDVKLKLYDRSLESNPEQLQA 450 460 470 480 490 500 460 470 480 490 500 510 pF1KE2 MRHIVTGTTRPAPYIIFGPPGTGKTVTLVEAIKQVVKHLPKAHILACAPSNSGADLLCQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 MRHIVTGTTRPAPYIIFGPPGTGKTVTLVEAIKQVVKHLPKAHILACAPSNSGADLLCQR 510 520 530 540 550 560 520 530 540 550 560 570 pF1KE2 LRVHLPSSIYRLLAPSRDIRMVPEDIKPCCNWDAKKGEYVFPAKKKLQEYRVLITTLITA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 LRVHLPSSIYRLLAPSRDIRMVPEDIKPCCNWDAKKGEYVFPAKKKLQEYRVLITTLITA 570 580 590 600 610 620 580 590 600 610 620 630 pF1KE2 GRLVSAQFPIDHFTHIFIDEAGHCMEPESLVAIAGLMEVKETGDPGGQLVLAGDPRQLGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 GRLVSAQFPIDHFTHIFIDEAGHCMEPESLVAIAGLMEVKETGDPGGQLVLAGDPRQLGP 630 640 650 660 670 680 640 650 660 670 680 690 pF1KE2 VLRSPLTQKHGLGYSLLERLLTYNSLYKKGPDGYDPQFITKLLRNYRSHPTILDIPNQLY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 VLRSPLTQKHGLGYSLLERLLTYNSLYKKGPDGYDPQFITKLLRNYRSHPTILDIPNQLY 690 700 710 720 730 740 700 710 720 730 740 750 pF1KE2 YEGELQACADVVDRERFCRWAGLPRQGFPIIFHGVMGKDEREGNSPSFFNPEEAATVTSY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 YEGELQACADVVDRERFCRWAGLPRQGFPIIFHGVMGKDEREGNSPSFFNPEEAATVTSY 750 760 770 780 790 800 760 770 780 790 800 810 pF1KE2 LKLLLAPSSKKGKARLSPRSVGVISPYRKQVEKIRYCITKLDRELRGLDDIKDLKVGSVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 LKLLLAPSSKKGKARLSPRSVGVISPYRKQVEKIRYCITKLDRELRGLDDIKDLKVGSVE 810 820 830 840 850 860 820 830 840 850 860 870 pF1KE2 EFQGQERSVILISTVRSSQSFVQLDLDFNLGFLKNPKRFNVAVTRAKALLIIVGNPLLLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 EFQGQERSVILISTVRSSQSFVQLDLDFNLGFLKNPKRFNVAVTRAKALLIIVGNPLLLG 870 880 890 900 910 920 880 890 900 910 920 930 pF1KE2 HDPDWKVFLEFCKENGGYTGCPFPAKLDLQQGQNLLQGLSKLSPSTSGPHSHDYLPQERE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 HDPDWKVFLEFCKENGGYTGCPFPAKLDLQQGQNLLQGLSKLSPSTSGPHSHDYLPQERE 930 940 950 960 970 980 940 pF1KE2 GEGGLSLQVEPEWRNEL ::::::::::::::::: CCDS85 GEGGLSLQVEPEWRNEL 990 1000 >>CCDS54541.1 MOV10L1 gene_id:54456|Hs108|chr22 (1165 aa) initn: 1087 init1: 322 opt: 932 Z-score: 1055.1 bits: 206.9 E(32554): 1.9e-52 Smith-Waterman score: 1195; 33.1% identity (56.4% similar) in 825 aa overlap (176-922:436-1161) 150 160 170 180 190 200 pF1KE2 CKTSFVGYFPATVLWELLGPGESGSEGAGTFYIARFLAAVAHSPLAAQLKPMTPFKRTRI : :.:.: . . : . . ::. .. CCDS54 PPGGKTFIVVICDGKNPGRCKELLLLCFSDFLIGRYLEVNVISGEESLIAAREPFSWKKL 410 420 430 440 450 460 210 220 230 240 250 260 pF1KE2 TGNPVVTNRIEEGERPDRAKGYDLELSMALGTYYPPPRLRQLLPMLLQGTSIFTAPKEIA .. ..:. . .. .: : : : :::. . : .:.: .: CCDS54 KSSQALTSAKTTVVVTAQKRNSRRQLPSFLPQYPIPDRLRKCVE---QKIDILTFQPLLA 470 480 490 500 510 520 270 280 290 300 310 320 pF1KE2 EIKAQLETALKWRNYEVKLRLLLHLEELQMEHDIRHYDLESVPMTWDPVDQNPRLLTLEV :. :. ::. :. :: :::. : ....:.. .. . .: ::.::: CCDS54 EL-------LNMSNYKEKFSTLLWLEEIYAEMELKEYNMSGIILR-----RNGDLLVLEV 530 540 550 560 570 330 340 350 360 370 380 pF1KE2 PGVTESRPSVLRGDHLFALLSSETHQEDPITYKGFVHKVELDRVKLSFSMSLLSRFVDGL ::..:.:::. ::.: .:... .. : : ..: ... . : :... .: .. CCDS54 PGLAEGRPSLYAGDKL--ILKTQEYNGHAIEYISYVTEIHEEDVTLKIN----PEFEQAY 580 590 600 610 620 390 400 410 pF1KE2 TFK---VNFTFNRQPLRVQHRALELT---GRWLLWP----MLFP---------------- .:. :.::.:: : : ::: . : .:.: . : CCDS54 NFEPMDVEFTYNRTTSRRCHFALEHVIHLGVKVLFPEEIILQSPQVTGNWNHAQDTKSSG 630 640 650 660 670 680 420 430 440 pF1KE2 -----------------------VAPRDVPLL----------------PSDVKLKLYDRS :. .:.:.: :. :..... CCDS54 QSTSKKNRKTMTDQAEHGTEERRVGDKDLPVLAPFTAEMSDWVDEIQTPKARKMEFFNPV 690 700 710 720 730 740 450 460 470 480 490 500 pF1KE2 LESNPEQLQAMRHIVTGTTRPAPYIIFGPPGTGKTVTLVEAIKQVVKHLPKAHILACAPS :. : : :...:..: :: :::.:::::::::::..::. :: :: ..::.:::: CCDS54 LNEN--QKLAVKRILSGDCRPLPYILFGPPGTGKTVTIIEAVLQVHFALPDSRILVCAPS 750 760 770 780 790 800 510 520 530 540 550 pF1KE2 NSGADLLCQRL---RVHLPSSIYRLLAPSRDIRMVPEDIKPCCNWDAKKGEYVFPAKKKL ::.:::.: :: .: :... :. : : ..: . .:: : . :: .. :.. CCDS54 NSAADLVCLRLHESKVLQPATMVRVNATCRFEEIVIDAVKPYC----RDGEDIWKASR-- 810 820 830 840 850 560 570 580 590 600 610 pF1KE2 QEYRVLITTLITAGRLVSAQFPIDHFTHIFIDEAGHCMEPESLVAIAGLMEVKETGDPGG .:..::: ..: . . . ::::.:.::::. ::: :. . ::: .: .: CCDS54 --FRIIITTCSSSGLFYQIGVRVGHFTHVFVDEAGQASEPECLIPL-GLM-----SDISG 860 870 880 890 900 620 630 640 650 660 670 pF1KE2 QLVLAGDPRQLGPVLRSPLTQKHGLGYSLLERLLTYNSLYKKGPDGY------DPQFITK :.:::::: :::::..: :.. .::. :.::::.. . :.. ... .: ..:: CCDS54 QIVLAGDPMQLGPVIKSRLAMAYGLNVSFLERLMSRPA-YQRDENAFGACGAHNPLLVTK 910 920 930 940 950 960 680 690 700 710 720 730 pF1KE2 LLRNYRSHPTILDIPNQLYYEGELQACADVVDRERFCRWAGLPRQGFPIIFHGVMGKDER :..::::: ..: .:..:.:. ::..::: . . : ::..:::.::::: :.. : CCDS54 LVKNYRSHEALLMLPSRLFYHRELEVCADPTVVTSLLGWEKLPKKGFPLIFHGVRGSEAR 970 980 990 1000 1010 1020 740 750 760 770 780 790 pF1KE2 EGNSPSFFNPEEAATVTSYLKLLLAPSSKKGKARLSPRSVGVISPYRKQVEKIRYCITKL ::.:::.::: ::. : : :: ... ....: ..:::.:::::::::: CCDS54 EGKSPSWFNPAEAVQVLRYCCLL----AHSISSQVSASDIGVITPYRKQVEKIRIL---- 1030 1040 1050 1060 1070 800 810 820 830 840 850 pF1KE2 DRELRGLDDIKDLKVGSVEEFQGQERSVILISTVRSSQSFVQLDLDFNLGFLKNPKRFNV ::..: . :.:::::::::::: ::.::: CCDS54 ---LRNVD-LMDIKVGSVEEFQGQEYLVIIIST--------------------------- 1080 1090 1100 860 870 880 890 900 910 pF1KE2 AVTRAKALLIIVGNPLLLGHDPDWKVFLEFCKENGGYTGCPFPAKLDLQQGQNLLQGLSK :: . ..::. :: : :: .: ::. :: .:.. CCDS54 --------------------DPCFGALLEYSITNGVYMGCDLPPA--LQSLQNCGEGVAD 1110 1120 1130 1140 920 930 940 pF1KE2 LS----PSTSGPHSHDYLPQEREGEGGLSLQVEPEWRNEL : : ..::..: CCDS54 PSYPVVPESTGPEKHQEPS 1150 1160 >>CCDS54542.1 MOV10L1 gene_id:54456|Hs108|chr22 (1165 aa) initn: 1172 init1: 322 opt: 932 Z-score: 1055.1 bits: 206.9 E(32554): 1.9e-52 Smith-Waterman score: 1347; 36.5% identity (60.9% similar) in 768 aa overlap (176-869:416-1132) 150 160 170 180 190 200 pF1KE2 CKTSFVGYFPATVLWELLGPGESGSEGAGTFYIARFLAAVAHSPLAAQLKPMTPFKRTRI : :.:.: . . : . . ::. .. CCDS54 PPGGKTFIVVICDGKNPGRCKELLLLCFSDFLIGRYLEVNVISGEESLIAAREPFSWKKL 390 400 410 420 430 440 210 220 230 240 250 260 pF1KE2 TGNPVVTNRIEEGERPDRAKGYDLELSMALGTYYPPPRLRQLLPMLLQGTSIFTAPKEIA .. ..:. . .. .: : : : :::. . : .:.: .: CCDS54 KSSQALTSAKTTVVVTAQKRNSRRQLPSFLPQYPIPDRLRKCVE---QKIDILTFQPLLA 450 460 470 480 490 500 270 280 290 300 310 320 pF1KE2 EIKAQLETALKWRNYEVKLRLLLHLEELQMEHDIRHYDLESVPMTWDPVDQNPRLLTLEV :. :. ::. :. :: :::. : ....:.. .. . .: ::.::: CCDS54 EL-------LNMSNYKEKFSTLLWLEEIYAEMELKEYNMSGIILR-----RNGDLLVLEV 510 520 530 540 550 330 340 350 360 370 380 pF1KE2 PGVTESRPSVLRGDHLFALLSSETHQEDPITYKGFVHKVELDRVKLSFSMSLLSRFVDGL ::..:.:::. ::.: .:... .. : : ..: ... . : :... .: .. CCDS54 PGLAEGRPSLYAGDKL--ILKTQEYNGHAIEYISYVTEIHEEDVTLKIN----PEFEQAY 560 570 580 590 600 390 400 410 pF1KE2 TFK---VNFTFNRQPLRVQHRALELT---GRWLLWP----MLFP---------------- .:. :.::.:: : : ::: . : .:.: . : CCDS54 NFEPMDVEFTYNRTTSRRCHFALEHVIHLGVKVLFPEEIILQSPQVTGNWNHAQDTKSSG 610 620 630 640 650 660 420 430 440 pF1KE2 -----------------------VAPRDVPLL----------------PSDVKLKLYDRS :. .:.:.: :. :..... CCDS54 QSTSKKNRKTMTDQAEHGTEERRVGDKDLPVLAPFTAEMSDWVDEIQTPKARKMEFFNPV 670 680 690 700 710 720 450 460 470 480 490 500 pF1KE2 LESNPEQLQAMRHIVTGTTRPAPYIIFGPPGTGKTVTLVEAIKQVVKHLPKAHILACAPS : : .: :...:..: :: :::.:::::::::::..::. :: :: ..::.:::: CCDS54 L--NENQKLAVKRILSGDCRPLPYILFGPPGTGKTVTIIEAVLQVHFALPDSRILVCAPS 730 740 750 760 770 780 510 520 530 540 550 pF1KE2 NSGADLLCQRL---RVHLPSSIYRLLAPSRDIRMVPEDIKPCCNWDAKKGEYVFPAKKKL ::.:::.: :: .: :... :. : : ..: . .:: : . :: .. :.. CCDS54 NSAADLVCLRLHESKVLQPATMVRVNATCRFEEIVIDAVKPYC----RDGEDIWKASR-- 790 800 810 820 830 560 570 580 590 600 610 pF1KE2 QEYRVLITTLITAGRLVSAQFPIDHFTHIFIDEAGHCMEPESLVAIAGLMEVKETGDPGG .:..::: ..: . . . ::::.:.::::. ::: :. . ::: .: .: CCDS54 --FRIIITTCSSSGLFYQIGVRVGHFTHVFVDEAGQASEPECLIPL-GLM-----SDISG 840 850 860 870 880 620 630 640 650 660 670 pF1KE2 QLVLAGDPRQLGPVLRSPLTQKHGLGYSLLERLLTYNSLYKKGPDGY------DPQFITK :.:::::: :::::..: :.. .::. :.::::.. . :.. ... .: ..:: CCDS54 QIVLAGDPMQLGPVIKSRLAMAYGLNVSFLERLMSRPA-YQRDENAFGACGAHNPLLVTK 890 900 910 920 930 940 680 690 700 710 720 730 pF1KE2 LLRNYRSHPTILDIPNQLYYEGELQACADVVDRERFCRWAGLPRQGFPIIFHGVMGKDER :..::::: ..: .:..:.:. ::..::: . . : ::..:::.::::: :.. : CCDS54 LVKNYRSHEALLMLPSRLFYHRELEVCADPTVVTSLLGWEKLPKKGFPLIFHGVRGSEAR 950 960 970 980 990 1000 740 750 760 770 780 790 pF1KE2 EGNSPSFFNPEEAATVTSYLKLLLAPSSKKGKARLSPRSVGVISPYRKQVEKIRYCITKL ::.:::.::: ::. : : :: ... ....: ..:::.:::::::::: CCDS54 EGKSPSWFNPAEAVQVLRYCCLL----AHSISSQVSASDIGVITPYRKQVEKIRIL---- 1010 1020 1030 1040 1050 800 810 820 830 840 850 pF1KE2 DRELRGLDDIKDLKVGSVEEFQGQERSVILISTVRSSQSFVQLDLDFNLGFLKNPKRFNV ::..: . :.:::::::::::: ::.::::::... . : : ::::.: ::::: CCDS54 ---LRNVD-LMDIKVGSVEEFQGQEYLVIIISTVRSNEDRFEDDRYF-LGFLSNSKRFNV 1060 1070 1080 1090 1100 1110 860 870 880 890 900 910 pF1KE2 AVTRAKALLIIVGNPLLLGHDPDWKVFLEFCKENGGYTGCPFPAKLDLQQGQNLLQGLSK :.:: :::::..::: .: CCDS54 AITRPKALLIVLGNPHVLVRLWRGGGRPLLPSGARIHRTREASGAQLICSG 1120 1130 1140 1150 1160 >>CCDS14084.1 MOV10L1 gene_id:54456|Hs108|chr22 (1211 aa) initn: 1171 init1: 322 opt: 932 Z-score: 1054.8 bits: 206.9 E(32554): 2e-52 Smith-Waterman score: 1451; 36.4% identity (60.8% similar) in 825 aa overlap (176-922:436-1207) 150 160 170 180 190 200 pF1KE2 CKTSFVGYFPATVLWELLGPGESGSEGAGTFYIARFLAAVAHSPLAAQLKPMTPFKRTRI : :.:.: . . : . . ::. .. CCDS14 PPGGKTFIVVICDGKNPGRCKELLLLCFSDFLIGRYLEVNVISGEESLIAAREPFSWKKL 410 420 430 440 450 460 210 220 230 240 250 260 pF1KE2 TGNPVVTNRIEEGERPDRAKGYDLELSMALGTYYPPPRLRQLLPMLLQGTSIFTAPKEIA .. ..:. . .. .: : : : :::. . : .:.: .: CCDS14 KSSQALTSAKTTVVVTAQKRNSRRQLPSFLPQYPIPDRLRKCVE---QKIDILTFQPLLA 470 480 490 500 510 520 270 280 290 300 310 320 pF1KE2 EIKAQLETALKWRNYEVKLRLLLHLEELQMEHDIRHYDLESVPMTWDPVDQNPRLLTLEV :. :. ::. :. :: :::. : ....:.. .. . .: ::.::: CCDS14 EL-------LNMSNYKEKFSTLLWLEEIYAEMELKEYNMSGIILR-----RNGDLLVLEV 530 540 550 560 570 330 340 350 360 370 380 pF1KE2 PGVTESRPSVLRGDHLFALLSSETHQEDPITYKGFVHKVELDRVKLSFSMSLLSRFVDGL ::..:.:::. ::.: .:... .. : : ..: ... . : :... .: .. CCDS14 PGLAEGRPSLYAGDKL--ILKTQEYNGHAIEYISYVTEIHEEDVTLKIN----PEFEQAY 580 590 600 610 620 390 400 410 pF1KE2 TFK---VNFTFNRQPLRVQHRALELT---GRWLLWP----MLFP---------------- .:. :.::.:: : : ::: . : .:.: . : CCDS14 NFEPMDVEFTYNRTTSRRCHFALEHVIHLGVKVLFPEEIILQSPQVTGNWNHAQDTKSSG 630 640 650 660 670 680 420 430 440 pF1KE2 -----------------------VAPRDVPLL----------------PSDVKLKLYDRS :. .:.:.: :. :..... CCDS14 QSTSKKNRKTMTDQAEHGTEERRVGDKDLPVLAPFTAEMSDWVDEIQTPKARKMEFFNPV 690 700 710 720 730 740 450 460 470 480 490 500 pF1KE2 LESNPEQLQAMRHIVTGTTRPAPYIIFGPPGTGKTVTLVEAIKQVVKHLPKAHILACAPS :. : : :...:..: :: :::.:::::::::::..::. :: :: ..::.:::: CCDS14 LNEN--QKLAVKRILSGDCRPLPYILFGPPGTGKTVTIIEAVLQVHFALPDSRILVCAPS 750 760 770 780 790 800 510 520 530 540 550 pF1KE2 NSGADLLCQRL---RVHLPSSIYRLLAPSRDIRMVPEDIKPCCNWDAKKGEYVFPAKKKL ::.:::.: :: .: :... :. : : ..: . .:: : . :: .. :.. CCDS14 NSAADLVCLRLHESKVLQPATMVRVNATCRFEEIVIDAVKPYC----RDGEDIWKASR-- 810 820 830 840 850 560 570 580 590 600 610 pF1KE2 QEYRVLITTLITAGRLVSAQFPIDHFTHIFIDEAGHCMEPESLVAIAGLMEVKETGDPGG .:..::: ..: . . . ::::.:.::::. ::: :. . ::: .: .: CCDS14 --FRIIITTCSSSGLFYQIGVRVGHFTHVFVDEAGQASEPECLIPL-GLM-----SDISG 860 870 880 890 900 620 630 640 650 660 670 pF1KE2 QLVLAGDPRQLGPVLRSPLTQKHGLGYSLLERLLTYNSLYKKGPDGY------DPQFITK :.:::::: :::::..: :.. .::. :.::::.. . :.. ... .: ..:: CCDS14 QIVLAGDPMQLGPVIKSRLAMAYGLNVSFLERLMSRPA-YQRDENAFGACGAHNPLLVTK 910 920 930 940 950 960 680 690 700 710 720 730 pF1KE2 LLRNYRSHPTILDIPNQLYYEGELQACADVVDRERFCRWAGLPRQGFPIIFHGVMGKDER :..::::: ..: .:..:.:. ::..::: . . : ::..:::.::::: :.. : CCDS14 LVKNYRSHEALLMLPSRLFYHRELEVCADPTVVTSLLGWEKLPKKGFPLIFHGVRGSEAR 970 980 990 1000 1010 1020 740 750 760 770 780 790 pF1KE2 EGNSPSFFNPEEAATVTSYLKLLLAPSSKKGKARLSPRSVGVISPYRKQVEKIRYCITKL ::.:::.::: ::. : : :: ... ....: ..:::.:::::::::: CCDS14 EGKSPSWFNPAEAVQVLRYCCLL----AHSISSQVSASDIGVITPYRKQVEKIRIL---- 1030 1040 1050 1060 1070 800 810 820 830 840 850 pF1KE2 DRELRGLDDIKDLKVGSVEEFQGQERSVILISTVRSSQSFVQLDLDFNLGFLKNPKRFNV ::..: . :.:::::::::::: ::.::::::... . : : ::::.: ::::: CCDS14 ---LRNVD-LMDIKVGSVEEFQGQEYLVIIISTVRSNEDRFEDDRYF-LGFLSNSKRFNV 1080 1090 1100 1110 1120 1130 860 870 880 890 900 910 pF1KE2 AVTRAKALLIIVGNPLLLGHDPDWKVFLEFCKENGGYTGCPFPAKLDLQQGQNLLQGLSK :.:: :::::..::: .: .:: . ..::. :: : :: .: ::. :: .:.. CCDS14 AITRPKALLIVLGNPHVLVRDPCFGALLEYSITNGVYMGCDLPPA--LQSLQNCGEGVAD 1140 1150 1160 1170 1180 1190 920 930 940 pF1KE2 LS----PSTSGPHSHDYLPQEREGEGGLSLQVEPEWRNEL : : ..::..: CCDS14 PSYPVVPESTGPEKHQEPS 1200 1210 >>CCDS54543.1 MOV10L1 gene_id:54456|Hs108|chr22 (338 aa) initn: 793 init1: 322 opt: 640 Z-score: 730.6 bits: 145.1 E(32554): 2.2e-34 Smith-Waterman score: 985; 47.6% identity (70.7% similar) in 355 aa overlap (578-922:2-334) 550 560 570 580 590 600 pF1KE2 EYVFPAKKKLQEYRVLITTLITAGRLVSAQFPIDHFTHIFIDEAGHCMEPESLVAIAGLM : . ::::.:.::::. ::: :. . ::: CCDS54 MFRVGHFTHVFVDEAGQASEPECLIPL-GLM 10 20 30 610 620 630 640 650 660 pF1KE2 EVKETGDPGGQLVLAGDPRQLGPVLRSPLTQKHGLGYSLLERLLTYNSLYKKGPDGY--- .: .::.:::::: :::::..: :.. .::. :.::::.. . :.. ... CCDS54 -----SDISGQIVLAGDPMQLGPVIKSRLAMAYGLNVSFLERLMSRPA-YQRDENAFGAC 40 50 60 70 80 670 680 690 700 710 720 pF1KE2 ---DPQFITKLLRNYRSHPTILDIPNQLYYEGELQACADVVDRERFCRWAGLPRQGFPII .: ..:::..::::: ..: .:..:.:. ::..::: . . : ::..:::.: CCDS54 GAHNPLLVTKLVKNYRSHEALLMLPSRLFYHRELEVCADPTVVTSLLGWEKLPKKGFPLI 90 100 110 120 130 140 730 740 750 760 770 780 pF1KE2 FHGVMGKDEREGNSPSFFNPEEAATVTSYLKLLLAPSSKKGKARLSPRSVGVISPYRKQV :::: :.. :::.:::.::: ::. : : :: : ...: ..:::.:::::: CCDS54 FHGVRGSEAREGKSPSWFNPAEAVQVLRYCCLLAHSIS----SQVSASDIGVITPYRKQV 150 160 170 180 190 200 790 800 810 820 830 840 pF1KE2 EKIRYCITKLDRELRGLDDIKDLKVGSVEEFQGQERSVILISTVRSSQSFVQLDLDFNLG :::: ::..: . :.:::::::::::: ::.::::::... . : : :: CCDS54 EKIRIL-------LRNVD-LMDIKVGSVEEFQGQEYLVIIISTVRSNEDRFEDDRYF-LG 210 220 230 240 250 850 860 870 880 890 900 pF1KE2 FLKNPKRFNVAVTRAKALLIIVGNPLLLGHDPDWKVFLEFCKENGGYTGCPFPAKLDLQQ ::.: ::::::.:: :::::..::: .: .:: . ..::. :: : :: .: : :. CCDS54 FLSNSKRFNVAITRPKALLIVLGNPHVLVRDPCFGALLEYSITNGVYMGCDLPPAL--QS 260 270 280 290 300 910 920 930 940 pF1KE2 GQNLLQGLSKLS----PSTSGPHSHDYLPQEREGEGGLSLQVEPEWRNEL :: .:.. : : ..::..: CCDS54 LQNCGEGVADPSYPVVPESTGPEKHQEPS 310 320 330 >>CCDS82192.1 HELZ gene_id:9931|Hs108|chr17 (1943 aa) initn: 535 init1: 150 opt: 361 Z-score: 399.9 bits: 86.4 E(32554): 5.9e-16 Smith-Waterman score: 661; 29.8% identity (59.5% similar) in 570 aa overlap (388-927:590-1111) 360 370 380 390 400 410 pF1KE2 KGFVHKVELDRVKLSFSMSLLSRFVDGLTFKVNFTFNRQPLRVQHRALE-LTGRWLLWPM ...: .:: :: .: ::. . .:.: CCDS82 EEKTKEYIFLRLSRECCEELNLRPDCDTQVELQFQLNRLPLCEMHYALDRIKDNGVLFPD 560 570 580 590 600 610 420 430 440 450 460 470 pF1KE2 LFPVAPRDVPLLPSDVKLKLYDRSLES--NPEQLQAMRHIVTGTT-RPAPYIIFGPPGTG . ..: .: :. . .:..:. : .: .:. :.: . . : .:.:: ::: CCDS82 I-SMTPT-IPWSPN----RQWDEQLDPRLNAKQKEAVLAITTPLAIQLPPVLIIGPYGTG 620 630 640 650 660 670 480 490 500 510 520 pF1KE2 KTVTLVEAIKQVVKHLPKAHILACAPSNSGADL-----LCQRLRVHLPSS-IYRLLAPSR :: ::..:.:..... ..:: :. :::.::: : ... :.. :. .: CCDS82 KTFTLAQAVKHILQQQETSRILICTHSNSAADLYIKDYLHPYVEAGNPQARPLRVYFRNR 680 690 700 710 720 730 530 540 550 560 570 580 pF1KE2 DIRMVPEDIKPCCNWDAKKGEYVFPAKKKLQEYRVLITTLITAGRLVSAQFPIDHFTHIF .. : .. : .. .. . .: :. . ..::...:: :. : . .. ::::. CCDS82 WVKTVHPVVHQYCLISSAHSTFQMPQKEDILKHRVVVVTLNTSQYLCQLDLEPGFFTHIL 740 750 760 770 780 790 590 600 610 620 630 640 pF1KE2 IDEAGHCMEPESLVAIAGLMEVKETGDPGGQLVLAGDPRQLGPVLRSPLTQKHGLGYSLL .:::.. :: :... .: . ...: ..::::: ::.: . : ......: ::: CCDS82 LDEAAQAMECETIMPLA--LATQNT-----RIVLAGDHMQLSPFVYSEFARERNLHVSLL 800 810 820 830 840 650 660 670 680 690 700 pF1KE2 ERLLTYNSLYKKGPDGYDPQFITKLLRNYRSHPTILDIPNQLYYEGELQACADVVDRERF .:: :.. : . : : : .::::: .:.. ..:.:::.:.: . .. : CCDS82 DRL------YEHYPAEF-PCRIL-LCENYRSHEAIINYTSELFYEGKLMASGKQPAHKDF 850 860 870 880 890 710 720 730 740 750 760 pF1KE2 CRWAGLPRQGFPIIFHGVMGKDEREGNSPSFFNPEEAATVTSYLKLLLAPSSKKGKARLS .:. : . :.: .: :: .:.: :. :. .. : . . ..:. CCDS82 ----------YPLTFFTARGEDVQEKNSTAFYNNAEVFEVVERVEEL-RRKWPVAWGKLD 900 910 920 930 940 770 780 790 800 810 820 pF1KE2 PRSVGVISPYRKQVEKIRYCITKLDRELRGLDDIKDLKVGSVEEFQGQERSVILISTVRS :.::..:: :: .:: ::: ..:..: : . ::.. :...::::. CCDS82 DGSIGVVTPYADQVFRIR-------AELRK-KRLSDVNVERVLNVQGKQFRVLFLSTVRT 950 960 970 980 990 830 840 850 860 pF1KE2 ------SQSFV----QL------DLDFNLGFLKNPKRFNVAVTRAKALLIIVGNPLLL-- .:. . :: :::. :::.: : .:.:.:::..:. .::.:. : CCDS82 RHTCKHKQTPIKKKEQLLEDSTEDLDY--GFLSNYKLLNTAITRAQSLVAVVGDPIALCS 1000 1010 1020 1030 1040 1050 870 880 890 900 910 920 pF1KE2 -GHDPD-WKVFLEFCKENGGYTGCPFPAKLDLQQGQNLLQGLSKLSPSTSGPHSHDYLPQ :. :. :. .:.::.. : : .: . :..: . . .: . ...:. CCDS82 IGRCRKFWERFIALCHENSSLHGITF------EQIKAQLEALELKKTYVLNPLAPEFIPR 1060 1070 1080 1090 1100 1110 930 940 pF1KE2 EREGEGGLSLQVEPEWRNEL CCDS82 ALRLQHSGSTNKQQQSPPKGKSLHHTQNDHFQNDGIVQPNPSVLIGNPIRAYTPPPPLGP 1120 1130 1140 1150 1160 1170 >>CCDS42374.1 HELZ gene_id:9931|Hs108|chr17 (1942 aa) initn: 509 init1: 104 opt: 299 Z-score: 329.1 bits: 73.3 E(32554): 5.2e-12 Smith-Waterman score: 652; 29.8% identity (59.6% similar) in 570 aa overlap (388-927:590-1110) 360 370 380 390 400 410 pF1KE2 KGFVHKVELDRVKLSFSMSLLSRFVDGLTFKVNFTFNRQPLRVQHRALE-LTGRWLLWPM ...: .:: :: .: ::. . .:.: CCDS42 EEKTKEYIFLRLSRECCEELNLRPDCDTQVELQFQLNRLPLCEMHYALDRIKDNGVLFPD 560 570 580 590 600 610 420 430 440 450 460 470 pF1KE2 LFPVAPRDVPLLPSDVKLKLYDRSLES--NPEQLQAMRHIVTGTT-RPAPYIIFGPPGTG . ..: .: :. . .:..:. : .: .:. :.: . . : .:.:: ::: CCDS42 I-SMTPT-IPWSPN----RQWDEQLDPRLNAKQKEAVLAITTPLAIQLPPVLIIGPYGTG 620 630 640 650 660 670 480 490 500 510 520 pF1KE2 KTVTLVEAIKQVVKHLPKAHILACAPSNSGADL-----LCQRLRVHLPSS-IYRLLAPSR :: ::..:.:..... ...:: :. :::.::: : ... :.. :. .: CCDS42 KTFTLAQAVKHILQQ-QETRILICTHSNSAADLYIKDYLHPYVEAGNPQARPLRVYFRNR 680 690 700 710 720 730 530 540 550 560 570 580 pF1KE2 DIRMVPEDIKPCCNWDAKKGEYVFPAKKKLQEYRVLITTLITAGRLVSAQFPIDHFTHIF .. : .. : .. .. . .: :. . ..::...:: :. : . .. ::::. CCDS42 WVKTVHPVVHQYCLISSAHSTFQMPQKEDILKHRVVVVTLNTSQYLCQLDLEPGFFTHIL 740 750 760 770 780 790 590 600 610 620 630 640 pF1KE2 IDEAGHCMEPESLVAIAGLMEVKETGDPGGQLVLAGDPRQLGPVLRSPLTQKHGLGYSLL .:::.. :: :... .: . ...: ..::::: ::.: . : ......: ::: CCDS42 LDEAAQAMECETIMPLA--LATQNT-----RIVLAGDHMQLSPFVYSEFARERNLHVSLL 800 810 820 830 840 650 660 670 680 690 700 pF1KE2 ERLLTYNSLYKKGPDGYDPQFITKLLRNYRSHPTILDIPNQLYYEGELQACADVVDRERF .:: :.. : . : : : .::::: .:.. ..:.:::.:.: . .. : CCDS42 DRL------YEHYPAEF-PCRIL-LCENYRSHEAIINYTSELFYEGKLMASGKQPAHKDF 850 860 870 880 890 710 720 730 740 750 760 pF1KE2 CRWAGLPRQGFPIIFHGVMGKDEREGNSPSFFNPEEAATVTSYLKLLLAPSSKKGKARLS .:. : . :.: .: :: .:.: :. :. .. : . . ..:. CCDS42 ----------YPLTFFTARGEDVQEKNSTAFYNNAEVFEVVERVEEL-RRKWPVAWGKLD 900 910 920 930 940 770 780 790 800 810 820 pF1KE2 PRSVGVISPYRKQVEKIRYCITKLDRELRGLDDIKDLKVGSVEEFQGQERSVILISTVRS :.::..:: :: .:: ::: ..:..: : . ::.. :...::::. CCDS42 DGSIGVVTPYADQVFRIR-------AELRK-KRLSDVNVERVLNVQGKQFRVLFLSTVRT 950 960 970 980 990 830 840 850 860 pF1KE2 ------SQSFV----QL------DLDFNLGFLKNPKRFNVAVTRAKALLIIVGNPLLL-- .:. . :: :::. :::.: : .:.:.:::..:. .::.:. : CCDS42 RHTCKHKQTPIKKKEQLLEDSTEDLDY--GFLSNYKLLNTAITRAQSLVAVVGDPIALCS 1000 1010 1020 1030 1040 1050 870 880 890 900 910 920 pF1KE2 -GHDPD-WKVFLEFCKENGGYTGCPFPAKLDLQQGQNLLQGLSKLSPSTSGPHSHDYLPQ :. :. :. .:.::.. : : .: . :..: . . .: . ...:. CCDS42 IGRCRKFWERFIALCHENSSLHGITF------EQIKAQLEALELKKTYVLNPLAPEFIPR 1060 1070 1080 1090 1100 1110 930 940 pF1KE2 EREGEGGLSLQVEPEWRNEL CCDS42 ALRLQHSGSTNKQQQSPPKGKSLHHTQNDHFQNDGIVQPNPSVLIGNPIRAYTPPPPLGP 1120 1130 1140 1150 1160 1170 947 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 10:50:04 2016 done: Tue Nov 8 10:50:05 2016 Total Scan time: 4.720 Total Display time: 0.260 Function used was FASTA [36.3.4 Apr, 2011]