FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9577, 1211 aa 1>>>pF1KB9577 1211 - 1211 aa - 1211 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7716+/-0.00101; mu= 19.4308+/- 0.061 mean_var=70.7764+/-14.272, 0's: 0 Z-trim(103.7): 31 B-trim: 0 in 0/51 Lambda= 0.152451 statistics sampled from 7514 (7538) to 7514 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.585), E-opt: 0.2 (0.232), width: 16 Scan time: 5.090 The best scores are: opt bits E(32554) CCDS14084.1 MOV10L1 gene_id:54456|Hs108|chr22 (1211) 8085 1788.4 0 CCDS54542.1 MOV10L1 gene_id:54456|Hs108|chr22 (1165) 7468 1652.6 0 CCDS54541.1 MOV10L1 gene_id:54456|Hs108|chr22 (1165) 7375 1632.2 0 CCDS54543.1 MOV10L1 gene_id:54456|Hs108|chr22 ( 338) 2254 505.7 8e-143 CCDS65615.1 MOV10 gene_id:4343|Hs108|chr1 ( 947) 932 215.1 6.7e-55 CCDS853.1 MOV10 gene_id:4343|Hs108|chr1 (1003) 932 215.1 7e-55 CCDS14647.1 CT55 gene_id:54967|Hs108|chrX ( 242) 790 183.6 5.1e-46 CCDS35400.1 CT55 gene_id:54967|Hs108|chrX ( 264) 790 183.6 5.5e-46 CCDS12386.1 UPF1 gene_id:5976|Hs108|chr19 (1118) 410 100.3 2.8e-20 CCDS74315.1 UPF1 gene_id:5976|Hs108|chr19 (1129) 410 100.3 2.8e-20 CCDS44415.2 DNA2 gene_id:1763|Hs108|chr10 (1060) 380 93.7 2.6e-18 CCDS33508.1 HELZ2 gene_id:85441|Hs108|chr20 (2649) 332 83.3 8.8e-15 >>CCDS14084.1 MOV10L1 gene_id:54456|Hs108|chr22 (1211 aa) initn: 8085 init1: 8085 opt: 8085 Z-score: 9599.9 bits: 1788.4 E(32554): 0 Smith-Waterman score: 8085; 100.0% identity (100.0% similar) in 1211 aa overlap (1-1211:1-1211) 10 20 30 40 50 60 pF1KB9 MLSLAAKLVAFFWRTADTPREEAGQLEPELAEGDTKLKTVRGVVTRYCSDYGMIDDMIYF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MLSLAAKLVAFFWRTADTPREEAGQLEPELAEGDTKLKTVRGVVTRYCSDYGMIDDMIYF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 SSDAVTSRVLLNVGQEVIAVVEENKVSNGLKAIRVEAVSDKWEDDSRNHGSPSDCGPRVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 SSDAVTSRVLLNVGQEVIAVVEENKVSNGLKAIRVEAVSDKWEDDSRNHGSPSDCGPRVL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 IGCVTSLVEGAGCISQTTYFSLESVCEGFEPCKGDWVEAEYRIRPGTWSSEATSVKPLRY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 IGCVTSLVEGAGCISQTTYFSLESVCEGFEPCKGDWVEAEYRIRPGTWSSEATSVKPLRY 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 KRVDKVCISSLCGRNGVLEESIFFTLDSLKLPDGYTPRRGDVVNAVVVESSQSCYVWRAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 KRVDKVCISSLCGRNGVLEESIFFTLDSLKLPDGYTPRRGDVVNAVVVESSQSCYVWRAL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 CMTLVKRRDAAPVHEATHFYGTILLKNKGDIEVTQVTHFGTLKEGRSKTMVIWIENKGDI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 CMTLVKRRDAAPVHEATHFYGTILLKNKGDIEVTQVTHFGTLKEGRSKTMVIWIENKGDI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 PQNLVSCKLAGWDKSKQFRFQMLDKDQMCPVVSFVSVPEKENSSDENINSLNSHTKNKTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 PQNLVSCKLAGWDKSKQFRFQMLDKDQMCPVVSFVSVPEKENSSDENINSLNSHTKNKTS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 QMSESSLVNNRGISPGDCTCKGENGEKDNILSRKQMTEPEPGGLVPPGGKTFIVVICDGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 QMSESSLVNNRGISPGDCTCKGENGEKDNILSRKQMTEPEPGGLVPPGGKTFIVVICDGK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 NPGRCKELLLLCFSDFLIGRYLEVNVISGEESLIAAREPFSWKKLKSSQALTSAKTTVVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 NPGRCKELLLLCFSDFLIGRYLEVNVISGEESLIAAREPFSWKKLKSSQALTSAKTTVVV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 TAQKRNSRRQLPSFLPQYPIPDRLRKCVEQKIDILTFQPLLAELLNMSNYKEKFSTLLWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 TAQKRNSRRQLPSFLPQYPIPDRLRKCVEQKIDILTFQPLLAELLNMSNYKEKFSTLLWL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB9 EEIYAEMELKEYNMSGIILRRNGDLLVLEVPGLAEGRPSLYAGDKLILKTQEYNGHAIEY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 EEIYAEMELKEYNMSGIILRRNGDLLVLEVPGLAEGRPSLYAGDKLILKTQEYNGHAIEY 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB9 ISYVTEIHEEDVTLKINPEFEQAYNFEPMDVEFTYNRTTSRRCHFALEHVIHLGVKVLFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 ISYVTEIHEEDVTLKINPEFEQAYNFEPMDVEFTYNRTTSRRCHFALEHVIHLGVKVLFP 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB9 EEIILQSPQVTGNWNHAQDTKSSGQSTSKKNRKTMTDQAEHGTEERRVGDKDLPVLAPFT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 EEIILQSPQVTGNWNHAQDTKSSGQSTSKKNRKTMTDQAEHGTEERRVGDKDLPVLAPFT 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB9 AEMSDWVDEIQTPKARKMEFFNPVLNENQKLAVKRILSGDCRPLPYILFGPPGTGKTVTI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 AEMSDWVDEIQTPKARKMEFFNPVLNENQKLAVKRILSGDCRPLPYILFGPPGTGKTVTI 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB9 IEAVLQVHFALPDSRILVCAPSNSAADLVCLRLHESKVLQPATMVRVNATCRFEEIVIDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 IEAVLQVHFALPDSRILVCAPSNSAADLVCLRLHESKVLQPATMVRVNATCRFEEIVIDA 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB9 VKPYCRDGEDIWKASRFRIIITTCSSSGLFYQIGVRVGHFTHVFVDEAGQASEPECLIPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 VKPYCRDGEDIWKASRFRIIITTCSSSGLFYQIGVRVGHFTHVFVDEAGQASEPECLIPL 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB9 GLMSDISGQIVLAGDPMQLGPVIKSRLAMAYGLNVSFLERLMSRPAYQRDENAFGACGAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 GLMSDISGQIVLAGDPMQLGPVIKSRLAMAYGLNVSFLERLMSRPAYQRDENAFGACGAH 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB9 NPLLVTKLVKNYRSHEALLMLPSRLFYHRELEVCADPTVVTSLLGWEKLPKKGFPLIFHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 NPLLVTKLVKNYRSHEALLMLPSRLFYHRELEVCADPTVVTSLLGWEKLPKKGFPLIFHG 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB9 VRGSEAREGKSPSWFNPAEAVQVLRYCCLLAHSISSQVSASDIGVITPYRKQVEKIRILL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 VRGSEAREGKSPSWFNPAEAVQVLRYCCLLAHSISSQVSASDIGVITPYRKQVEKIRILL 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB9 RNVDLMDIKVGSVEEFQGQEYLVIIISTVRSNEDRFEDDRYFLGFLSNSKRFNVAITRPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 RNVDLMDIKVGSVEEFQGQEYLVIIISTVRSNEDRFEDDRYFLGFLSNSKRFNVAITRPK 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KB9 ALLIVLGNPHVLVRDPCFGALLEYSITNGVYMGCDLPPALQSLQNCGEGVADPSYPVVPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 ALLIVLGNPHVLVRDPCFGALLEYSITNGVYMGCDLPPALQSLQNCGEGVADPSYPVVPE 1150 1160 1170 1180 1190 1200 1210 pF1KB9 STGPEKHQEPS ::::::::::: CCDS14 STGPEKHQEPS 1210 >>CCDS54542.1 MOV10L1 gene_id:54456|Hs108|chr22 (1165 aa) initn: 7468 init1: 7468 opt: 7468 Z-score: 8866.7 bits: 1652.6 E(32554): 0 Smith-Waterman score: 7468; 100.0% identity (100.0% similar) in 1122 aa overlap (33-1154:13-1134) 10 20 30 40 50 60 pF1KB9 SLAAKLVAFFWRTADTPREEAGQLEPELAEGDTKLKTVRGVVTRYCSDYGMIDDMIYFSS :::::::::::::::::::::::::::::: CCDS54 MSFLPVRSVIGGGDTKLKTVRGVVTRYCSDYGMIDDMIYFSS 10 20 30 40 70 80 90 100 110 120 pF1KB9 DAVTSRVLLNVGQEVIAVVEENKVSNGLKAIRVEAVSDKWEDDSRNHGSPSDCGPRVLIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 DAVTSRVLLNVGQEVIAVVEENKVSNGLKAIRVEAVSDKWEDDSRNHGSPSDCGPRVLIG 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB9 CVTSLVEGAGCISQTTYFSLESVCEGFEPCKGDWVEAEYRIRPGTWSSEATSVKPLRYKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 CVTSLVEGAGCISQTTYFSLESVCEGFEPCKGDWVEAEYRIRPGTWSSEATSVKPLRYKR 110 120 130 140 150 160 190 200 210 220 230 240 pF1KB9 VDKVCISSLCGRNGVLEESIFFTLDSLKLPDGYTPRRGDVVNAVVVESSQSCYVWRALCM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 VDKVCISSLCGRNGVLEESIFFTLDSLKLPDGYTPRRGDVVNAVVVESSQSCYVWRALCM 170 180 190 200 210 220 250 260 270 280 290 300 pF1KB9 TLVKRRDAAPVHEATHFYGTILLKNKGDIEVTQVTHFGTLKEGRSKTMVIWIENKGDIPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 TLVKRRDAAPVHEATHFYGTILLKNKGDIEVTQVTHFGTLKEGRSKTMVIWIENKGDIPQ 230 240 250 260 270 280 310 320 330 340 350 360 pF1KB9 NLVSCKLAGWDKSKQFRFQMLDKDQMCPVVSFVSVPEKENSSDENINSLNSHTKNKTSQM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 NLVSCKLAGWDKSKQFRFQMLDKDQMCPVVSFVSVPEKENSSDENINSLNSHTKNKTSQM 290 300 310 320 330 340 370 380 390 400 410 420 pF1KB9 SESSLVNNRGISPGDCTCKGENGEKDNILSRKQMTEPEPGGLVPPGGKTFIVVICDGKNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 SESSLVNNRGISPGDCTCKGENGEKDNILSRKQMTEPEPGGLVPPGGKTFIVVICDGKNP 350 360 370 380 390 400 430 440 450 460 470 480 pF1KB9 GRCKELLLLCFSDFLIGRYLEVNVISGEESLIAAREPFSWKKLKSSQALTSAKTTVVVTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GRCKELLLLCFSDFLIGRYLEVNVISGEESLIAAREPFSWKKLKSSQALTSAKTTVVVTA 410 420 430 440 450 460 490 500 510 520 530 540 pF1KB9 QKRNSRRQLPSFLPQYPIPDRLRKCVEQKIDILTFQPLLAELLNMSNYKEKFSTLLWLEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 QKRNSRRQLPSFLPQYPIPDRLRKCVEQKIDILTFQPLLAELLNMSNYKEKFSTLLWLEE 470 480 490 500 510 520 550 560 570 580 590 600 pF1KB9 IYAEMELKEYNMSGIILRRNGDLLVLEVPGLAEGRPSLYAGDKLILKTQEYNGHAIEYIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 IYAEMELKEYNMSGIILRRNGDLLVLEVPGLAEGRPSLYAGDKLILKTQEYNGHAIEYIS 530 540 550 560 570 580 610 620 630 640 650 660 pF1KB9 YVTEIHEEDVTLKINPEFEQAYNFEPMDVEFTYNRTTSRRCHFALEHVIHLGVKVLFPEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 YVTEIHEEDVTLKINPEFEQAYNFEPMDVEFTYNRTTSRRCHFALEHVIHLGVKVLFPEE 590 600 610 620 630 640 670 680 690 700 710 720 pF1KB9 IILQSPQVTGNWNHAQDTKSSGQSTSKKNRKTMTDQAEHGTEERRVGDKDLPVLAPFTAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 IILQSPQVTGNWNHAQDTKSSGQSTSKKNRKTMTDQAEHGTEERRVGDKDLPVLAPFTAE 650 660 670 680 690 700 730 740 750 760 770 780 pF1KB9 MSDWVDEIQTPKARKMEFFNPVLNENQKLAVKRILSGDCRPLPYILFGPPGTGKTVTIIE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MSDWVDEIQTPKARKMEFFNPVLNENQKLAVKRILSGDCRPLPYILFGPPGTGKTVTIIE 710 720 730 740 750 760 790 800 810 820 830 840 pF1KB9 AVLQVHFALPDSRILVCAPSNSAADLVCLRLHESKVLQPATMVRVNATCRFEEIVIDAVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 AVLQVHFALPDSRILVCAPSNSAADLVCLRLHESKVLQPATMVRVNATCRFEEIVIDAVK 770 780 790 800 810 820 850 860 870 880 890 900 pF1KB9 PYCRDGEDIWKASRFRIIITTCSSSGLFYQIGVRVGHFTHVFVDEAGQASEPECLIPLGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 PYCRDGEDIWKASRFRIIITTCSSSGLFYQIGVRVGHFTHVFVDEAGQASEPECLIPLGL 830 840 850 860 870 880 910 920 930 940 950 960 pF1KB9 MSDISGQIVLAGDPMQLGPVIKSRLAMAYGLNVSFLERLMSRPAYQRDENAFGACGAHNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MSDISGQIVLAGDPMQLGPVIKSRLAMAYGLNVSFLERLMSRPAYQRDENAFGACGAHNP 890 900 910 920 930 940 970 980 990 1000 1010 1020 pF1KB9 LLVTKLVKNYRSHEALLMLPSRLFYHRELEVCADPTVVTSLLGWEKLPKKGFPLIFHGVR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 LLVTKLVKNYRSHEALLMLPSRLFYHRELEVCADPTVVTSLLGWEKLPKKGFPLIFHGVR 950 960 970 980 990 1000 1030 1040 1050 1060 1070 1080 pF1KB9 GSEAREGKSPSWFNPAEAVQVLRYCCLLAHSISSQVSASDIGVITPYRKQVEKIRILLRN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GSEAREGKSPSWFNPAEAVQVLRYCCLLAHSISSQVSASDIGVITPYRKQVEKIRILLRN 1010 1020 1030 1040 1050 1060 1090 1100 1110 1120 1130 1140 pF1KB9 VDLMDIKVGSVEEFQGQEYLVIIISTVRSNEDRFEDDRYFLGFLSNSKRFNVAITRPKAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 VDLMDIKVGSVEEFQGQEYLVIIISTVRSNEDRFEDDRYFLGFLSNSKRFNVAITRPKAL 1070 1080 1090 1100 1110 1120 1150 1160 1170 1180 1190 1200 pF1KB9 LIVLGNPHVLVRDPCFGALLEYSITNGVYMGCDLPPALQSLQNCGEGVADPSYPVVPEST :::::::::::: CCDS54 LIVLGNPHVLVRLWRGGGRPLLPSGARIHRTREASGAQLICSG 1130 1140 1150 1160 >>CCDS54541.1 MOV10L1 gene_id:54456|Hs108|chr22 (1165 aa) initn: 7375 init1: 7375 opt: 7375 Z-score: 8756.2 bits: 1632.2 E(32554): 0 Smith-Waterman score: 7684; 96.2% identity (96.2% similar) in 1211 aa overlap (1-1211:1-1165) 10 20 30 40 50 60 pF1KB9 MLSLAAKLVAFFWRTADTPREEAGQLEPELAEGDTKLKTVRGVVTRYCSDYGMIDDMIYF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MLSLAAKLVAFFWRTADTPREEAGQLEPELAEGDTKLKTVRGVVTRYCSDYGMIDDMIYF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 SSDAVTSRVLLNVGQEVIAVVEENKVSNGLKAIRVEAVSDKWEDDSRNHGSPSDCGPRVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 SSDAVTSRVLLNVGQEVIAVVEENKVSNGLKAIRVEAVSDKWEDDSRNHGSPSDCGPRVL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 IGCVTSLVEGAGCISQTTYFSLESVCEGFEPCKGDWVEAEYRIRPGTWSSEATSVKPLRY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 IGCVTSLVEGAGCISQTTYFSLESVCEGFEPCKGDWVEAEYRIRPGTWSSEATSVKPLRY 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 KRVDKVCISSLCGRNGVLEESIFFTLDSLKLPDGYTPRRGDVVNAVVVESSQSCYVWRAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 KRVDKVCISSLCGRNGVLEESIFFTLDSLKLPDGYTPRRGDVVNAVVVESSQSCYVWRAL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 CMTLVKRRDAAPVHEATHFYGTILLKNKGDIEVTQVTHFGTLKEGRSKTMVIWIENKGDI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 CMTLVKRRDAAPVHEATHFYGTILLKNKGDIEVTQVTHFGTLKEGRSKTMVIWIENKGDI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 PQNLVSCKLAGWDKSKQFRFQMLDKDQMCPVVSFVSVPEKENSSDENINSLNSHTKNKTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 PQNLVSCKLAGWDKSKQFRFQMLDKDQMCPVVSFVSVPEKENSSDENINSLNSHTKNKTS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 QMSESSLVNNRGISPGDCTCKGENGEKDNILSRKQMTEPEPGGLVPPGGKTFIVVICDGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 QMSESSLVNNRGISPGDCTCKGENGEKDNILSRKQMTEPEPGGLVPPGGKTFIVVICDGK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 NPGRCKELLLLCFSDFLIGRYLEVNVISGEESLIAAREPFSWKKLKSSQALTSAKTTVVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 NPGRCKELLLLCFSDFLIGRYLEVNVISGEESLIAAREPFSWKKLKSSQALTSAKTTVVV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 TAQKRNSRRQLPSFLPQYPIPDRLRKCVEQKIDILTFQPLLAELLNMSNYKEKFSTLLWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 TAQKRNSRRQLPSFLPQYPIPDRLRKCVEQKIDILTFQPLLAELLNMSNYKEKFSTLLWL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB9 EEIYAEMELKEYNMSGIILRRNGDLLVLEVPGLAEGRPSLYAGDKLILKTQEYNGHAIEY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 EEIYAEMELKEYNMSGIILRRNGDLLVLEVPGLAEGRPSLYAGDKLILKTQEYNGHAIEY 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB9 ISYVTEIHEEDVTLKINPEFEQAYNFEPMDVEFTYNRTTSRRCHFALEHVIHLGVKVLFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 ISYVTEIHEEDVTLKINPEFEQAYNFEPMDVEFTYNRTTSRRCHFALEHVIHLGVKVLFP 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB9 EEIILQSPQVTGNWNHAQDTKSSGQSTSKKNRKTMTDQAEHGTEERRVGDKDLPVLAPFT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 EEIILQSPQVTGNWNHAQDTKSSGQSTSKKNRKTMTDQAEHGTEERRVGDKDLPVLAPFT 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB9 AEMSDWVDEIQTPKARKMEFFNPVLNENQKLAVKRILSGDCRPLPYILFGPPGTGKTVTI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 AEMSDWVDEIQTPKARKMEFFNPVLNENQKLAVKRILSGDCRPLPYILFGPPGTGKTVTI 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB9 IEAVLQVHFALPDSRILVCAPSNSAADLVCLRLHESKVLQPATMVRVNATCRFEEIVIDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 IEAVLQVHFALPDSRILVCAPSNSAADLVCLRLHESKVLQPATMVRVNATCRFEEIVIDA 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB9 VKPYCRDGEDIWKASRFRIIITTCSSSGLFYQIGVRVGHFTHVFVDEAGQASEPECLIPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 VKPYCRDGEDIWKASRFRIIITTCSSSGLFYQIGVRVGHFTHVFVDEAGQASEPECLIPL 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB9 GLMSDISGQIVLAGDPMQLGPVIKSRLAMAYGLNVSFLERLMSRPAYQRDENAFGACGAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GLMSDISGQIVLAGDPMQLGPVIKSRLAMAYGLNVSFLERLMSRPAYQRDENAFGACGAH 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB9 NPLLVTKLVKNYRSHEALLMLPSRLFYHRELEVCADPTVVTSLLGWEKLPKKGFPLIFHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 NPLLVTKLVKNYRSHEALLMLPSRLFYHRELEVCADPTVVTSLLGWEKLPKKGFPLIFHG 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB9 VRGSEAREGKSPSWFNPAEAVQVLRYCCLLAHSISSQVSASDIGVITPYRKQVEKIRILL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 VRGSEAREGKSPSWFNPAEAVQVLRYCCLLAHSISSQVSASDIGVITPYRKQVEKIRILL 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB9 RNVDLMDIKVGSVEEFQGQEYLVIIISTVRSNEDRFEDDRYFLGFLSNSKRFNVAITRPK :::::::::::::::::::::::::::: CCDS54 RNVDLMDIKVGSVEEFQGQEYLVIIIST-------------------------------- 1090 1100 1150 1160 1170 1180 1190 1200 pF1KB9 ALLIVLGNPHVLVRDPCFGALLEYSITNGVYMGCDLPPALQSLQNCGEGVADPSYPVVPE :::::::::::::::::::::::::::::::::::::::::::::: CCDS54 --------------DPCFGALLEYSITNGVYMGCDLPPALQSLQNCGEGVADPSYPVVPE 1110 1120 1130 1140 1150 1210 pF1KB9 STGPEKHQEPS ::::::::::: CCDS54 STGPEKHQEPS 1160 >>CCDS54543.1 MOV10L1 gene_id:54456|Hs108|chr22 (338 aa) initn: 2254 init1: 2254 opt: 2254 Z-score: 2677.6 bits: 505.7 E(32554): 8e-143 Smith-Waterman score: 2254; 100.0% identity (100.0% similar) in 336 aa overlap (876-1211:3-338) 850 860 870 880 890 900 pF1KB9 RDGEDIWKASRFRIIITTCSSSGLFYQIGVRVGHFTHVFVDEAGQASEPECLIPLGLMSD :::::::::::::::::::::::::::::: CCDS54 MFRVGHFTHVFVDEAGQASEPECLIPLGLMSD 10 20 30 910 920 930 940 950 960 pF1KB9 ISGQIVLAGDPMQLGPVIKSRLAMAYGLNVSFLERLMSRPAYQRDENAFGACGAHNPLLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 ISGQIVLAGDPMQLGPVIKSRLAMAYGLNVSFLERLMSRPAYQRDENAFGACGAHNPLLV 40 50 60 70 80 90 970 980 990 1000 1010 1020 pF1KB9 TKLVKNYRSHEALLMLPSRLFYHRELEVCADPTVVTSLLGWEKLPKKGFPLIFHGVRGSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 TKLVKNYRSHEALLMLPSRLFYHRELEVCADPTVVTSLLGWEKLPKKGFPLIFHGVRGSE 100 110 120 130 140 150 1030 1040 1050 1060 1070 1080 pF1KB9 AREGKSPSWFNPAEAVQVLRYCCLLAHSISSQVSASDIGVITPYRKQVEKIRILLRNVDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 AREGKSPSWFNPAEAVQVLRYCCLLAHSISSQVSASDIGVITPYRKQVEKIRILLRNVDL 160 170 180 190 200 210 1090 1100 1110 1120 1130 1140 pF1KB9 MDIKVGSVEEFQGQEYLVIIISTVRSNEDRFEDDRYFLGFLSNSKRFNVAITRPKALLIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MDIKVGSVEEFQGQEYLVIIISTVRSNEDRFEDDRYFLGFLSNSKRFNVAITRPKALLIV 220 230 240 250 260 270 1150 1160 1170 1180 1190 1200 pF1KB9 LGNPHVLVRDPCFGALLEYSITNGVYMGCDLPPALQSLQNCGEGVADPSYPVVPESTGPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 LGNPHVLVRDPCFGALLEYSITNGVYMGCDLPPALQSLQNCGEGVADPSYPVVPESTGPE 280 290 300 310 320 330 1210 pF1KB9 KHQEPS :::::: CCDS54 KHQEPS >>CCDS65615.1 MOV10 gene_id:4343|Hs108|chr1 (947 aa) initn: 1374 init1: 322 opt: 932 Z-score: 1099.1 bits: 215.1 E(32554): 6.7e-55 Smith-Waterman score: 1451; 36.5% identity (60.5% similar) in 825 aa overlap (436-1207:176-922) 410 420 430 440 450 460 pF1KB9 PPGGKTFIVVICDGKNPGRCKELLLLCFSDFLIGRYLEVNVISGEESLIAAREPFSWKKL : :.:.: . . : . . ::. .. CCDS65 CKTSFVGYFPATVLWELLGPGESGSEGAGTFYIARFLAAVAHSPLAAQLKPMTPFKRTRI 150 160 170 180 190 200 470 480 490 500 510 520 pF1KB9 KSSQALTSAKTTVVVTAQKRNSRRQLPSFLPQYPIPDRLRKCVE---QKIDILTFQPLLA .. ..:. . .. .: : : : :::. . : .:.: .: CCDS65 TGNPVVTNRIEEGERPDRAKGYDLELSMALGTYYPPPRLRQLLPMLLQGTSIFTAPKEIA 210 220 230 240 250 260 530 540 550 560 570 pF1KB9 EL-------LNMSNYKEKFSTLLWLEEIYAEMELKEYNMSGIILR-----RNGDLLVLEV :. :. ::. :. :: :::. : ....:.. .. . .: ::.::: CCDS65 EIKAQLETALKWRNYEVKLRLLLHLEELQMEHDIRHYDLESVPMTWDPVDQNPRLLTLEV 270 280 290 300 310 320 580 590 600 610 620 pF1KB9 PGLAEGRPSLYAGDKL--ILKTQEYNGHAIEYISYVTEIHEEDVTLKIN----PEFEQAY ::..:.:::. ::.: .:... .. : : ..: ... . : :... .: .. CCDS65 PGVTESRPSVLRGDHLFALLSSETHQEDPITYKGFVHKVELDRVKLSFSMSLLSRFVDGL 330 340 350 360 370 380 630 640 650 660 670 680 pF1KB9 NFEPMDVEFTYNRTTSRRCHFALEHVIHLGVKVLFPEEIILQSPQVTGNWNHAQDTKSSG .:. :.::.:: : : ::: . : .:.: . : CCDS65 TFK---VNFTFNRQPLRVQHRALELT---GRWLLWP----MLFP---------------- 390 400 410 690 700 710 720 730 740 pF1KB9 QSTSKKNRKTMTDQAEHGTEERRVGDKDLPVLAPFTAEMSDWVDEIQTPKARKMEFFNPV :. .:.:.: :. :..... CCDS65 -----------------------VAPRDVPLL----------------PSDVKLKLYDRS 420 430 440 750 760 770 780 790 800 pF1KB9 LNEN--QKLAVKRILSGDCRPLPYILFGPPGTGKTVTIIEAVLQVHFALPDSRILVCAPS :. : : :...:..: :: :::.:::::::::::..::. :: :: ..::.:::: CCDS65 LESNPEQLQAMRHIVTGTTRPAPYIIFGPPGTGKTVTLVEAIKQVVKHLPKAHILACAPS 450 460 470 480 490 500 810 820 830 840 850 pF1KB9 NSAADLVCLRLHESKVLQPATMVRVNATCRFEEIVIDAVKPYC----RDGEDIWKASR-- ::.:::.: :: .: :... :. : : ..: . .:: : . :: .. :.. CCDS65 NSGADLLCQRL---RVHLPSSIYRLLAPSRDIRMVPEDIKPCCNWDAKKGEYVFPAKKKL 510 520 530 540 550 860 870 880 890 900 pF1KB9 --FRIIITTCSSSGLFYQIGVRVGHFTHVFVDEAGQASEPECLIPL-GLM-----SDISG .:..::: ..: . . . ::::.:.::::. ::: :. . ::: .: .: CCDS65 QEYRVLITTLITAGRLVSAQFPIDHFTHIFIDEAGHCMEPESLVAIAGLMEVKETGDPGG 560 570 580 590 600 610 910 920 930 940 950 960 pF1KB9 QIVLAGDPMQLGPVIKSRLAMAYGLNVSFLERLMSRPA-YQRDENAFGACGAHNPLLVTK :.:::::: :::::..: :.. .::. :.::::.. . :.. ... .: ..:: CCDS65 QLVLAGDPRQLGPVLRSPLTQKHGLGYSLLERLLTYNSLYKKGPDGY------DPQFITK 620 630 640 650 660 670 970 980 990 1000 1010 1020 pF1KB9 LVKNYRSHEALLMLPSRLFYHRELEVCADPTVVTSLLGWEKLPKKGFPLIFHGVRGSEAR :..::::: ..: .:..:.:. ::..::: . . : ::..:::.::::: :.. : CCDS65 LLRNYRSHPTILDIPNQLYYEGELQACADVVDRERFCRWAGLPRQGFPIIFHGVMGKDER 680 690 700 710 720 730 1030 1040 1050 1060 1070 pF1KB9 EGKSPSWFNPAEAVQVLRYCCLLAHSISSQ----VSASDIGVITPYRKQVEKIRIL---- ::.:::.::: ::. : : :: :.. .: ..:::.:::::::::: CCDS65 EGNSPSFFNPEEAATVTSYLKLLLAPSSKKGKARLSPRSVGVISPYRKQVEKIRYCITKL 740 750 760 770 780 790 1080 1090 1100 1110 1120 1130 pF1KB9 ---LRNVD-LMDIKVGSVEEFQGQEYLVIIISTVRSNEDRFEDDRYF-LGFLSNSKRFNV ::..: . :.:::::::::::: ::.::::::... . : : ::::.: ::::: CCDS65 DRELRGLDDIKDLKVGSVEEFQGQERSVILISTVRSSQSFVQLDLDFNLGFLKNPKRFNV 800 810 820 830 840 850 1140 1150 1160 1170 1180 1190 pF1KB9 AITRPKALLIVLGNPHVLVRDPCFGALLEYSITNGVYMGCDLPPAL--QSLQNCGEGVAD :.:: :::::..::: .: .:: . ..::. :: : :: .: : :. :: .:.. CCDS65 AVTRAKALLIIVGNPLLLGHDPDWKVFLEFCKENGGYTGCPFPAKLDLQQGQNLLQGLSK 860 870 880 890 900 910 1200 1210 pF1KB9 PSYPVVPESTGPEKHQEPS : : ..::..: CCDS65 LS----PSTSGPHSHDYLPQEREGEGGLSLQVEPEWRNEL 920 930 940 >>CCDS853.1 MOV10 gene_id:4343|Hs108|chr1 (1003 aa) initn: 1374 init1: 322 opt: 932 Z-score: 1098.7 bits: 215.1 E(32554): 7e-55 Smith-Waterman score: 1451; 36.5% identity (60.5% similar) in 825 aa overlap (436-1207:232-978) 410 420 430 440 450 460 pF1KB9 PPGGKTFIVVICDGKNPGRCKELLLLCFSDFLIGRYLEVNVISGEESLIAAREPFSWKKL : :.:.: . . : . . ::. .. CCDS85 CKTSFVGYFPATVLWELLGPGESGSEGAGTFYIARFLAAVAHSPLAAQLKPMTPFKRTRI 210 220 230 240 250 260 470 480 490 500 510 520 pF1KB9 KSSQALTSAKTTVVVTAQKRNSRRQLPSFLPQYPIPDRLRKCVE---QKIDILTFQPLLA .. ..:. . .. .: : : : :::. . : .:.: .: CCDS85 TGNPVVTNRIEEGERPDRAKGYDLELSMALGTYYPPPRLRQLLPMLLQGTSIFTAPKEIA 270 280 290 300 310 320 530 540 550 560 570 pF1KB9 EL-------LNMSNYKEKFSTLLWLEEIYAEMELKEYNMSGIILR-----RNGDLLVLEV :. :. ::. :. :: :::. : ....:.. .. . .: ::.::: CCDS85 EIKAQLETALKWRNYEVKLRLLLHLEELQMEHDIRHYDLESVPMTWDPVDQNPRLLTLEV 330 340 350 360 370 380 580 590 600 610 620 pF1KB9 PGLAEGRPSLYAGDKL--ILKTQEYNGHAIEYISYVTEIHEEDVTLKIN----PEFEQAY ::..:.:::. ::.: .:... .. : : ..: ... . : :... .: .. CCDS85 PGVTESRPSVLRGDHLFALLSSETHQEDPITYKGFVHKVELDRVKLSFSMSLLSRFVDGL 390 400 410 420 430 440 630 640 650 660 670 680 pF1KB9 NFEPMDVEFTYNRTTSRRCHFALEHVIHLGVKVLFPEEIILQSPQVTGNWNHAQDTKSSG .:. :.::.:: : : ::: . : .:.: . : CCDS85 TFK---VNFTFNRQPLRVQHRALELT---GRWLLWP----MLFP---------------- 450 460 470 690 700 710 720 730 740 pF1KB9 QSTSKKNRKTMTDQAEHGTEERRVGDKDLPVLAPFTAEMSDWVDEIQTPKARKMEFFNPV :. .:.:.: :. :..... CCDS85 -----------------------VAPRDVPLL----------------PSDVKLKLYDRS 480 490 750 760 770 780 790 800 pF1KB9 LNEN--QKLAVKRILSGDCRPLPYILFGPPGTGKTVTIIEAVLQVHFALPDSRILVCAPS :. : : :...:..: :: :::.:::::::::::..::. :: :: ..::.:::: CCDS85 LESNPEQLQAMRHIVTGTTRPAPYIIFGPPGTGKTVTLVEAIKQVVKHLPKAHILACAPS 500 510 520 530 540 550 810 820 830 840 850 pF1KB9 NSAADLVCLRLHESKVLQPATMVRVNATCRFEEIVIDAVKPYC----RDGEDIWKASR-- ::.:::.: :: .: :... :. : : ..: . .:: : . :: .. :.. CCDS85 NSGADLLCQRL---RVHLPSSIYRLLAPSRDIRMVPEDIKPCCNWDAKKGEYVFPAKKKL 560 570 580 590 600 610 860 870 880 890 900 pF1KB9 --FRIIITTCSSSGLFYQIGVRVGHFTHVFVDEAGQASEPECLIPL-GLM-----SDISG .:..::: ..: . . . ::::.:.::::. ::: :. . ::: .: .: CCDS85 QEYRVLITTLITAGRLVSAQFPIDHFTHIFIDEAGHCMEPESLVAIAGLMEVKETGDPGG 620 630 640 650 660 670 910 920 930 940 950 960 pF1KB9 QIVLAGDPMQLGPVIKSRLAMAYGLNVSFLERLMSRPA-YQRDENAFGACGAHNPLLVTK :.:::::: :::::..: :.. .::. :.::::.. . :.. ... .: ..:: CCDS85 QLVLAGDPRQLGPVLRSPLTQKHGLGYSLLERLLTYNSLYKKGPDGY------DPQFITK 680 690 700 710 720 970 980 990 1000 1010 1020 pF1KB9 LVKNYRSHEALLMLPSRLFYHRELEVCADPTVVTSLLGWEKLPKKGFPLIFHGVRGSEAR :..::::: ..: .:..:.:. ::..::: . . : ::..:::.::::: :.. : CCDS85 LLRNYRSHPTILDIPNQLYYEGELQACADVVDRERFCRWAGLPRQGFPIIFHGVMGKDER 730 740 750 760 770 780 1030 1040 1050 1060 1070 pF1KB9 EGKSPSWFNPAEAVQVLRYCCLLAHSISSQ----VSASDIGVITPYRKQVEKIRIL---- ::.:::.::: ::. : : :: :.. .: ..:::.:::::::::: CCDS85 EGNSPSFFNPEEAATVTSYLKLLLAPSSKKGKARLSPRSVGVISPYRKQVEKIRYCITKL 790 800 810 820 830 840 1080 1090 1100 1110 1120 1130 pF1KB9 ---LRNVD-LMDIKVGSVEEFQGQEYLVIIISTVRSNEDRFEDDRYF-LGFLSNSKRFNV ::..: . :.:::::::::::: ::.::::::... . : : ::::.: ::::: CCDS85 DRELRGLDDIKDLKVGSVEEFQGQERSVILISTVRSSQSFVQLDLDFNLGFLKNPKRFNV 850 860 870 880 890 900 1140 1150 1160 1170 1180 1190 pF1KB9 AITRPKALLIVLGNPHVLVRDPCFGALLEYSITNGVYMGCDLPPAL--QSLQNCGEGVAD :.:: :::::..::: .: .:: . ..::. :: : :: .: : :. :: .:.. CCDS85 AVTRAKALLIIVGNPLLLGHDPDWKVFLEFCKENGGYTGCPFPAKLDLQQGQNLLQGLSK 910 920 930 940 950 960 1200 1210 pF1KB9 PSYPVVPESTGPEKHQEPS : : ..::..: CCDS85 LS----PSTSGPHSHDYLPQEREGEGGLSLQVEPEWRNEL 970 980 990 1000 >>CCDS14647.1 CT55 gene_id:54967|Hs108|chrX (242 aa) initn: 814 init1: 498 opt: 790 Z-score: 939.7 bits: 183.6 E(32554): 5.1e-46 Smith-Waterman score: 790; 52.6% identity (74.5% similar) in 247 aa overlap (1-247:1-241) 10 20 30 40 50 60 pF1KB9 MLSLAAKLVAFFWRTADTPREEAGQLEPELAEGDTKLKTVRGVVTRYCSDYGMIDDMIYF :: : .::. :::: : :. : . : .:::.: ::.:::: .:.::::::. ::: CCDS14 MLRLLRLALAFYGRTAD-PAERQGPQQQGLPQGDTQLTTVQGVVTSFCGDYGMIDESIYF 10 20 30 40 50 70 80 90 100 110 120 pF1KB9 SSDAVTSRVLLNVGQEVIAVVEENKVSNGLKAIRVEAVSDKWEDDSRNHGSPSDCGPRVL :::.::. : :.:::.: .::::.: ::.::.:..: . ..::: : ::: CCDS14 SSDVVTGNVPLKVGQKVNVVVEEDKPHYGLRAIKVDVVPRHLYG-----AGPSDSGTRVL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB9 IGCVTSLVEGAGCISQTTYFSLESVCEGFEPCKGDWVEAEYRIRPGTWSSEATSVKPLRY ::::::. : ::.. :::. : : : : ::: .:.:: .:: . .::::::.: CCDS14 IGCVTSINEDNIYISNSIYFSIAIVSEDFVPYKGDLLEVEYSTEPGISNIKATSVKPIRC 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB9 KRVDKVCISSLCGRNGVLEESIFFTLDSLKLPDGYTPRRGDVVNAVVVESSQSCYVWRAL ....:::.:. :::::.. .:::::::.::::::.:. :.::.:.::: : :..:::. CCDS14 IHTEEVCITSVHGRNGVIDYTIFFTLDSVKLPDGYVPQVDDIVNVVMVESIQFCFIWRAI 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB9 CMTLVKRRDAAPVHEATHFYGTILLKNKGDIEVTQVTHFGTLKEGRSKTMVIWIENKGDI .: :.. CCDS14 SITPVHKS 240 >>CCDS35400.1 CT55 gene_id:54967|Hs108|chrX (264 aa) initn: 814 init1: 498 opt: 790 Z-score: 939.1 bits: 183.6 E(32554): 5.5e-46 Smith-Waterman score: 790; 52.6% identity (74.5% similar) in 247 aa overlap (1-247:1-241) 10 20 30 40 50 60 pF1KB9 MLSLAAKLVAFFWRTADTPREEAGQLEPELAEGDTKLKTVRGVVTRYCSDYGMIDDMIYF :: : .::. :::: : :. : . : .:::.: ::.:::: .:.::::::. ::: CCDS35 MLRLLRLALAFYGRTAD-PAERQGPQQQGLPQGDTQLTTVQGVVTSFCGDYGMIDESIYF 10 20 30 40 50 70 80 90 100 110 120 pF1KB9 SSDAVTSRVLLNVGQEVIAVVEENKVSNGLKAIRVEAVSDKWEDDSRNHGSPSDCGPRVL :::.::. : :.:::.: .::::.: ::.::.:..: . ..::: : ::: CCDS35 SSDVVTGNVPLKVGQKVNVVVEEDKPHYGLRAIKVDVVPRHLYG-----AGPSDSGTRVL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB9 IGCVTSLVEGAGCISQTTYFSLESVCEGFEPCKGDWVEAEYRIRPGTWSSEATSVKPLRY ::::::. : ::.. :::. : : : : ::: .:.:: .:: . .::::::.: CCDS35 IGCVTSINEDNIYISNSIYFSIAIVSEDFVPYKGDLLEVEYSTEPGISNIKATSVKPIRC 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB9 KRVDKVCISSLCGRNGVLEESIFFTLDSLKLPDGYTPRRGDVVNAVVVESSQSCYVWRAL ....:::.:. :::::.. .:::::::.::::::.:. :.::.:.::: : :..:::. CCDS35 IHTEEVCITSVHGRNGVIDYTIFFTLDSVKLPDGYVPQVDDIVNVVMVESIQFCFIWRAI 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB9 CMTLVKRRDAAPVHEATHFYGTILLKNKGDIEVTQVTHFGTLKEGRSKTMVIWIENKGDI .: :.. CCDS35 SITPVHKSSSGFQDDGGLGRPKRERRSQSI 240 250 260 >>CCDS12386.1 UPF1 gene_id:5976|Hs108|chr19 (1118 aa) initn: 543 init1: 130 opt: 410 Z-score: 477.5 bits: 100.3 E(32554): 2.8e-20 Smith-Waterman score: 565; 26.5% identity (53.4% similar) in 804 aa overlap (403-1164:195-891) 380 390 400 410 420 430 pF1KB9 ISPGDCTCKGENGEKDNILSRKQMTEPEPGGLVPPGGKTFIVVICDGKNPGRCKELLLLC :..: . . .:..: ..: : CCDS12 CKEVTLHKDGPLGETVLECYNCGCRNVFLLGFIPAKADSVVVLLC--RQP---------C 170 180 190 200 210 440 450 460 470 480 490 pF1KB9 FSDFLIGRYLEVNVISGE-ESLIAAREPFSWK-KLKSSQALTSAKTTVVVTAQKRNSRRQ :. . ..: :.. . :: : .:: :. : : :. .:::. :. .. CCDS12 ASQ---SSLKDINWDSSQWQPLIQDRCFLSWLVKIPSEQEQLRARQ---ITAQQINKLEE 220 230 240 250 260 500 510 520 530 540 550 pF1KB9 LPSFLPQYPIPDRLRKCVEQKIDILTFQPLLAELLNMSNYKEKFSTLLWLEEIYAEMELK : . :. . : . :... : .: . . .:.. :. :. :: : . .:: CCDS12 LWKENPSATLEDLEKPGVDEEP-----QHVLLRYEDAYQYQNIFGPLVKLEADY-DKKLK 270 280 290 300 310 320 560 570 580 590 600 610 pF1KB9 EYNMSGIILRRNGDLLVLEVPGLAEGRPSLYAGDKLILKTQEYNGHAIEYISYVTEIHEE : . . : : :: :: . : . .. . ::. : . .. . CCDS12 ESQTQDNITVR-WDL------GLNKKRIAYFT----LPKTD----------SDMRLMQGD 330 340 350 360 620 630 640 650 660 670 pF1KB9 DVTLKINPEFEQAYNFEPMDVEFTYNRTTSRRCHFALEHVIHLGVKVLFPEEIILQSPQV .. :. . .. .. .. : .. : .:.: .: : :. .. :: CCDS12 EICLRYKGDLAPLWKGIGHVIKVPDN--------YGDEIAIELRSSVGAPVEVT-HNFQV 370 380 390 400 410 680 690 700 710 720 pF1KB9 TGNWNHAQ-DTKSSGQSTSKKNRKTMTDQAEHGTEERRVGDKDLPVLAPFTAEMSDWVDE :. .. : .:. .: .. ... : . .: :. : . . CCDS12 DFVWKSTSFDRMQSALKTFAVDETSVSGYIYH----KLLGH-----------EVEDVIIK 420 430 440 450 730 740 750 760 770 780 pF1KB9 IQTPKARKMEFFNPVLNENQKLAVKRILSGDCRPLPYILFGPPGTGKTVTIIEAVLQVHF : :: . . : ::..: ::: .:. ::: : :::::::::: :.. :. CCDS12 CQLPKRFTAQGL-PDLNHSQVYAVKTVLQ---RPLSLIQ-GPPGTGKTVT--SATIVYHL 460 470 480 490 500 790 800 810 820 830 pF1KB9 ALP-DSRILVCAPSNSAADLVCLRLHES--KVLQ-----------PATMVRVNATCRFEE : .. .::::::: :.: . ..:.. ::.. :.... .. : . CCDS12 ARQGNGPVLVCAPSNIAVDQLTEKIHQTGLKVVRLCAKSREAIDSPVSFLALHNQIRNMD 510 520 530 540 550 560 840 850 860 870 pF1KB9 IVIDAVK-PYCRD--GE-DIWKASRFRIIITTCSSSGLFYQ-------IGV---RVG--H . . : .: :: . .:.: . : :. .:. :.. . CCDS12 SMPELQKLQQLKDETGELSSADEKRYRALKRTAERELLMNADVICCTCVGAGDPRLAKMQ 570 580 590 600 610 620 880 890 900 910 920 930 pF1KB9 FTHVFVDEAGQASEPECLIPLGLMSDISGQIVLAGDPMQLGPVIKSRLAMAYGLNVSFLE : ...::. ::.::::..:. : . :..:.:: :::::. . : ::. :..: CCDS12 FRSILIDESTQATEPECMVPVVLGAK---QLILVGDHCQLGPVVMCKKAAKAGLSQSLFE 630 640 650 660 670 680 940 950 960 970 980 990 pF1KB9 RLMSRPAYQRDENAFGACGAHNPLLVTKLVKNYRSHEALLMLPSRLFYHRELE--VCADP ::. ..: :. .: .:: : :: .:: .::. :. : : CCDS12 RLV----------VLGI----RPI---RLQVQYRMHPALSAFPSNIFYEGSLQNGVTAAD 690 700 710 720 1000 1010 1020 1030 1040 1050 pF1KB9 TVVTSL-LGWEKLPKKGFPLIFHGVRGSEAREGKSPSWFNPAEAVQVLRYCCLLAHSISS : .. . : . : : :..:. ..:.: ... :..: .::..: . : ... CCDS12 RVKKGFDFQWPQ-PDK--PMFFYVTQGQEEIASSGTSYLNRTEAANVEKITTKL---LKA 730 740 750 760 770 780 1060 1070 1080 1090 1100 1110 pF1KB9 QVSASDIGVITPYRKQ----VEKIRIL--LRNVDLMDIKVGSVEEFQGQEYLVIIISTVR .. ..::.::::. : :. ... :.. ......::. :::.: ::.: :: CCDS12 GAKPDQIGIITPYEGQRSYLVQYMQFSGSLHTKLYQEVEIASVDAFQGREKDFIILSCVR 790 800 810 820 830 840 1120 1130 1140 1150 1160 1170 pF1KB9 SNEDRFEDDRYFLGFLSNSKRFNVAITRPKALLIVLGNPHVLVRDPCFGALLEYSITNGV .:: . .:::.. .:.:::.:: . .:..:::..: ..: .. ::.: CCDS12 ANEHQG------IGFLNDPRRLNVALTRARYGVIIVGNPKALSKQPLWNHLLNYYKEQKV 850 860 870 880 890 1180 1190 1200 1210 pF1KB9 YMGCDLPPALQSLQNCGEGVADPSYPVVPESTGPEKHQEPS CCDS12 LVEGPLNNLRESLMQFSKPRKLVNTINPGARFMTTAMYDAREAIIPGSVYDRSSQGRPSS 900 910 920 930 940 950 >>CCDS74315.1 UPF1 gene_id:5976|Hs108|chr19 (1129 aa) initn: 543 init1: 130 opt: 410 Z-score: 477.4 bits: 100.3 E(32554): 2.8e-20 Smith-Waterman score: 581; 26.6% identity (53.8% similar) in 805 aa overlap (403-1164:195-902) 380 390 400 410 420 430 pF1KB9 ISPGDCTCKGENGEKDNILSRKQMTEPEPGGLVPPGGKTFIVVICDGKNPGRCKELLLLC :..: . . .:..: ..: : CCDS74 CKEVTLHKDGPLGETVLECYNCGCRNVFLLGFIPAKADSVVVLLC--RQP---------C 170 180 190 200 210 440 450 460 470 480 490 pF1KB9 FSDFLIGRYLEVNVISGE-ESLIAAREPFSWK-KLKSSQALTSAKTTVVVTAQKRNSRRQ :. . ..: :.. . :: : .:: :. : : :. .:::. :. .. CCDS74 ASQ---SSLKDINWDSSQWQPLIQDRCFLSWLVKIPSEQEQLRARQ---ITAQQINKLEE 220 230 240 250 260 500 510 520 530 540 550 pF1KB9 LPSFLPQYPIPDRLRKCVEQKIDILTFQPLLAELLNMSNYKEKFSTLLWLEEIYAEMELK : . :. . : . :... : .: . . .:.. :. :. :: : . .:: CCDS74 LWKENPSATLEDLEKPGVDEEP-----QHVLLRYEDAYQYQNIFGPLVKLEADY-DKKLK 270 280 290 300 310 320 560 570 580 590 600 pF1KB9 EYNMSGIILRRNGDLLVLEVPGLAEGRPSLYAGDKLILKTQEYNGH-AIEYISYVTEIHE : . . : : :: :: . : . .. . ::. : .: .. . .. CCDS74 ESQTQDNITVR-WDL------GLNKKRIAYFT----LPKTDSGNEDLVIIWLRDMRLMQG 330 340 350 360 370 610 620 630 640 650 660 pF1KB9 EDVTLKINPEFEQAYNFEPMDVEFTYNRTTSRRCHFALEHVIHLGVKVLFPEEIILQSPQ ... :. . .. .. .. : .. : .:.: .: : :. .. : CCDS74 DEICLRYKGDLAPLWKGIGHVIKVPDN--------YGDEIAIELRSSVGAPVEVT-HNFQ 380 390 400 410 420 670 680 690 700 710 720 pF1KB9 VTGNWNHAQ-DTKSSGQSTSKKNRKTMTDQAEHGTEERRVGDKDLPVLAPFTAEMSDWVD : :. .. : .:. .: .. ... : . .: :. : . CCDS74 VDFVWKSTSFDRMQSALKTFAVDETSVSGYIYH----KLLGH-----------EVEDVII 430 440 450 460 730 740 750 760 770 780 pF1KB9 EIQTPKARKMEFFNPVLNENQKLAVKRILSGDCRPLPYILFGPPGTGKTVTIIEAVLQVH . : :: . . : ::..: ::: .:. ::: : :::::::::: :.. : CCDS74 KCQLPKRFTAQGL-PDLNHSQVYAVKTVLQ---RPLSLIQ-GPPGTGKTVT--SATIVYH 470 480 490 500 510 790 800 810 820 830 pF1KB9 FALP-DSRILVCAPSNSAADLVCLRLHES--KVLQ-----------PATMVRVNATCRFE .: .. .::::::: :.: . ..:.. ::.. :.... .. : CCDS74 LARQGNGPVLVCAPSNIAVDQLTEKIHQTGLKVVRLCAKSREAIDSPVSFLALHNQIRNM 520 530 540 550 560 570 840 850 860 870 pF1KB9 EIVIDAVK-PYCRD--GE-DIWKASRFRIIITTCSSSGLFYQ-------IGV---RVG-- . . . : .: :: . .:.: . : :. .:. :.. CCDS74 DSMPELQKLQQLKDETGELSSADEKRYRALKRTAERELLMNADVICCTCVGAGDPRLAKM 580 590 600 610 620 630 880 890 900 910 920 930 pF1KB9 HFTHVFVDEAGQASEPECLIPLGLMSDISGQIVLAGDPMQLGPVIKSRLAMAYGLNVSFL .: ...::. ::.::::..:. : . :..:.:: :::::. . : ::. :.. CCDS74 QFRSILIDESTQATEPECMVPVVLGAK---QLILVGDHCQLGPVVMCKKAAKAGLSQSLF 640 650 660 670 680 690 940 950 960 970 980 990 pF1KB9 ERLMSRPAYQRDENAFGACGAHNPLLVTKLVKNYRSHEALLMLPSRLFYHRELE--VCAD :::. ..: :. .: .:: : :: .:: .::. :. : : CCDS74 ERLV----------VLGI----RPI---RLQVQYRMHPALSAFPSNIFYEGSLQNGVTAA 700 710 720 730 1000 1010 1020 1030 1040 1050 pF1KB9 PTVVTSL-LGWEKLPKKGFPLIFHGVRGSEAREGKSPSWFNPAEAVQVLRYCCLLAHSIS : .. . : . : : :..:. ..:.: ... :..: .::..: . : .. CCDS74 DRVKKGFDFQWPQ-PDK--PMFFYVTQGQEEIASSGTSYLNRTEAANVEKITTKL---LK 740 750 760 770 780 790 1060 1070 1080 1090 1100 pF1KB9 SQVSASDIGVITPYRKQ----VEKIRIL--LRNVDLMDIKVGSVEEFQGQEYLVIIISTV . .. ..::.::::. : :. ... :.. ......::. :::.: ::.: : CCDS74 AGAKPDQIGIITPYEGQRSYLVQYMQFSGSLHTKLYQEVEIASVDAFQGREKDFIILSCV 800 810 820 830 840 850 1110 1120 1130 1140 1150 1160 pF1KB9 RSNEDRFEDDRYFLGFLSNSKRFNVAITRPKALLIVLGNPHVLVRDPCFGALLEYSITNG :.:: . .:::.. .:.:::.:: . .:..:::..: ..: .. ::.: CCDS74 RANEHQG------IGFLNDPRRLNVALTRARYGVIIVGNPKALSKQPLWNHLLNYYKEQK 860 870 880 890 900 1170 1180 1190 1200 1210 pF1KB9 VYMGCDLPPALQSLQNCGEGVADPSYPVVPESTGPEKHQEPS CCDS74 VLVEGPLNNLRESLMQFSKPRKLVNTINPGARFMTTAMYDAREAIIPGSVYDRSSQGRPS 910 920 930 940 950 960 1211 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 17:26:57 2016 done: Fri Nov 4 17:26:58 2016 Total Scan time: 5.090 Total Display time: 0.400 Function used was FASTA [36.3.4 Apr, 2011]