FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5718, 971 aa 1>>>pF1KE5718 971 - 971 aa - 971 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.9617+/-0.00104; mu= 17.5160+/- 0.063 mean_var=67.7762+/-13.057, 0's: 0 Z-trim(103.1): 19 B-trim: 5 in 1/48 Lambda= 0.155789 statistics sampled from 7225 (7237) to 7225 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.574), E-opt: 0.2 (0.222), width: 16 Scan time: 3.840 The best scores are: opt bits E(32554) CCDS10214.1 DIS3L gene_id:115752|Hs108|chr15 ( 971) 6497 1469.9 0 CCDS45286.1 DIS3L gene_id:115752|Hs108|chr15 (1054) 6497 1469.9 0 CCDS9447.1 DIS3 gene_id:22894|Hs108|chr13 ( 958) 1016 238.0 6.6e-62 CCDS42834.1 DIS3L2 gene_id:129563|Hs108|chr2 ( 885) 1015 237.8 7.2e-62 CCDS45057.1 DIS3 gene_id:22894|Hs108|chr13 ( 928) 967 227.0 1.3e-58 CCDS81772.1 DIS3 gene_id:22894|Hs108|chr13 ( 796) 929 218.5 4.3e-56 CCDS58752.1 DIS3L2 gene_id:129563|Hs108|chr2 ( 603) 556 134.6 5.7e-31 CCDS13527.1 HELZ2 gene_id:85441|Hs108|chr20 (2080) 433 107.1 3.8e-22 CCDS33508.1 HELZ2 gene_id:85441|Hs108|chr20 (2649) 433 107.1 4.8e-22 >>CCDS10214.1 DIS3L gene_id:115752|Hs108|chr15 (971 aa) initn: 6497 init1: 6497 opt: 6497 Z-score: 7882.4 bits: 1469.9 E(32554): 0 Smith-Waterman score: 6497; 100.0% identity (100.0% similar) in 971 aa overlap (1-971:1-971) 10 20 30 40 50 60 pF1KE5 MQTACQAVQHQRGRRQYNKLRNLLKDARHDCILFANEFQQCCYLPRERGESMEKWQTRSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MQTACQAVQHQRGRRQYNKLRNLLKDARHDCILFANEFQQCCYLPRERGESMEKWQTRSI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 YNAAVWYYHHCQDRMPIVMVTEDEEAIQQYGSETEGVFVITFKNYLDNFWPDLKAAHELC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 YNAAVWYYHHCQDRMPIVMVTEDEEAIQQYGSETEGVFVITFKNYLDNFWPDLKAAHELC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 DSILQSRRERENESQESHGKEYPEHLPLEVLEAGIKSGRYIQGILNVNKHRAQIEAFVRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 DSILQSRRERENESQESHGKEYPEHLPLEVLEAGIKSGRYIQGILNVNKHRAQIEAFVRL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 QGASSKDSDLVSDILIHGMKARNRSIHGDVVVVELLPKNEWKGRTVALCENDCDDKASGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 QGASSKDSDLVSDILIHGMKARNRSIHGDVVVVELLPKNEWKGRTVALCENDCDDKASGE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 SPSEPMPTGRVVGILQKNWRDYVVTFPSKEEVQSQGKNAQKILVTPWDYRIPKIRISTQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 SPSEPMPTGRVVGILQKNWRDYVVTFPSKEEVQSQGKNAQKILVTPWDYRIPKIRISTQQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 AETLQDFRVVVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENSISVIPFSEAQM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 AETLQDFRVVVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENSISVIPFSEAQM 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 CEMPVNTPESPWKVSPEEEQKRKDLRKSHLVFSIDPKGCEDVDDTLSVRTLNNGNLELGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 CEMPVNTPESPWKVSPEEEQKRKDLRKSHLVFSIDPKGCEDVDDTLSVRTLNNGNLELGV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 HIADVTHFVAPNSYIDIEARTRATTYYLADRRYDMLPSVLSADLCSLLGGVDRYAVSIMW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 HIADVTHFVAPNSYIDIEARTRATTYYLADRRYDMLPSVLSADLCSLLGGVDRYAVSIMW 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE5 ELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFKDLDEKSRQAKLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFKDLDEKSRQAKLE 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE5 ELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIPKQPLEVHETVAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIPKQPLEVHETVAE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE5 CMILANHWVAKKIWESFPHQALLRQHPPPHQEFFSELRECAKAKGFFIDTRSNKTLADSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 CMILANHWVAKKIWESFPHQALLRQHPPPHQEFFSELRECAKAKGFFIDTRSNKTLADSL 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE5 DNANDPHDPIVNRLLRSMATQAMSNALYFSTGSCAEEEFHHYGLALDKYTHFTSPIRRYS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 DNANDPHDPIVNRLLRSMATQAMSNALYFSTGSCAEEEFHHYGLALDKYTHFTSPIRRYS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE5 DIVVHRLLMAAISKDKKMEIKGNLFSNKDLEELCRHINNRNQAAQHSQKQSTELFQCMYF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 DIVVHRLLMAAISKDKKMEIKGNLFSNKDLEELCRHINNRNQAAQHSQKQSTELFQCMYF 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE5 KDKDPATEERCISDGVIYSIRTNGVLLFIPRFGIKGAAYLKNKDGLVISCGPDSCSEWKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 KDKDPATEERCISDGVIYSIRTNGVLLFIPRFGIKGAAYLKNKDGLVISCGPDSCSEWKP 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE5 GSLQRFQNKITSTTTDGESVTFHLFDHVTVRISIQASRCHSDTIRLEIISNKPYKIPNTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GSLQRFQNKITSTTTDGESVTFHLFDHVTVRISIQASRCHSDTIRLEIISNKPYKIPNTE 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE5 LIHQSSPLLKSELVKEVTKSVEEAQLAQEVKVNIIQEEYQEYRQTKGRSLYTLLEEIRDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LIHQSSPLLKSELVKEVTKSVEEAQLAQEVKVNIIQEEYQEYRQTKGRSLYTLLEEIRDL 910 920 930 940 950 960 970 pF1KE5 ALLDVSNNYGI ::::::::::: CCDS10 ALLDVSNNYGI 970 >>CCDS45286.1 DIS3L gene_id:115752|Hs108|chr15 (1054 aa) initn: 6497 init1: 6497 opt: 6497 Z-score: 7881.8 bits: 1469.9 E(32554): 0 Smith-Waterman score: 6497; 100.0% identity (100.0% similar) in 971 aa overlap (1-971:84-1054) 10 20 30 pF1KE5 MQTACQAVQHQRGRRQYNKLRNLLKDARHD :::::::::::::::::::::::::::::: CCDS45 DVTHYVIPDWKVVQDYLEILEFPELKGIIFMQTACQAVQHQRGRRQYNKLRNLLKDARHD 60 70 80 90 100 110 40 50 60 70 80 90 pF1KE5 CILFANEFQQCCYLPRERGESMEKWQTRSIYNAAVWYYHHCQDRMPIVMVTEDEEAIQQY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 CILFANEFQQCCYLPRERGESMEKWQTRSIYNAAVWYYHHCQDRMPIVMVTEDEEAIQQY 120 130 140 150 160 170 100 110 120 130 140 150 pF1KE5 GSETEGVFVITFKNYLDNFWPDLKAAHELCDSILQSRRERENESQESHGKEYPEHLPLEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 GSETEGVFVITFKNYLDNFWPDLKAAHELCDSILQSRRERENESQESHGKEYPEHLPLEV 180 190 200 210 220 230 160 170 180 190 200 210 pF1KE5 LEAGIKSGRYIQGILNVNKHRAQIEAFVRLQGASSKDSDLVSDILIHGMKARNRSIHGDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LEAGIKSGRYIQGILNVNKHRAQIEAFVRLQGASSKDSDLVSDILIHGMKARNRSIHGDV 240 250 260 270 280 290 220 230 240 250 260 270 pF1KE5 VVVELLPKNEWKGRTVALCENDCDDKASGESPSEPMPTGRVVGILQKNWRDYVVTFPSKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 VVVELLPKNEWKGRTVALCENDCDDKASGESPSEPMPTGRVVGILQKNWRDYVVTFPSKE 300 310 320 330 340 350 280 290 300 310 320 330 pF1KE5 EVQSQGKNAQKILVTPWDYRIPKIRISTQQAETLQDFRVVVRIDSWESTSVYPNGHFVRV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 EVQSQGKNAQKILVTPWDYRIPKIRISTQQAETLQDFRVVVRIDSWESTSVYPNGHFVRV 360 370 380 390 400 410 340 350 360 370 380 390 pF1KE5 LGRIGDLEGEIATILVENSISVIPFSEAQMCEMPVNTPESPWKVSPEEEQKRKDLRKSHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LGRIGDLEGEIATILVENSISVIPFSEAQMCEMPVNTPESPWKVSPEEEQKRKDLRKSHL 420 430 440 450 460 470 400 410 420 430 440 450 pF1KE5 VFSIDPKGCEDVDDTLSVRTLNNGNLELGVHIADVTHFVAPNSYIDIEARTRATTYYLAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 VFSIDPKGCEDVDDTLSVRTLNNGNLELGVHIADVTHFVAPNSYIDIEARTRATTYYLAD 480 490 500 510 520 530 460 470 480 490 500 510 pF1KE5 RRYDMLPSVLSADLCSLLGGVDRYAVSIMWELDKASYEIKKVWYGRTIIRSAYKLFYEAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 RRYDMLPSVLSADLCSLLGGVDRYAVSIMWELDKASYEIKKVWYGRTIIRSAYKLFYEAA 540 550 560 570 580 590 520 530 540 550 560 570 pF1KE5 QELLDGNLSVVDDIPEFKDLDEKSRQAKLEELVWAIGKLTDIARHVRAKRDGCGALELEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 QELLDGNLSVVDDIPEFKDLDEKSRQAKLEELVWAIGKLTDIARHVRAKRDGCGALELEG 600 610 620 630 640 650 580 590 600 610 620 630 pF1KE5 VEVCVQLDDKKNIHDLIPKQPLEVHETVAECMILANHWVAKKIWESFPHQALLRQHPPPH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 VEVCVQLDDKKNIHDLIPKQPLEVHETVAECMILANHWVAKKIWESFPHQALLRQHPPPH 660 670 680 690 700 710 640 650 660 670 680 690 pF1KE5 QEFFSELRECAKAKGFFIDTRSNKTLADSLDNANDPHDPIVNRLLRSMATQAMSNALYFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 QEFFSELRECAKAKGFFIDTRSNKTLADSLDNANDPHDPIVNRLLRSMATQAMSNALYFS 720 730 740 750 760 770 700 710 720 730 740 750 pF1KE5 TGSCAEEEFHHYGLALDKYTHFTSPIRRYSDIVVHRLLMAAISKDKKMEIKGNLFSNKDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 TGSCAEEEFHHYGLALDKYTHFTSPIRRYSDIVVHRLLMAAISKDKKMEIKGNLFSNKDL 780 790 800 810 820 830 760 770 780 790 800 810 pF1KE5 EELCRHINNRNQAAQHSQKQSTELFQCMYFKDKDPATEERCISDGVIYSIRTNGVLLFIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 EELCRHINNRNQAAQHSQKQSTELFQCMYFKDKDPATEERCISDGVIYSIRTNGVLLFIP 840 850 860 870 880 890 820 830 840 850 860 870 pF1KE5 RFGIKGAAYLKNKDGLVISCGPDSCSEWKPGSLQRFQNKITSTTTDGESVTFHLFDHVTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 RFGIKGAAYLKNKDGLVISCGPDSCSEWKPGSLQRFQNKITSTTTDGESVTFHLFDHVTV 900 910 920 930 940 950 880 890 900 910 920 930 pF1KE5 RISIQASRCHSDTIRLEIISNKPYKIPNTELIHQSSPLLKSELVKEVTKSVEEAQLAQEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 RISIQASRCHSDTIRLEIISNKPYKIPNTELIHQSSPLLKSELVKEVTKSVEEAQLAQEV 960 970 980 990 1000 1010 940 950 960 970 pF1KE5 KVNIIQEEYQEYRQTKGRSLYTLLEEIRDLALLDVSNNYGI ::::::::::::::::::::::::::::::::::::::::: CCDS45 KVNIIQEEYQEYRQTKGRSLYTLLEEIRDLALLDVSNNYGI 1020 1030 1040 1050 >>CCDS9447.1 DIS3 gene_id:22894|Hs108|chr13 (958 aa) initn: 1229 init1: 378 opt: 1016 Z-score: 1224.8 bits: 238.0 E(32554): 6.6e-62 Smith-Waterman score: 1760; 36.5% identity (64.8% similar) in 930 aa overlap (1-908:91-944) 10 20 30 pF1KE5 MQTACQAVQHQRGRRQYNKLRNLLKDARHD .::. : :.. :. :...:.. .. .. CCDS94 PQPHYLLPDTNVLLHQIDVLEDPAIRNVIVLQTVLQEVRN-RSAPVYKRIRDVTNNQEKH 70 80 90 100 110 40 50 60 70 80 pF1KE5 CILFANEFQQCCYLPRERGESMEKWQTRSIYNAAVWYYHHCQ-----DRMPIVMVTEDEE :.:: .. :. .:.::. . . :.: :: :: .: . ... ....:.:.. CCDS94 FYTFTNEHHRETYVEQEQGENANDRNDRAIRVAAKWYNEHLKKMSADNQLQVIFITNDRR 120 130 140 150 160 170 90 100 110 120 130 140 pF1KE5 AIQQYGSETEGVFVITFKNYLDNFWPDLKAAHELCDSILQSRRERENESQESHGKEYPEH .. . ::. ..: ..:. . : : :: : : :. :: :: . :: CCDS94 NKEK--AIEEGIPAFTCEEYVKS----LTANPELIDR-LACLSEEGNEI-ESGKIIFSEH 180 190 200 210 220 230 150 160 170 180 190 200 pF1KE5 LPLEVLEAGIKSGRYIQGILNVNKHRAQIEAFVRLQGASSKDSDLVSDILIHGMKARNRS ::: :. ::::: :.:: . .... .:: : ..: :.. ..:...:.: ::. CCDS94 LPLSKLQQGIKSGTYLQGTFRASREN-YLEATVWIHG----DNEENKEIILQGLKHLNRA 240 250 260 270 280 210 220 230 240 250 pF1KE5 IHGDVVVVELLPKNEWKG-RTVAL-----CENDCDDKASGE-----SPSEPM--PTGRVV .: :.:.::::::..: . .:.: :.: . . : . :: : :::::: CCDS94 VHEDIVAVELLPKSQWVAPSSVVLHDEGQNEEDVEKEEETERMLKTAVSEKMLKPTGRVV 290 300 310 320 330 340 260 270 280 290 300 310 pF1KE5 GILQKNWRDYVVTFPSKEEVQSQGKNAQKILVTPWDYRIPKIRISTQQAETLQDFRVVVR ::...::: : . :: .. :.... : :: : :::.::: :.:: ::. :..: CCDS94 GIIKRNWRPYCGML-SKSDI----KESRRHLFTPADKRIPRIRIETRQASTLEGRRIIVA 350 360 370 380 390 400 320 330 340 350 360 370 pF1KE5 IDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENSISVIPFSEAQMCEMPVNTPESPW ::.: .: :::::::: :: .:. : : ..:.:... :::.: . .: . :: CCDS94 IDGWPRNSRYPNGHFVRNLGDVGEKETETEVLLLEHDVPHQPFSQAVLSFLP----KMPW 410 420 430 440 450 380 390 400 410 420 430 pF1KE5 KVSPEEEQKRKDLRKSHL-VFSIDPKGCEDVDDTLSVRTLNNGNLELGVHIADVTHFVAP ... .. ..:.::: :: . :.:: :: :.::.: : :.:::::.:::::::.::. : CCDS94 SITEKDMKNREDLR--HLCICSVDPPGCTDIDDALHCRELENGNLEVGVHIADVSHFIRP 460 470 480 490 500 510 440 450 460 470 480 490 pF1KE5 NSYIDIEARTRATTYYLADRRYDMLPSVLSADLCSLLGGVDRYAVSIMWELDKASYEIKK .. .: :. :.:: :: ..: ::.: .::..:::: ::: : : .::... . :: : CCDS94 GNALDQESARRGTTVYLCEKRIDMVPELLSSNLCSLKCDVDRLAFSCIWEMNHNA-EILK 520 530 540 550 560 570 500 510 520 530 540 550 pF1KE5 VWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFKDLDEKSRQAKLEELVWAIGKLTD . . ...: : .: : :: .:. .. ::: ..:. ...::. CCDS94 TKFTKSVINSKASLTYAEAQLRIDSA-NMNDDIT-----------TSLR----GLNKLAK 580 590 600 610 560 570 580 590 600 pF1KE5 IARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIPKQPLEVHET---VAECMILANHW : .. : .. ::: : . :: ..:.. :: : : :..:: : : :.::: CCDS94 ILKKRRIEK---GALTLSSPEVRFHMDSET--HDPIDLQTKELRETNSMVEEFMLLANIS 620 630 640 650 660 670 610 620 630 640 650 660 pF1KE5 VAKKIWESFPHQALLRQHPPPHQEFFSELRECAKAKGFFIDTRSNKTLADSLDNANDPHD ::::: : : ..::::.:: : . : . :..... : : . :.::.:::.:..: CCDS94 VAKKIHEEFSEHALLRKHPAPPPSNYEILVKAARSRNLEIKTDTAKSLAESLDQAESPTF 680 690 700 710 720 730 670 680 690 700 710 720 pF1KE5 PIVNRLLRSMATQAMSNALYFSTGSCAEEEFHHYGLALDKYTHFTSPIRRYSDIVVHRLL : .: ::: .::. : .:.:: .: ...::::::: :::::::::::.:..::::: CCDS94 PYLNTLLRILATRCMMQAVYFCSG--MDNDFHHYGLASPIYTHFTSPIRRYADVIVHRLL 740 750 760 770 780 790 730 740 750 760 770 780 pF1KE5 MAAISKDKKMEIKGNLFSNKDLEELCRHINNRNQAAQHSQKQSTELFQCMYFKDKDPATE .::. : . .: ... : ..:...: :.. ::..:. :. . ..::.: ..: CCDS94 AVAIGADCTYP---ELTDKHKLADICKNLNFRHKMAQYAQRASVAFHTQLFFKSKGIVSE 800 810 820 830 840 790 800 810 820 830 840 pF1KE5 ERCISDGVIYSIRTNGVLLFIPRFGIKGAAYLKNKDGLVISCGPDSCSEWKPGSLQRFQN : . : .: :.....::..:..:......:: ::. ... CCDS94 E-----AYILFVRKNAIVVLIPKYGLEGTVFFEEKD--------------KPNPQLIYDD 850 860 870 880 850 860 870 880 890 900 pF1KE5 KITSTTTDGESVTFHLFDHVTVRISIQASRCHSDTIRLEIISNKPYKIPNTELIHQSSPL .: : :...::.::.: :.: ...: . . ::. .. .: .::. . ..: . CCDS94 EIPSLKI--EDTVFHVFDKVKVKIMLDSSNLQHQKIRMSLV--EP-QIPGISIPTDTSNM 890 900 910 920 930 940 910 920 930 940 950 960 pF1KE5 LKSELVKEVTKSVEEAQLAQEVKVNIIQEEYQEYRQTKGRSLYTLLEEIRDLALLDVSNN CCDS94 DLNGPKKKKMKLGK 950 >>CCDS42834.1 DIS3L2 gene_id:129563|Hs108|chr2 (885 aa) initn: 861 init1: 289 opt: 1015 Z-score: 1224.2 bits: 237.8 E(32554): 7.2e-62 Smith-Waterman score: 1062; 30.2% identity (56.2% similar) in 825 aa overlap (129-845:34-827) 100 110 120 130 140 150 pF1KE5 VITFKNYLDNFWPDLKAAHELCDSILQSRRERENESQESHGKE---YPEHLPLEVLEAGI ....... ..::. . .. : . :. CCDS42 PDYRMNLRPLGTPRGVSAVAGPHDIGASPGDKKSKNRSTRGKKKSIFETYMSKEDVSEGL 10 20 30 40 50 60 160 170 180 190 200 210 pF1KE5 KSGRYIQGILNVNKHRAQIEAFVRLQGASSKDSDLVSDILIHGMKARNRSIHGDVVVVEL : : :::.: .: .. . :::. : :.: ::.: :. ::::...::.:::.: CCDS42 KRGTLIQGVLRINPKKFH-EAFI-----PSPDGD--RDIFIDGVVARNRALNGDLVVVKL 70 80 90 100 110 220 230 240 250 pF1KE5 LPKNEWKGRTVALCENDCDDKASGES--PSE------PMPTGR-------VV-------- ::...:: .: :: . .:. :: : : :. . . :. CCDS42 LPEEHWK--VVKPESNDKETEAAYESDIPEELCGHHLPQQSLKSYNDSPDVIVEAQFDGS 120 130 140 150 160 170 260 270 pF1KE5 ------GILQKNWRDYVVTF--------------P-SKEEV------------QSQGKNA :: :. : : . : .:.:. .: ..: CCDS42 DSEDGHGITQNVLVDGVKKLSVCVSEKGREDGDAPVTKDETTCISQDTRALSEKSLQRSA 180 190 200 210 220 230 280 290 300 pF1KE5 QKI------------------------------LVTPWDYRIPKIRISTQQAETLQDFRV . . : .: :.:.:.: . .. ::: . CCDS42 KVVYILEKKHSRAATGFLKLLADKNSELFRKYALFSPSDHRVPRIYVPLKDCP--QDFVA 240 250 260 270 280 290 310 320 330 340 350 pF1KE5 ----------VVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENSISVIPFSEAQ . :: .:. . :.... ::. :..: : ::.: ... :: CCDS42 RPKDYANTLFICRIVDWKEDCNFALGQLAKSLGQAGEIEPETEGILTEYGVDFSDFSSEV 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 MCEMPVNTPESPWKVSPEEEQKRKDLRKSHLVFSIDPKGCEDVDDTLSVRTLNNGNLELG . .: . :: . ::: .::.::::. .:.:::. .:.::.:: . : .::...: CCDS42 LECLPQGL---PWTIPPEEFSKRRDLRKD-CIFTIDPSTARDLDDALSCKPLADGNFKVG 360 370 380 390 400 420 430 440 450 460 470 pF1KE5 VHIADVTHFVAPNSYIDIEARTRATTYYLADRRYDMLPSVLSADLCSLLGGVDRYAVSIM ::::::..:: .: .: : :::. ::... ::: .: .:::: :. . :.. CCDS42 VHIADVSYFVPEGSDLDKVAAERATSVYLVQKVVPMLPRLLCEELCSLNPMSDKLTFSVI 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE5 WELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFKDLDEKSRQAKL : : . .: :.::::::: :: :: :: ... : .. :: :.: : . . CCDS42 WTLTPEG-KILDEWFGRTIIRSCTKLSYEHAQSMIE---SPTEKIPA-KELPPISPEHSS 470 480 490 500 510 520 540 550 560 570 580 590 pF1KE5 EELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNI-HDLIPKQPLEVHETV ::. :. .: ::...: .: :::.:. ... :: . .. . . : .. : CCDS42 EEVHQAVLNLHGIAKQLRQQRFVDGALRLDQLKLAFTLDHETGLPQGCHIYEYRESNKLV 530 540 550 560 570 580 600 610 620 630 640 650 pF1KE5 AECMILANHWVAKKIWESFPHQALLRQHPPPHQEFFSELRECAKAKGFFIDTRSNKTLAD : :.::: ::.:: ..::.:::::.::::. ...:.: : :. .: : .: CCDS42 EEFMLLANMAVAHKIHRAFPEQALLRRHPPPQTRMLSDLVEFCDQMGLPVDFSSAGALNK 590 600 610 620 630 640 660 670 680 690 700 710 pF1KE5 SLDNA--NDPHDPIVNRLLRSMATQAMSNALYFSTGSCAEE-EFHHYGLALDKYTHFTSP :: .. .: .. ...: .: .. :. :::: .: . .:.::.: . ::::::: CCDS42 SLTQTFGDDKYSLARKEVLTNMCSRPMQMALYFCSGLLQDPAQFRHYALNVPLYTHFTSP 650 660 670 680 690 700 720 730 740 750 760 770 pF1KE5 IRRYSDIVVHRLLMAAISKDKKMEIKGNLFSNKDLEELCRHINNRNQAAQHSQKQSTELF :::..:..::::: ::.. ..... . :.. : :.: .:... :. :: :: CCDS42 IRRFADVLVHRLLAAALGYRERLDMAPDT-----LQKQADHCNDRRMASKRVQELSTSLF 710 720 730 740 750 780 790 800 810 820 830 pF1KE5 QCMYFKDKDPATEERCISDGVIYSIRTNGVLLFIPRFGIKGAAY-----LKNKDGLVISC . :.. : :......: .. ... :.:.. : :... .. CCDS42 FAVLVKESGPLE-----SEAMVMGILKQAFDVLVLRYGVQKRIYCNALALRSHHFQKVGK 760 770 780 790 800 810 840 850 860 870 880 890 pF1KE5 GPDSCSEWKPGSLQRFQNKITSTTTDGESVTFHLFDHVTVRISIQASRCHSDTIRLEIIS :. :.: .... CCDS42 KPELTLVWEPEDMEQEPAQQVITIFSLVEVVLQAESTALKYSAILKRPGTQGHLGPEKEE 820 830 840 850 860 870 >>CCDS45057.1 DIS3 gene_id:22894|Hs108|chr13 (928 aa) initn: 1195 init1: 378 opt: 967 Z-score: 1165.6 bits: 227.0 E(32554): 1.3e-58 Smith-Waterman score: 1711; 36.8% identity (64.3% similar) in 888 aa overlap (43-908:102-914) 20 30 40 50 60 70 pF1KE5 GRRQYNKLRNLLKDARHDCILFANEFQQCCYLPRERGESMEKWQTRSIYNAAVWYYHHCQ :. .:.::. . . :.: :: :: .: . CCDS45 VLLHQIVSAWRPGTWASVASSLRLPGSLETYVEQEQGENANDRNDRAIRVAAKWYNEHLK 80 90 100 110 120 130 80 90 100 110 120 pF1KE5 -----DRMPIVMVTEDEEAIQQYGSETEGVFVITFKNYLDNFWPDLKAAHELCDSILQSR ... ....:.:.. .. . ::. ..: ..:. . : : :: : : CCDS45 KMSADNQLQVIFITNDRRNKEK--AIEEGIPAFTCEEYVKS----LTANPELIDR-LACL 140 150 160 170 180 130 140 150 160 170 180 pF1KE5 RERENESQESHGKEYPEHLPLEVLEAGIKSGRYIQGILNVNKHRAQIEAFVRLQGASSKD :. :: :: . ::::: :. ::::: :.:: . .... .:: : ..: : CCDS45 SEEGNEI-ESGKIIFSEHLPLSKLQQGIKSGTYLQGTFRASREN-YLEATVWIHG----D 190 200 210 220 230 190 200 210 220 230 240 pF1KE5 SDLVSDILIHGMKARNRSIHGDVVVVELLPKNEWKG-RTVAL-----CENDCDDKASGE- .. ..:...:.: ::..: :.:.::::::..: . .:.: :.: . . : CCDS45 NEENKEIILQGLKHLNRAVHEDIVAVELLPKSQWVAPSSVVLHDEGQNEEDVEKEEETER 240 250 260 270 280 290 250 260 270 280 290 pF1KE5 ----SPSEPM--PTGRVVGILQKNWRDYVVTFPSKEEVQSQGKNAQKILVTPWDYRIPKI . :: : ::::::::...::: : . :: .. :.... : :: : :::.: CCDS45 MLKTAVSEKMLKPTGRVVGIIKRNWRPYCGML-SKSDI----KESRRHLFTPADKRIPRI 300 310 320 330 340 350 300 310 320 330 340 350 pF1KE5 RISTQQAETLQDFRVVVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENSISVIP :: :.:: ::. :..: ::.: .: :::::::: :: .:. : : ..:.:... : CCDS45 RIETRQASTLEGRRIIVAIDGWPRNSRYPNGHFVRNLGDVGEKETETEVLLLEHDVPHQP 360 370 380 390 400 410 360 370 380 390 400 410 pF1KE5 FSEAQMCEMPVNTPESPWKVSPEEEQKRKDLRKSHL-VFSIDPKGCEDVDDTLSVRTLNN ::.: . .: . ::... .. ..:.::: :: . :.:: :: :.::.: : :.: CCDS45 FSQAVLSFLP----KMPWSITEKDMKNREDLR--HLCICSVDPPGCTDIDDALHCRELEN 420 430 440 450 460 420 430 440 450 460 470 pF1KE5 GNLELGVHIADVTHFVAPNSYIDIEARTRATTYYLADRRYDMLPSVLSADLCSLLGGVDR ::::.:::::::.::. :.. .: :. :.:: :: ..: ::.: .::..:::: ::: CCDS45 GNLEVGVHIADVSHFIRPGNALDQESARRGTTVYLCEKRIDMVPELLSSNLCSLKCDVDR 470 480 490 500 510 520 480 490 500 510 520 530 pF1KE5 YAVSIMWELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFKDLDEK : : .::... . :: :. . ...: : .: : :: .:. .. ::: CCDS45 LAFSCIWEMNHNA-EILKTKFTKSVINSKASLTYAEAQLRIDSA-NMNDDITT------- 530 540 550 560 570 540 550 560 570 580 590 pF1KE5 SRQAKLEELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIPKQPLE .. :. .:. .. .: ::: : . :: ..:.. :: : : : CCDS45 -----------SLRGLNKLAKILKKRRIEKGALTLSSPEVRFHMDSET--HDPIDLQTKE 580 590 600 610 620 600 610 620 630 640 650 pF1KE5 VHET---VAECMILANHWVAKKIWESFPHQALLRQHPPPHQEFFSELRECAKAKGFFIDT ..:: : : :.::: ::::: : : ..::::.:: : . : . :..... : : CCDS45 LRETNSMVEEFMLLANISVAKKIHEEFSEHALLRKHPAPPPSNYEILVKAARSRNLEIKT 630 640 650 660 670 680 660 670 680 690 700 710 pF1KE5 RSNKTLADSLDNANDPHDPIVNRLLRSMATQAMSNALYFSTGSCAEEEFHHYGLALDKYT . :.::.:::.:..: : .: ::: .::. : .:.:: .: ...::::::: :: CCDS45 DTAKSLAESLDQAESPTFPYLNTLLRILATRCMMQAVYFCSG--MDNDFHHYGLASPIYT 690 700 710 720 730 740 720 730 740 750 760 770 pF1KE5 HFTSPIRRYSDIVVHRLLMAAISKDKKMEIKGNLFSNKDLEELCRHINNRNQAAQHSQKQ :::::::::.:..::::: .::. : . .: ... : ..:...: :.. ::..:. CCDS45 HFTSPIRRYADVIVHRLLAVAIGADCTYP---ELTDKHKLADICKNLNFRHKMAQYAQRA 750 760 770 780 790 800 780 790 800 810 820 830 pF1KE5 STELFQCMYFKDKDPATEERCISDGVIYSIRTNGVLLFIPRFGIKGAAYLKNKDGLVISC :. . ..::.: ..:: . : .: :.....::..:..:......:: CCDS45 SVAFHTQLFFKSKGIVSEE-----AYILFVRKNAIVVLIPKYGLEGTVFFEEKD------ 810 820 830 840 840 850 860 870 880 890 pF1KE5 GPDSCSEWKPGSLQRFQNKITSTTTDGESVTFHLFDHVTVRISIQASRCHSDTIRLEIIS ::. ....: : :...::.::.: :.: ...: . . ::. .. CCDS45 --------KPNPQLIYDDEIPSLKI--EDTVFHVFDKVKVKIMLDSSNLQHQKIRMSLV- 850 860 870 880 890 900 910 920 930 940 950 pF1KE5 NKPYKIPNTELIHQSSPLLKSELVKEVTKSVEEAQLAQEVKVNIIQEEYQEYRQTKGRSL .: .::. . ..: . CCDS45 -EP-QIPGISIPTDTSNMDLNGPKKKKMKLGK 900 910 920 >>CCDS81772.1 DIS3 gene_id:22894|Hs108|chr13 (796 aa) initn: 1153 init1: 378 opt: 929 Z-score: 1120.5 bits: 218.5 E(32554): 4.3e-56 Smith-Waterman score: 1659; 37.4% identity (65.1% similar) in 853 aa overlap (73-908:5-782) 50 60 70 80 90 100 pF1KE5 YLPRERGESMEKWQTRSIYNAAVWYYHHCQDRMPIVMVTEDEEAIQQYGSETEGVFVITF ... ....:.:.. .. . ::. ..: CCDS81 MSADNQLQVIFITNDRRNKEK--AIEEGIPAFTC 10 20 30 110 120 130 140 150 160 pF1KE5 KNYLDNFWPDLKAAHELCDSILQSRRERENESQESHGKEYPEHLPLEVLEAGIKSGRYIQ ..:. . : : :: : : :. :: :: . ::::: :. ::::: :.: CCDS81 EEYVKS----LTANPELIDR-LACLSEEGNEI-ESGKIIFSEHLPLSKLQQGIKSGTYLQ 40 50 60 70 80 170 180 190 200 210 220 pF1KE5 GILNVNKHRAQIEAFVRLQGASSKDSDLVSDILIHGMKARNRSIHGDVVVVELLPKNEWK : . .... .:: : ..: :.. ..:...:.: ::..: :.:.::::::..: CCDS81 GTFRASREN-YLEATVWIHG----DNEENKEIILQGLKHLNRAVHEDIVAVELLPKSQWV 90 100 110 120 130 140 230 240 250 260 pF1KE5 G-RTVAL-----CENDCDDKASGE-----SPSEPM--PTGRVVGILQKNWRDYVVTFPSK . .:.: :.: . . : . :: : ::::::::...::: : . :: CCDS81 APSSVVLHDEGQNEEDVEKEEETERMLKTAVSEKMLKPTGRVVGIIKRNWRPYCGML-SK 150 160 170 180 190 200 270 280 290 300 310 320 pF1KE5 EEVQSQGKNAQKILVTPWDYRIPKIRISTQQAETLQDFRVVVRIDSWESTSVYPNGHFVR .. :.... : :: : :::.::: :.:: ::. :..: ::.: .: :::::::: CCDS81 SDI----KESRRHLFTPADKRIPRIRIETRQASTLEGRRIIVAIDGWPRNSRYPNGHFVR 210 220 230 240 250 330 340 350 360 370 380 pF1KE5 VLGRIGDLEGEIATILVENSISVIPFSEAQMCEMPVNTPESPWKVSPEEEQKRKDLRKSH :: .:. : : ..:.:... :::.: . .: . ::... .. ..:.::: : CCDS81 NLGDVGEKETETEVLLLEHDVPHQPFSQAVLSFLP----KMPWSITEKDMKNREDLR--H 260 270 280 290 300 310 390 400 410 420 430 440 pF1KE5 L-VFSIDPKGCEDVDDTLSVRTLNNGNLELGVHIADVTHFVAPNSYIDIEARTRATTYYL : . :.:: :: :.::.: : :.:::::.:::::::.::. :.. .: :. :.:: :: CCDS81 LCICSVDPPGCTDIDDALHCRELENGNLEVGVHIADVSHFIRPGNALDQESARRGTTVYL 320 330 340 350 360 370 450 460 470 480 490 500 pF1KE5 ADRRYDMLPSVLSADLCSLLGGVDRYAVSIMWELDKASYEIKKVWYGRTIIRSAYKLFYE ..: ::.: .::..:::: ::: : : .::... . :: :. . ...: : .: : CCDS81 CEKRIDMVPELLSSNLCSLKCDVDRLAFSCIWEMNHNA-EILKTKFTKSVINSKASLTYA 380 390 400 410 420 510 520 530 540 550 560 pF1KE5 AAQELLDGNLSVVDDIPEFKDLDEKSRQAKLEELVWAIGKLTDIARHVRAKRDGCGALEL :: .: . .. ::: ..:. : .::. : .. : .. ::: : CCDS81 EAQLRID-SANMNDDIT-----------TSLRGL----NKLAKILKKRRIEK---GALTL 430 440 450 460 470 570 580 590 600 610 620 pF1KE5 EGVEVCVQLDDKKNIHDLIPKQPLEVHET---VAECMILANHWVAKKIWESFPHQALLRQ . :: ..:.. :: : : :..:: : : :.::: ::::: : : ..::::. CCDS81 SSPEVRFHMDSET--HDPIDLQTKELRETNSMVEEFMLLANISVAKKIHEEFSEHALLRK 480 490 500 510 520 630 640 650 660 670 680 pF1KE5 HPPPHQEFFSELRECAKAKGFFIDTRSNKTLADSLDNANDPHDPIVNRLLRSMATQAMSN :: : . : . :..... : : . :.::.:::.:..: : .: ::: .::. : . CCDS81 HPAPPPSNYEILVKAARSRNLEIKTDTAKSLAESLDQAESPTFPYLNTLLRILATRCMMQ 530 540 550 560 570 580 690 700 710 720 730 740 pF1KE5 ALYFSTGSCAEEEFHHYGLALDKYTHFTSPIRRYSDIVVHRLLMAAISKDKKMEIKGNLF :.:: .: ...::::::: :::::::::::.:..::::: .::. : . .: CCDS81 AVYFCSG--MDNDFHHYGLASPIYTHFTSPIRRYADVIVHRLLAVAIGADCTYP---ELT 590 600 610 620 630 640 750 760 770 780 790 800 pF1KE5 SNKDLEELCRHINNRNQAAQHSQKQSTELFQCMYFKDKDPATEERCISDGVIYSIRTNGV ... : ..:...: :.. ::..:. :. . ..::.: ..:: . : .: :.. CCDS81 DKHKLADICKNLNFRHKMAQYAQRASVAFHTQLFFKSKGIVSEE-----AYILFVRKNAI 650 660 670 680 690 810 820 830 840 850 860 pF1KE5 LLFIPRFGIKGAAYLKNKDGLVISCGPDSCSEWKPGSLQRFQNKITSTTTDGESVTFHLF ...::..:..:......:: ::. ....: : :...::.: CCDS81 VVLIPKYGLEGTVFFEEKD--------------KPNPQLIYDDEIPSLKI--EDTVFHVF 700 710 720 730 740 870 880 890 900 910 920 pF1KE5 DHVTVRISIQASRCHSDTIRLEIISNKPYKIPNTELIHQSSPLLKSELVKEVTKSVEEAQ :.: :.: ...: . . ::. .. .: .::. . ..: . CCDS81 DKVKVKIMLDSSNLQHQKIRMSLV--EP-QIPGISIPTDTSNMDLNGPKKKKMKLGK 750 760 770 780 790 930 940 950 960 970 pF1KE5 LAQEVKVNIIQEEYQEYRQTKGRSLYTLLEEIRDLALLDVSNNYGI >>CCDS58752.1 DIS3L2 gene_id:129563|Hs108|chr2 (603 aa) initn: 468 init1: 261 opt: 556 Z-score: 669.4 bits: 134.6 E(32554): 5.7e-31 Smith-Waterman score: 591; 30.1% identity (52.6% similar) in 529 aa overlap (129-558:34-540) 100 110 120 130 140 150 pF1KE5 VITFKNYLDNFWPDLKAAHELCDSILQSRRERENESQESHGKE---YPEHLPLEVLEAGI ....... ..::. . .. : . :. CCDS58 PDYRMNLRPLGTPRGVSAVAGPHDIGASPGDKKSKNRSTRGKKKSIFETYMSKEDVSEGL 10 20 30 40 50 60 160 170 180 190 200 210 pF1KE5 KSGRYIQGILNVNKHRAQIEAFVRLQGASSKDSDLVSDILIHGMKARNRSIHGDVVVVEL : : :::.: .: .. . :::. : :.: ::.: :. ::::...::.:::.: CCDS58 KRGTLIQGVLRINPKKFH-EAFI-----PSPDGD--RDIFIDGVVARNRALNGDLVVVKL 70 80 90 100 110 220 230 240 250 pF1KE5 LPKNEWKGRTVALCENDCDDKASGES--PSE------PMPTGR-------VV-------- ::...:: .: :: . .:. :: : : :. . . :. CCDS58 LPEEHWK--VVKPESNDKETEAAYESDIPEELCGHHLPQQSLKSYNDSPDVIVEAQFDGS 120 130 140 150 160 170 260 270 pF1KE5 ------GILQKNWRDYVVTF--------------P-SKEEV------------QSQGKNA :: :. : : . : .:.:. .: ..: CCDS58 DSEDGHGITQNVLVDGVKKLSVCVSEKGREDGDAPVTKDETTCISQDTRALSEKSLQRSA 180 190 200 210 220 230 280 290 300 pF1KE5 QKI------------------------------LVTPWDYRIPKIRISTQQAETLQDFRV . . : .: :.:.:.: . .. ::: . CCDS58 KVVYILEKKHSRAATGFLKLLADKNSELFRKYALFSPSDHRVPRIYVPLKDCP--QDFVA 240 250 260 270 280 290 310 320 330 340 350 pF1KE5 ----------VVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENSISVIPFSEAQ . :: .:. . :.... ::. :..: : ::.: ... :: CCDS58 RPKDYANTLFICRIVDWKEDCNFALGQLAKSLGQAGEIEPETEGILTEYGVDFSDFSSEV 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 MCEMPVNTPESPWKVSPEEEQKRKDLRKSHLVFSIDPKGCEDVDDTLSVRTLNNGNLELG . .: . : : . ::: .::.::::. .:.:::. .:.::.:: . : .::...: CCDS58 LECLPQGLP---WTIPPEEFSKRRDLRKD-CIFTIDPSTARDLDDALSCKPLADGNFKVG 360 370 380 390 400 420 430 440 450 460 470 pF1KE5 VHIADVTHFVAPNSYIDIEARTRATTYYLADRRYDMLPSVLSADLCSLLGGVDRYAVSIM ::::::..:: .: .: : :::. ::... ::: .: .:::: :. . :.. CCDS58 VHIADVSYFVPEGSDLDKVAAERATSVYLVQKVVPMLPRLLCEELCSLNPMSDKLTFSVI 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE5 WELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFKDLDEKSRQAKL : : . .: :.::::::: :: :: :: ... : .. :: :.: : . . CCDS58 WTLTPEG-KILDEWFGRTIIRSCTKLSYEHAQSMIE---SPTEKIPA-KELPPISPEHSS 470 480 490 500 510 520 540 550 560 570 580 590 pF1KE5 EELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIPKQPLEVHETVA :: : . : : :..: CCDS58 EE-VHQQNADKDGAAHLQASHSPSAEDAEAQPSTEERLPETRGICDRDPDTRLFFLQQQS 530 540 550 560 570 580 >>CCDS13527.1 HELZ2 gene_id:85441|Hs108|chr20 (2080 aa) initn: 284 init1: 185 opt: 433 Z-score: 511.1 bits: 107.1 E(32554): 3.8e-22 Smith-Waterman score: 498; 24.7% identity (53.1% similar) in 729 aa overlap (108-781:491-1165) 80 90 100 110 120 130 pF1KE5 VMVTEDEEAIQQYGSETEGVFVITFKNYLDNFWP-DLKAAHELCDSILQSRRERENESQE .::: : . . :.:: :: .:::. CCDS13 VKEDVVPGACAAGAAAAAGVESTEAEDAEADFWPWDGELNAD--DAIL---RELLDESQK 470 480 490 500 510 140 150 160 170 180 pF1KE5 ---SHGKE-------YPEHLPLEVLEAGIKSGRYIQGILNVNKHRAQIEAFV--RLQGAS . :.. :: : : .. . .. .:... .: . .:: .. :: CCDS13 VMVTVGEDGLLDTVARPESLQQARLYENLPPAA-LRKLLHAEPERYRHCSFVPETFERAS 520 530 540 550 560 570 190 200 210 220 230 pF1KE5 SKDSDLVSD--ILIHGMKARNRSIHGDVVVVELL-----PKNEWKGRTVALCENDCDDKA . : .:. : ..: . .. :: :.:.:: :... .::.... . . : CCDS13 AIPLDDASSGPIQVRGRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELA 580 590 600 610 620 630 240 250 260 270 280 290 pF1KE5 -----SGESPSEPMP-TGRVVGILQKNWRDYVVTFPSKEEVQSQGKNAQKILVTPWDYRI . .: .: .: :. :. . .: ::. . : :. :. CCDS13 FVCRMDTWDPRIMVPINGSVTKIFVAELKD-----PSQVPIYSLRKG-----------RL 640 650 660 670 300 310 320 330 340 350 pF1KE5 PKIRISTQQAETLQDFRVVVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENSIS .. . ::. .. :.: :.. :: : .:: . . : . . .: :. CCDS13 QRVGLERLTAEARHSRLFWVQIVLWRQGFYYPLGIVREVLPEASTWEQGLRILGLEYSLR 680 690 700 710 720 730 360 370 380 390 400 410 pF1KE5 VIPFSEAQMCEMPVNTPESPWKVSPEEEQKRKDLRKSHLVFSIDPKGCEDVDDTLSVRTL : : ..: . .. . .:. .:.: : . :.:..::.: ..::.:::: : CCDS13 VPPSDQATITKVLQKYHTELGRVAG----RREDCR-AFLTFTVDPQGACNLDDALSVRDL 740 750 760 770 780 790 420 430 440 450 460 470 pF1KE5 NNGNLELGVHIADVTHFVAPNSYIDIEARTRATTYYLADRR-YDMLPSVLSADLCSLLGG . :..:::.::. :: .. .:.::: .....: :. :::. : :. ::: : CCDS13 GP-RCEVAVHITDVASFVPRDGVLDVEARRQGAAFYAPGREPVPMLPASLCQDVLSLLPG 800 810 820 830 840 850 480 490 500 510 520 530 pF1KE5 VDRYAVSIMWELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFKDL :: :.:.. ..::: ..:.. .. ....: .: :: :.:.. . .. ..: CCDS13 RDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLSYEEAEEVIRQHPGAGRELP----- 860 870 880 890 900 540 550 560 570 580 590 pF1KE5 DEKSRQAKLEELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIPKQ .: ... : : .. . :. : . : : : . . . . : .. . CCDS13 ---ARLDSVDACVVAACYFSRLLRRHRLRSD-C-FYEQPDEDGTLGF---RAAHIMVKEY 910 920 930 940 950 600 610 620 pF1KE5 PLEVHETVAECMILAN--HWVAKKIWESFPH----QALLRQH----P------------- .. .. ::: .. .. . :. :. :. .:: ..: : CCDS13 MIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDRVPLSLHLGHHLHGGG 960 970 980 990 1000 1010 630 640 650 660 670 680 pF1KE5 --PPHQEFFSELRECAKAKGFFIDTRSNKTLADSLDNANDPHDPIVNRLLRSMATQAMSN :: .. : : : :.. . ..: : ...: : :.. :.. .:. CCDS13 GSPPDTRLHL-LASLWKQVQFAARTQDYEQMVD-LVTTDDMH-PFLAPAGRDL-RKALER 1020 1030 1040 1050 1060 1070 690 700 710 720 730 740 pF1KE5 ALYFSTGSCA---EEEFHHYGLALDKYTHFTSPIRRYSDIVVHRLLMAAISKDKKMEIKG . . : :: ... ::.: .: :: ::::::: :.:..: .. :... : CCDS13 SAF---GRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLALGHG------G 1080 1090 1100 1110 1120 750 760 770 780 790 800 pF1KE5 NLFSNKDLEELCRHINNRNQAAQHSQKQSTELFQCMYFKDKDPATEERCISDGVIYSIRT . .: .:.. ::. .. .. :: :... : . .: CCDS13 SAYSARDIDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVEAGSRCFR 1130 1140 1150 1160 1170 1180 810 820 830 840 850 860 pF1KE5 NGVLLFIPRFGIKGAAYLKNKDGLVISCGPDSCSEWKPGSLQRFQNKITSTTTDGESVTF CCDS13 LLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPPLPLPGTV 1190 1200 1210 1220 1230 1240 >>CCDS33508.1 HELZ2 gene_id:85441|Hs108|chr20 (2649 aa) initn: 284 init1: 185 opt: 433 Z-score: 509.3 bits: 107.1 E(32554): 4.8e-22 Smith-Waterman score: 498; 24.7% identity (53.1% similar) in 729 aa overlap (108-781:1060-1734) 80 90 100 110 120 130 pF1KE5 VMVTEDEEAIQQYGSETEGVFVITFKNYLDNFWP-DLKAAHELCDSILQSRRERENESQE .::: : . . :.:: :: .:::. CCDS33 VKEDVVPGACAAGAAAAAGVESTEAEDAEADFWPWDGELNAD--DAIL---RELLDESQK 1030 1040 1050 1060 1070 1080 140 150 160 170 180 pF1KE5 ---SHGKE-------YPEHLPLEVLEAGIKSGRYIQGILNVNKHRAQIEAFV--RLQGAS . :.. :: : : .. . .. .:... .: . .:: .. :: CCDS33 VMVTVGEDGLLDTVARPESLQQARLYENLPPAA-LRKLLHAEPERYRHCSFVPETFERAS 1090 1100 1110 1120 1130 1140 190 200 210 220 230 pF1KE5 SKDSDLVSD--ILIHGMKARNRSIHGDVVVVELL-----PKNEWKGRTVALCENDCDDKA . : .:. : ..: . .. :: :.:.:: :... .::.... . . : CCDS33 AIPLDDASSGPIQVRGRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELA 1150 1160 1170 1180 1190 1200 240 250 260 270 280 290 pF1KE5 -----SGESPSEPMP-TGRVVGILQKNWRDYVVTFPSKEEVQSQGKNAQKILVTPWDYRI . .: .: .: :. :. . .: ::. . : :. :. CCDS33 FVCRMDTWDPRIMVPINGSVTKIFVAELKD-----PSQVPIYSLRKG-----------RL 1210 1220 1230 1240 300 310 320 330 340 350 pF1KE5 PKIRISTQQAETLQDFRVVVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENSIS .. . ::. .. :.: :.. :: : .:: . . : . . .: :. CCDS33 QRVGLERLTAEARHSRLFWVQIVLWRQGFYYPLGIVREVLPEASTWEQGLRILGLEYSLR 1250 1260 1270 1280 1290 1300 360 370 380 390 400 410 pF1KE5 VIPFSEAQMCEMPVNTPESPWKVSPEEEQKRKDLRKSHLVFSIDPKGCEDVDDTLSVRTL : : ..: . .. . .:. .:.: : . :.:..::.: ..::.:::: : CCDS33 VPPSDQATITKVLQKYHTELGRVAG----RREDCR-AFLTFTVDPQGACNLDDALSVRDL 1310 1320 1330 1340 1350 1360 420 430 440 450 460 470 pF1KE5 NNGNLELGVHIADVTHFVAPNSYIDIEARTRATTYYLADRR-YDMLPSVLSADLCSLLGG . :..:::.::. :: .. .:.::: .....: :. :::. : :. ::: : CCDS33 GP-RCEVAVHITDVASFVPRDGVLDVEARRQGAAFYAPGREPVPMLPASLCQDVLSLLPG 1370 1380 1390 1400 1410 1420 480 490 500 510 520 530 pF1KE5 VDRYAVSIMWELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFKDL :: :.:.. ..::: ..:.. .. ....: .: :: :.:.. . .. ..: CCDS33 RDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLSYEEAEEVIRQHPGAGRELP----- 1430 1440 1450 1460 1470 540 550 560 570 580 590 pF1KE5 DEKSRQAKLEELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIPKQ .: ... : : .. . :. : . : : : . . . . : .. . CCDS33 ---ARLDSVDACVVAACYFSRLLRRHRLRSD-C-FYEQPDEDGTLGF---RAAHIMVKEY 1480 1490 1500 1510 1520 600 610 620 pF1KE5 PLEVHETVAECMILAN--HWVAKKIWESFPH----QALLRQH----P------------- .. .. ::: .. .. . :. :. :. .:: ..: : CCDS33 MIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDRVPLSLHLGHHLHGGG 1530 1540 1550 1560 1570 1580 630 640 650 660 670 680 pF1KE5 --PPHQEFFSELRECAKAKGFFIDTRSNKTLADSLDNANDPHDPIVNRLLRSMATQAMSN :: .. : : : :.. . ..: : ...: : :.. :.. .:. CCDS33 GSPPDTRLHL-LASLWKQVQFAARTQDYEQMVD-LVTTDDMH-PFLAPAGRDL-RKALER 1590 1600 1610 1620 1630 1640 690 700 710 720 730 740 pF1KE5 ALYFSTGSCA---EEEFHHYGLALDKYTHFTSPIRRYSDIVVHRLLMAAISKDKKMEIKG . . : :: ... ::.: .: :: ::::::: :.:..: .. :... : CCDS33 SAF---GRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLALGHG------G 1650 1660 1670 1680 1690 750 760 770 780 790 800 pF1KE5 NLFSNKDLEELCRHINNRNQAAQHSQKQSTELFQCMYFKDKDPATEERCISDGVIYSIRT . .: .:.. ::. .. .. :: :... : . .: CCDS33 SAYSARDIDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVEAGSRCFR 1700 1710 1720 1730 1740 1750 810 820 830 840 850 860 pF1KE5 NGVLLFIPRFGIKGAAYLKNKDGLVISCGPDSCSEWKPGSLQRFQNKITSTTTDGESVTF CCDS33 LLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPPLPLPGTV 1760 1770 1780 1790 1800 1810 971 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 06:02:03 2016 done: Tue Nov 8 06:02:03 2016 Total Scan time: 3.840 Total Display time: 0.280 Function used was FASTA [36.3.4 Apr, 2011]