FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE5718, 971 aa
1>>>pF1KE5718 971 - 971 aa - 971 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.9617+/-0.00104; mu= 17.5160+/- 0.063
mean_var=67.7762+/-13.057, 0's: 0 Z-trim(103.1): 19 B-trim: 5 in 1/48
Lambda= 0.155789
statistics sampled from 7225 (7237) to 7225 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.574), E-opt: 0.2 (0.222), width: 16
Scan time: 3.840
The best scores are: opt bits E(32554)
CCDS10214.1 DIS3L gene_id:115752|Hs108|chr15 ( 971) 6497 1469.9 0
CCDS45286.1 DIS3L gene_id:115752|Hs108|chr15 (1054) 6497 1469.9 0
CCDS9447.1 DIS3 gene_id:22894|Hs108|chr13 ( 958) 1016 238.0 6.6e-62
CCDS42834.1 DIS3L2 gene_id:129563|Hs108|chr2 ( 885) 1015 237.8 7.2e-62
CCDS45057.1 DIS3 gene_id:22894|Hs108|chr13 ( 928) 967 227.0 1.3e-58
CCDS81772.1 DIS3 gene_id:22894|Hs108|chr13 ( 796) 929 218.5 4.3e-56
CCDS58752.1 DIS3L2 gene_id:129563|Hs108|chr2 ( 603) 556 134.6 5.7e-31
CCDS13527.1 HELZ2 gene_id:85441|Hs108|chr20 (2080) 433 107.1 3.8e-22
CCDS33508.1 HELZ2 gene_id:85441|Hs108|chr20 (2649) 433 107.1 4.8e-22
>>CCDS10214.1 DIS3L gene_id:115752|Hs108|chr15 (971 aa)
initn: 6497 init1: 6497 opt: 6497 Z-score: 7882.4 bits: 1469.9 E(32554): 0
Smith-Waterman score: 6497; 100.0% identity (100.0% similar) in 971 aa overlap (1-971:1-971)
10 20 30 40 50 60
pF1KE5 MQTACQAVQHQRGRRQYNKLRNLLKDARHDCILFANEFQQCCYLPRERGESMEKWQTRSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MQTACQAVQHQRGRRQYNKLRNLLKDARHDCILFANEFQQCCYLPRERGESMEKWQTRSI
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE5 YNAAVWYYHHCQDRMPIVMVTEDEEAIQQYGSETEGVFVITFKNYLDNFWPDLKAAHELC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 YNAAVWYYHHCQDRMPIVMVTEDEEAIQQYGSETEGVFVITFKNYLDNFWPDLKAAHELC
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE5 DSILQSRRERENESQESHGKEYPEHLPLEVLEAGIKSGRYIQGILNVNKHRAQIEAFVRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 DSILQSRRERENESQESHGKEYPEHLPLEVLEAGIKSGRYIQGILNVNKHRAQIEAFVRL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE5 QGASSKDSDLVSDILIHGMKARNRSIHGDVVVVELLPKNEWKGRTVALCENDCDDKASGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 QGASSKDSDLVSDILIHGMKARNRSIHGDVVVVELLPKNEWKGRTVALCENDCDDKASGE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE5 SPSEPMPTGRVVGILQKNWRDYVVTFPSKEEVQSQGKNAQKILVTPWDYRIPKIRISTQQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SPSEPMPTGRVVGILQKNWRDYVVTFPSKEEVQSQGKNAQKILVTPWDYRIPKIRISTQQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE5 AETLQDFRVVVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENSISVIPFSEAQM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 AETLQDFRVVVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENSISVIPFSEAQM
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE5 CEMPVNTPESPWKVSPEEEQKRKDLRKSHLVFSIDPKGCEDVDDTLSVRTLNNGNLELGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 CEMPVNTPESPWKVSPEEEQKRKDLRKSHLVFSIDPKGCEDVDDTLSVRTLNNGNLELGV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE5 HIADVTHFVAPNSYIDIEARTRATTYYLADRRYDMLPSVLSADLCSLLGGVDRYAVSIMW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 HIADVTHFVAPNSYIDIEARTRATTYYLADRRYDMLPSVLSADLCSLLGGVDRYAVSIMW
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE5 ELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFKDLDEKSRQAKLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFKDLDEKSRQAKLE
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE5 ELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIPKQPLEVHETVAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIPKQPLEVHETVAE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE5 CMILANHWVAKKIWESFPHQALLRQHPPPHQEFFSELRECAKAKGFFIDTRSNKTLADSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 CMILANHWVAKKIWESFPHQALLRQHPPPHQEFFSELRECAKAKGFFIDTRSNKTLADSL
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE5 DNANDPHDPIVNRLLRSMATQAMSNALYFSTGSCAEEEFHHYGLALDKYTHFTSPIRRYS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 DNANDPHDPIVNRLLRSMATQAMSNALYFSTGSCAEEEFHHYGLALDKYTHFTSPIRRYS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE5 DIVVHRLLMAAISKDKKMEIKGNLFSNKDLEELCRHINNRNQAAQHSQKQSTELFQCMYF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 DIVVHRLLMAAISKDKKMEIKGNLFSNKDLEELCRHINNRNQAAQHSQKQSTELFQCMYF
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE5 KDKDPATEERCISDGVIYSIRTNGVLLFIPRFGIKGAAYLKNKDGLVISCGPDSCSEWKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 KDKDPATEERCISDGVIYSIRTNGVLLFIPRFGIKGAAYLKNKDGLVISCGPDSCSEWKP
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE5 GSLQRFQNKITSTTTDGESVTFHLFDHVTVRISIQASRCHSDTIRLEIISNKPYKIPNTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GSLQRFQNKITSTTTDGESVTFHLFDHVTVRISIQASRCHSDTIRLEIISNKPYKIPNTE
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE5 LIHQSSPLLKSELVKEVTKSVEEAQLAQEVKVNIIQEEYQEYRQTKGRSLYTLLEEIRDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LIHQSSPLLKSELVKEVTKSVEEAQLAQEVKVNIIQEEYQEYRQTKGRSLYTLLEEIRDL
910 920 930 940 950 960
970
pF1KE5 ALLDVSNNYGI
:::::::::::
CCDS10 ALLDVSNNYGI
970
>>CCDS45286.1 DIS3L gene_id:115752|Hs108|chr15 (1054 aa)
initn: 6497 init1: 6497 opt: 6497 Z-score: 7881.8 bits: 1469.9 E(32554): 0
Smith-Waterman score: 6497; 100.0% identity (100.0% similar) in 971 aa overlap (1-971:84-1054)
10 20 30
pF1KE5 MQTACQAVQHQRGRRQYNKLRNLLKDARHD
::::::::::::::::::::::::::::::
CCDS45 DVTHYVIPDWKVVQDYLEILEFPELKGIIFMQTACQAVQHQRGRRQYNKLRNLLKDARHD
60 70 80 90 100 110
40 50 60 70 80 90
pF1KE5 CILFANEFQQCCYLPRERGESMEKWQTRSIYNAAVWYYHHCQDRMPIVMVTEDEEAIQQY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 CILFANEFQQCCYLPRERGESMEKWQTRSIYNAAVWYYHHCQDRMPIVMVTEDEEAIQQY
120 130 140 150 160 170
100 110 120 130 140 150
pF1KE5 GSETEGVFVITFKNYLDNFWPDLKAAHELCDSILQSRRERENESQESHGKEYPEHLPLEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 GSETEGVFVITFKNYLDNFWPDLKAAHELCDSILQSRRERENESQESHGKEYPEHLPLEV
180 190 200 210 220 230
160 170 180 190 200 210
pF1KE5 LEAGIKSGRYIQGILNVNKHRAQIEAFVRLQGASSKDSDLVSDILIHGMKARNRSIHGDV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 LEAGIKSGRYIQGILNVNKHRAQIEAFVRLQGASSKDSDLVSDILIHGMKARNRSIHGDV
240 250 260 270 280 290
220 230 240 250 260 270
pF1KE5 VVVELLPKNEWKGRTVALCENDCDDKASGESPSEPMPTGRVVGILQKNWRDYVVTFPSKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 VVVELLPKNEWKGRTVALCENDCDDKASGESPSEPMPTGRVVGILQKNWRDYVVTFPSKE
300 310 320 330 340 350
280 290 300 310 320 330
pF1KE5 EVQSQGKNAQKILVTPWDYRIPKIRISTQQAETLQDFRVVVRIDSWESTSVYPNGHFVRV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 EVQSQGKNAQKILVTPWDYRIPKIRISTQQAETLQDFRVVVRIDSWESTSVYPNGHFVRV
360 370 380 390 400 410
340 350 360 370 380 390
pF1KE5 LGRIGDLEGEIATILVENSISVIPFSEAQMCEMPVNTPESPWKVSPEEEQKRKDLRKSHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 LGRIGDLEGEIATILVENSISVIPFSEAQMCEMPVNTPESPWKVSPEEEQKRKDLRKSHL
420 430 440 450 460 470
400 410 420 430 440 450
pF1KE5 VFSIDPKGCEDVDDTLSVRTLNNGNLELGVHIADVTHFVAPNSYIDIEARTRATTYYLAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 VFSIDPKGCEDVDDTLSVRTLNNGNLELGVHIADVTHFVAPNSYIDIEARTRATTYYLAD
480 490 500 510 520 530
460 470 480 490 500 510
pF1KE5 RRYDMLPSVLSADLCSLLGGVDRYAVSIMWELDKASYEIKKVWYGRTIIRSAYKLFYEAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 RRYDMLPSVLSADLCSLLGGVDRYAVSIMWELDKASYEIKKVWYGRTIIRSAYKLFYEAA
540 550 560 570 580 590
520 530 540 550 560 570
pF1KE5 QELLDGNLSVVDDIPEFKDLDEKSRQAKLEELVWAIGKLTDIARHVRAKRDGCGALELEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 QELLDGNLSVVDDIPEFKDLDEKSRQAKLEELVWAIGKLTDIARHVRAKRDGCGALELEG
600 610 620 630 640 650
580 590 600 610 620 630
pF1KE5 VEVCVQLDDKKNIHDLIPKQPLEVHETVAECMILANHWVAKKIWESFPHQALLRQHPPPH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 VEVCVQLDDKKNIHDLIPKQPLEVHETVAECMILANHWVAKKIWESFPHQALLRQHPPPH
660 670 680 690 700 710
640 650 660 670 680 690
pF1KE5 QEFFSELRECAKAKGFFIDTRSNKTLADSLDNANDPHDPIVNRLLRSMATQAMSNALYFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 QEFFSELRECAKAKGFFIDTRSNKTLADSLDNANDPHDPIVNRLLRSMATQAMSNALYFS
720 730 740 750 760 770
700 710 720 730 740 750
pF1KE5 TGSCAEEEFHHYGLALDKYTHFTSPIRRYSDIVVHRLLMAAISKDKKMEIKGNLFSNKDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 TGSCAEEEFHHYGLALDKYTHFTSPIRRYSDIVVHRLLMAAISKDKKMEIKGNLFSNKDL
780 790 800 810 820 830
760 770 780 790 800 810
pF1KE5 EELCRHINNRNQAAQHSQKQSTELFQCMYFKDKDPATEERCISDGVIYSIRTNGVLLFIP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 EELCRHINNRNQAAQHSQKQSTELFQCMYFKDKDPATEERCISDGVIYSIRTNGVLLFIP
840 850 860 870 880 890
820 830 840 850 860 870
pF1KE5 RFGIKGAAYLKNKDGLVISCGPDSCSEWKPGSLQRFQNKITSTTTDGESVTFHLFDHVTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 RFGIKGAAYLKNKDGLVISCGPDSCSEWKPGSLQRFQNKITSTTTDGESVTFHLFDHVTV
900 910 920 930 940 950
880 890 900 910 920 930
pF1KE5 RISIQASRCHSDTIRLEIISNKPYKIPNTELIHQSSPLLKSELVKEVTKSVEEAQLAQEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 RISIQASRCHSDTIRLEIISNKPYKIPNTELIHQSSPLLKSELVKEVTKSVEEAQLAQEV
960 970 980 990 1000 1010
940 950 960 970
pF1KE5 KVNIIQEEYQEYRQTKGRSLYTLLEEIRDLALLDVSNNYGI
:::::::::::::::::::::::::::::::::::::::::
CCDS45 KVNIIQEEYQEYRQTKGRSLYTLLEEIRDLALLDVSNNYGI
1020 1030 1040 1050
>>CCDS9447.1 DIS3 gene_id:22894|Hs108|chr13 (958 aa)
initn: 1229 init1: 378 opt: 1016 Z-score: 1224.8 bits: 238.0 E(32554): 6.6e-62
Smith-Waterman score: 1760; 36.5% identity (64.8% similar) in 930 aa overlap (1-908:91-944)
10 20 30
pF1KE5 MQTACQAVQHQRGRRQYNKLRNLLKDARHD
.::. : :.. :. :...:.. .. ..
CCDS94 PQPHYLLPDTNVLLHQIDVLEDPAIRNVIVLQTVLQEVRN-RSAPVYKRIRDVTNNQEKH
70 80 90 100 110
40 50 60 70 80
pF1KE5 CILFANEFQQCCYLPRERGESMEKWQTRSIYNAAVWYYHHCQ-----DRMPIVMVTEDEE
:.:: .. :. .:.::. . . :.: :: :: .: . ... ....:.:..
CCDS94 FYTFTNEHHRETYVEQEQGENANDRNDRAIRVAAKWYNEHLKKMSADNQLQVIFITNDRR
120 130 140 150 160 170
90 100 110 120 130 140
pF1KE5 AIQQYGSETEGVFVITFKNYLDNFWPDLKAAHELCDSILQSRRERENESQESHGKEYPEH
.. . ::. ..: ..:. . : : :: : : :. :: :: . ::
CCDS94 NKEK--AIEEGIPAFTCEEYVKS----LTANPELIDR-LACLSEEGNEI-ESGKIIFSEH
180 190 200 210 220 230
150 160 170 180 190 200
pF1KE5 LPLEVLEAGIKSGRYIQGILNVNKHRAQIEAFVRLQGASSKDSDLVSDILIHGMKARNRS
::: :. ::::: :.:: . .... .:: : ..: :.. ..:...:.: ::.
CCDS94 LPLSKLQQGIKSGTYLQGTFRASREN-YLEATVWIHG----DNEENKEIILQGLKHLNRA
240 250 260 270 280
210 220 230 240 250
pF1KE5 IHGDVVVVELLPKNEWKG-RTVAL-----CENDCDDKASGE-----SPSEPM--PTGRVV
.: :.:.::::::..: . .:.: :.: . . : . :: : ::::::
CCDS94 VHEDIVAVELLPKSQWVAPSSVVLHDEGQNEEDVEKEEETERMLKTAVSEKMLKPTGRVV
290 300 310 320 330 340
260 270 280 290 300 310
pF1KE5 GILQKNWRDYVVTFPSKEEVQSQGKNAQKILVTPWDYRIPKIRISTQQAETLQDFRVVVR
::...::: : . :: .. :.... : :: : :::.::: :.:: ::. :..:
CCDS94 GIIKRNWRPYCGML-SKSDI----KESRRHLFTPADKRIPRIRIETRQASTLEGRRIIVA
350 360 370 380 390 400
320 330 340 350 360 370
pF1KE5 IDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENSISVIPFSEAQMCEMPVNTPESPW
::.: .: :::::::: :: .:. : : ..:.:... :::.: . .: . ::
CCDS94 IDGWPRNSRYPNGHFVRNLGDVGEKETETEVLLLEHDVPHQPFSQAVLSFLP----KMPW
410 420 430 440 450
380 390 400 410 420 430
pF1KE5 KVSPEEEQKRKDLRKSHL-VFSIDPKGCEDVDDTLSVRTLNNGNLELGVHIADVTHFVAP
... .. ..:.::: :: . :.:: :: :.::.: : :.:::::.:::::::.::. :
CCDS94 SITEKDMKNREDLR--HLCICSVDPPGCTDIDDALHCRELENGNLEVGVHIADVSHFIRP
460 470 480 490 500 510
440 450 460 470 480 490
pF1KE5 NSYIDIEARTRATTYYLADRRYDMLPSVLSADLCSLLGGVDRYAVSIMWELDKASYEIKK
.. .: :. :.:: :: ..: ::.: .::..:::: ::: : : .::... . :: :
CCDS94 GNALDQESARRGTTVYLCEKRIDMVPELLSSNLCSLKCDVDRLAFSCIWEMNHNA-EILK
520 530 540 550 560 570
500 510 520 530 540 550
pF1KE5 VWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFKDLDEKSRQAKLEELVWAIGKLTD
. . ...: : .: : :: .:. .. ::: ..:. ...::.
CCDS94 TKFTKSVINSKASLTYAEAQLRIDSA-NMNDDIT-----------TSLR----GLNKLAK
580 590 600 610
560 570 580 590 600
pF1KE5 IARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIPKQPLEVHET---VAECMILANHW
: .. : .. ::: : . :: ..:.. :: : : :..:: : : :.:::
CCDS94 ILKKRRIEK---GALTLSSPEVRFHMDSET--HDPIDLQTKELRETNSMVEEFMLLANIS
620 630 640 650 660 670
610 620 630 640 650 660
pF1KE5 VAKKIWESFPHQALLRQHPPPHQEFFSELRECAKAKGFFIDTRSNKTLADSLDNANDPHD
::::: : : ..::::.:: : . : . :..... : : . :.::.:::.:..:
CCDS94 VAKKIHEEFSEHALLRKHPAPPPSNYEILVKAARSRNLEIKTDTAKSLAESLDQAESPTF
680 690 700 710 720 730
670 680 690 700 710 720
pF1KE5 PIVNRLLRSMATQAMSNALYFSTGSCAEEEFHHYGLALDKYTHFTSPIRRYSDIVVHRLL
: .: ::: .::. : .:.:: .: ...::::::: :::::::::::.:..:::::
CCDS94 PYLNTLLRILATRCMMQAVYFCSG--MDNDFHHYGLASPIYTHFTSPIRRYADVIVHRLL
740 750 760 770 780 790
730 740 750 760 770 780
pF1KE5 MAAISKDKKMEIKGNLFSNKDLEELCRHINNRNQAAQHSQKQSTELFQCMYFKDKDPATE
.::. : . .: ... : ..:...: :.. ::..:. :. . ..::.: ..:
CCDS94 AVAIGADCTYP---ELTDKHKLADICKNLNFRHKMAQYAQRASVAFHTQLFFKSKGIVSE
800 810 820 830 840
790 800 810 820 830 840
pF1KE5 ERCISDGVIYSIRTNGVLLFIPRFGIKGAAYLKNKDGLVISCGPDSCSEWKPGSLQRFQN
: . : .: :.....::..:..:......:: ::. ...
CCDS94 E-----AYILFVRKNAIVVLIPKYGLEGTVFFEEKD--------------KPNPQLIYDD
850 860 870 880
850 860 870 880 890 900
pF1KE5 KITSTTTDGESVTFHLFDHVTVRISIQASRCHSDTIRLEIISNKPYKIPNTELIHQSSPL
.: : :...::.::.: :.: ...: . . ::. .. .: .::. . ..: .
CCDS94 EIPSLKI--EDTVFHVFDKVKVKIMLDSSNLQHQKIRMSLV--EP-QIPGISIPTDTSNM
890 900 910 920 930 940
910 920 930 940 950 960
pF1KE5 LKSELVKEVTKSVEEAQLAQEVKVNIIQEEYQEYRQTKGRSLYTLLEEIRDLALLDVSNN
CCDS94 DLNGPKKKKMKLGK
950
>>CCDS42834.1 DIS3L2 gene_id:129563|Hs108|chr2 (885 aa)
initn: 861 init1: 289 opt: 1015 Z-score: 1224.2 bits: 237.8 E(32554): 7.2e-62
Smith-Waterman score: 1062; 30.2% identity (56.2% similar) in 825 aa overlap (129-845:34-827)
100 110 120 130 140 150
pF1KE5 VITFKNYLDNFWPDLKAAHELCDSILQSRRERENESQESHGKE---YPEHLPLEVLEAGI
....... ..::. . .. : . :.
CCDS42 PDYRMNLRPLGTPRGVSAVAGPHDIGASPGDKKSKNRSTRGKKKSIFETYMSKEDVSEGL
10 20 30 40 50 60
160 170 180 190 200 210
pF1KE5 KSGRYIQGILNVNKHRAQIEAFVRLQGASSKDSDLVSDILIHGMKARNRSIHGDVVVVEL
: : :::.: .: .. . :::. : :.: ::.: :. ::::...::.:::.:
CCDS42 KRGTLIQGVLRINPKKFH-EAFI-----PSPDGD--RDIFIDGVVARNRALNGDLVVVKL
70 80 90 100 110
220 230 240 250
pF1KE5 LPKNEWKGRTVALCENDCDDKASGES--PSE------PMPTGR-------VV--------
::...:: .: :: . .:. :: : : :. . . :.
CCDS42 LPEEHWK--VVKPESNDKETEAAYESDIPEELCGHHLPQQSLKSYNDSPDVIVEAQFDGS
120 130 140 150 160 170
260 270
pF1KE5 ------GILQKNWRDYVVTF--------------P-SKEEV------------QSQGKNA
:: :. : : . : .:.:. .: ..:
CCDS42 DSEDGHGITQNVLVDGVKKLSVCVSEKGREDGDAPVTKDETTCISQDTRALSEKSLQRSA
180 190 200 210 220 230
280 290 300
pF1KE5 QKI------------------------------LVTPWDYRIPKIRISTQQAETLQDFRV
. . : .: :.:.:.: . .. ::: .
CCDS42 KVVYILEKKHSRAATGFLKLLADKNSELFRKYALFSPSDHRVPRIYVPLKDCP--QDFVA
240 250 260 270 280 290
310 320 330 340 350
pF1KE5 ----------VVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENSISVIPFSEAQ
. :: .:. . :.... ::. :..: : ::.: ... ::
CCDS42 RPKDYANTLFICRIVDWKEDCNFALGQLAKSLGQAGEIEPETEGILTEYGVDFSDFSSEV
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE5 MCEMPVNTPESPWKVSPEEEQKRKDLRKSHLVFSIDPKGCEDVDDTLSVRTLNNGNLELG
. .: . :: . ::: .::.::::. .:.:::. .:.::.:: . : .::...:
CCDS42 LECLPQGL---PWTIPPEEFSKRRDLRKD-CIFTIDPSTARDLDDALSCKPLADGNFKVG
360 370 380 390 400
420 430 440 450 460 470
pF1KE5 VHIADVTHFVAPNSYIDIEARTRATTYYLADRRYDMLPSVLSADLCSLLGGVDRYAVSIM
::::::..:: .: .: : :::. ::... ::: .: .:::: :. . :..
CCDS42 VHIADVSYFVPEGSDLDKVAAERATSVYLVQKVVPMLPRLLCEELCSLNPMSDKLTFSVI
410 420 430 440 450 460
480 490 500 510 520 530
pF1KE5 WELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFKDLDEKSRQAKL
: : . .: :.::::::: :: :: :: ... : .. :: :.: : . .
CCDS42 WTLTPEG-KILDEWFGRTIIRSCTKLSYEHAQSMIE---SPTEKIPA-KELPPISPEHSS
470 480 490 500 510 520
540 550 560 570 580 590
pF1KE5 EELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNI-HDLIPKQPLEVHETV
::. :. .: ::...: .: :::.:. ... :: . .. . . : .. :
CCDS42 EEVHQAVLNLHGIAKQLRQQRFVDGALRLDQLKLAFTLDHETGLPQGCHIYEYRESNKLV
530 540 550 560 570 580
600 610 620 630 640 650
pF1KE5 AECMILANHWVAKKIWESFPHQALLRQHPPPHQEFFSELRECAKAKGFFIDTRSNKTLAD
: :.::: ::.:: ..::.:::::.::::. ...:.: : :. .: : .:
CCDS42 EEFMLLANMAVAHKIHRAFPEQALLRRHPPPQTRMLSDLVEFCDQMGLPVDFSSAGALNK
590 600 610 620 630 640
660 670 680 690 700 710
pF1KE5 SLDNA--NDPHDPIVNRLLRSMATQAMSNALYFSTGSCAEE-EFHHYGLALDKYTHFTSP
:: .. .: .. ...: .: .. :. :::: .: . .:.::.: . :::::::
CCDS42 SLTQTFGDDKYSLARKEVLTNMCSRPMQMALYFCSGLLQDPAQFRHYALNVPLYTHFTSP
650 660 670 680 690 700
720 730 740 750 760 770
pF1KE5 IRRYSDIVVHRLLMAAISKDKKMEIKGNLFSNKDLEELCRHINNRNQAAQHSQKQSTELF
:::..:..::::: ::.. ..... . :.. : :.: .:... :. :: ::
CCDS42 IRRFADVLVHRLLAAALGYRERLDMAPDT-----LQKQADHCNDRRMASKRVQELSTSLF
710 720 730 740 750
780 790 800 810 820 830
pF1KE5 QCMYFKDKDPATEERCISDGVIYSIRTNGVLLFIPRFGIKGAAY-----LKNKDGLVISC
. :.. : :......: .. ... :.:.. : :... ..
CCDS42 FAVLVKESGPLE-----SEAMVMGILKQAFDVLVLRYGVQKRIYCNALALRSHHFQKVGK
760 770 780 790 800 810
840 850 860 870 880 890
pF1KE5 GPDSCSEWKPGSLQRFQNKITSTTTDGESVTFHLFDHVTVRISIQASRCHSDTIRLEIIS
:. :.: ....
CCDS42 KPELTLVWEPEDMEQEPAQQVITIFSLVEVVLQAESTALKYSAILKRPGTQGHLGPEKEE
820 830 840 850 860 870
>>CCDS45057.1 DIS3 gene_id:22894|Hs108|chr13 (928 aa)
initn: 1195 init1: 378 opt: 967 Z-score: 1165.6 bits: 227.0 E(32554): 1.3e-58
Smith-Waterman score: 1711; 36.8% identity (64.3% similar) in 888 aa overlap (43-908:102-914)
20 30 40 50 60 70
pF1KE5 GRRQYNKLRNLLKDARHDCILFANEFQQCCYLPRERGESMEKWQTRSIYNAAVWYYHHCQ
:. .:.::. . . :.: :: :: .: .
CCDS45 VLLHQIVSAWRPGTWASVASSLRLPGSLETYVEQEQGENANDRNDRAIRVAAKWYNEHLK
80 90 100 110 120 130
80 90 100 110 120
pF1KE5 -----DRMPIVMVTEDEEAIQQYGSETEGVFVITFKNYLDNFWPDLKAAHELCDSILQSR
... ....:.:.. .. . ::. ..: ..:. . : : :: : :
CCDS45 KMSADNQLQVIFITNDRRNKEK--AIEEGIPAFTCEEYVKS----LTANPELIDR-LACL
140 150 160 170 180
130 140 150 160 170 180
pF1KE5 RERENESQESHGKEYPEHLPLEVLEAGIKSGRYIQGILNVNKHRAQIEAFVRLQGASSKD
:. :: :: . ::::: :. ::::: :.:: . .... .:: : ..: :
CCDS45 SEEGNEI-ESGKIIFSEHLPLSKLQQGIKSGTYLQGTFRASREN-YLEATVWIHG----D
190 200 210 220 230
190 200 210 220 230 240
pF1KE5 SDLVSDILIHGMKARNRSIHGDVVVVELLPKNEWKG-RTVAL-----CENDCDDKASGE-
.. ..:...:.: ::..: :.:.::::::..: . .:.: :.: . . :
CCDS45 NEENKEIILQGLKHLNRAVHEDIVAVELLPKSQWVAPSSVVLHDEGQNEEDVEKEEETER
240 250 260 270 280 290
250 260 270 280 290
pF1KE5 ----SPSEPM--PTGRVVGILQKNWRDYVVTFPSKEEVQSQGKNAQKILVTPWDYRIPKI
. :: : ::::::::...::: : . :: .. :.... : :: : :::.:
CCDS45 MLKTAVSEKMLKPTGRVVGIIKRNWRPYCGML-SKSDI----KESRRHLFTPADKRIPRI
300 310 320 330 340 350
300 310 320 330 340 350
pF1KE5 RISTQQAETLQDFRVVVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENSISVIP
:: :.:: ::. :..: ::.: .: :::::::: :: .:. : : ..:.:... :
CCDS45 RIETRQASTLEGRRIIVAIDGWPRNSRYPNGHFVRNLGDVGEKETETEVLLLEHDVPHQP
360 370 380 390 400 410
360 370 380 390 400 410
pF1KE5 FSEAQMCEMPVNTPESPWKVSPEEEQKRKDLRKSHL-VFSIDPKGCEDVDDTLSVRTLNN
::.: . .: . ::... .. ..:.::: :: . :.:: :: :.::.: : :.:
CCDS45 FSQAVLSFLP----KMPWSITEKDMKNREDLR--HLCICSVDPPGCTDIDDALHCRELEN
420 430 440 450 460
420 430 440 450 460 470
pF1KE5 GNLELGVHIADVTHFVAPNSYIDIEARTRATTYYLADRRYDMLPSVLSADLCSLLGGVDR
::::.:::::::.::. :.. .: :. :.:: :: ..: ::.: .::..:::: :::
CCDS45 GNLEVGVHIADVSHFIRPGNALDQESARRGTTVYLCEKRIDMVPELLSSNLCSLKCDVDR
470 480 490 500 510 520
480 490 500 510 520 530
pF1KE5 YAVSIMWELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFKDLDEK
: : .::... . :: :. . ...: : .: : :: .:. .. :::
CCDS45 LAFSCIWEMNHNA-EILKTKFTKSVINSKASLTYAEAQLRIDSA-NMNDDITT-------
530 540 550 560 570
540 550 560 570 580 590
pF1KE5 SRQAKLEELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIPKQPLE
.. :. .:. .. .: ::: : . :: ..:.. :: : : :
CCDS45 -----------SLRGLNKLAKILKKRRIEKGALTLSSPEVRFHMDSET--HDPIDLQTKE
580 590 600 610 620
600 610 620 630 640 650
pF1KE5 VHET---VAECMILANHWVAKKIWESFPHQALLRQHPPPHQEFFSELRECAKAKGFFIDT
..:: : : :.::: ::::: : : ..::::.:: : . : . :..... : :
CCDS45 LRETNSMVEEFMLLANISVAKKIHEEFSEHALLRKHPAPPPSNYEILVKAARSRNLEIKT
630 640 650 660 670 680
660 670 680 690 700 710
pF1KE5 RSNKTLADSLDNANDPHDPIVNRLLRSMATQAMSNALYFSTGSCAEEEFHHYGLALDKYT
. :.::.:::.:..: : .: ::: .::. : .:.:: .: ...::::::: ::
CCDS45 DTAKSLAESLDQAESPTFPYLNTLLRILATRCMMQAVYFCSG--MDNDFHHYGLASPIYT
690 700 710 720 730 740
720 730 740 750 760 770
pF1KE5 HFTSPIRRYSDIVVHRLLMAAISKDKKMEIKGNLFSNKDLEELCRHINNRNQAAQHSQKQ
:::::::::.:..::::: .::. : . .: ... : ..:...: :.. ::..:.
CCDS45 HFTSPIRRYADVIVHRLLAVAIGADCTYP---ELTDKHKLADICKNLNFRHKMAQYAQRA
750 760 770 780 790 800
780 790 800 810 820 830
pF1KE5 STELFQCMYFKDKDPATEERCISDGVIYSIRTNGVLLFIPRFGIKGAAYLKNKDGLVISC
:. . ..::.: ..:: . : .: :.....::..:..:......::
CCDS45 SVAFHTQLFFKSKGIVSEE-----AYILFVRKNAIVVLIPKYGLEGTVFFEEKD------
810 820 830 840
840 850 860 870 880 890
pF1KE5 GPDSCSEWKPGSLQRFQNKITSTTTDGESVTFHLFDHVTVRISIQASRCHSDTIRLEIIS
::. ....: : :...::.::.: :.: ...: . . ::. ..
CCDS45 --------KPNPQLIYDDEIPSLKI--EDTVFHVFDKVKVKIMLDSSNLQHQKIRMSLV-
850 860 870 880 890
900 910 920 930 940 950
pF1KE5 NKPYKIPNTELIHQSSPLLKSELVKEVTKSVEEAQLAQEVKVNIIQEEYQEYRQTKGRSL
.: .::. . ..: .
CCDS45 -EP-QIPGISIPTDTSNMDLNGPKKKKMKLGK
900 910 920
>>CCDS81772.1 DIS3 gene_id:22894|Hs108|chr13 (796 aa)
initn: 1153 init1: 378 opt: 929 Z-score: 1120.5 bits: 218.5 E(32554): 4.3e-56
Smith-Waterman score: 1659; 37.4% identity (65.1% similar) in 853 aa overlap (73-908:5-782)
50 60 70 80 90 100
pF1KE5 YLPRERGESMEKWQTRSIYNAAVWYYHHCQDRMPIVMVTEDEEAIQQYGSETEGVFVITF
... ....:.:.. .. . ::. ..:
CCDS81 MSADNQLQVIFITNDRRNKEK--AIEEGIPAFTC
10 20 30
110 120 130 140 150 160
pF1KE5 KNYLDNFWPDLKAAHELCDSILQSRRERENESQESHGKEYPEHLPLEVLEAGIKSGRYIQ
..:. . : : :: : : :. :: :: . ::::: :. ::::: :.:
CCDS81 EEYVKS----LTANPELIDR-LACLSEEGNEI-ESGKIIFSEHLPLSKLQQGIKSGTYLQ
40 50 60 70 80
170 180 190 200 210 220
pF1KE5 GILNVNKHRAQIEAFVRLQGASSKDSDLVSDILIHGMKARNRSIHGDVVVVELLPKNEWK
: . .... .:: : ..: :.. ..:...:.: ::..: :.:.::::::..:
CCDS81 GTFRASREN-YLEATVWIHG----DNEENKEIILQGLKHLNRAVHEDIVAVELLPKSQWV
90 100 110 120 130 140
230 240 250 260
pF1KE5 G-RTVAL-----CENDCDDKASGE-----SPSEPM--PTGRVVGILQKNWRDYVVTFPSK
. .:.: :.: . . : . :: : ::::::::...::: : . ::
CCDS81 APSSVVLHDEGQNEEDVEKEEETERMLKTAVSEKMLKPTGRVVGIIKRNWRPYCGML-SK
150 160 170 180 190 200
270 280 290 300 310 320
pF1KE5 EEVQSQGKNAQKILVTPWDYRIPKIRISTQQAETLQDFRVVVRIDSWESTSVYPNGHFVR
.. :.... : :: : :::.::: :.:: ::. :..: ::.: .: ::::::::
CCDS81 SDI----KESRRHLFTPADKRIPRIRIETRQASTLEGRRIIVAIDGWPRNSRYPNGHFVR
210 220 230 240 250
330 340 350 360 370 380
pF1KE5 VLGRIGDLEGEIATILVENSISVIPFSEAQMCEMPVNTPESPWKVSPEEEQKRKDLRKSH
:: .:. : : ..:.:... :::.: . .: . ::... .. ..:.::: :
CCDS81 NLGDVGEKETETEVLLLEHDVPHQPFSQAVLSFLP----KMPWSITEKDMKNREDLR--H
260 270 280 290 300 310
390 400 410 420 430 440
pF1KE5 L-VFSIDPKGCEDVDDTLSVRTLNNGNLELGVHIADVTHFVAPNSYIDIEARTRATTYYL
: . :.:: :: :.::.: : :.:::::.:::::::.::. :.. .: :. :.:: ::
CCDS81 LCICSVDPPGCTDIDDALHCRELENGNLEVGVHIADVSHFIRPGNALDQESARRGTTVYL
320 330 340 350 360 370
450 460 470 480 490 500
pF1KE5 ADRRYDMLPSVLSADLCSLLGGVDRYAVSIMWELDKASYEIKKVWYGRTIIRSAYKLFYE
..: ::.: .::..:::: ::: : : .::... . :: :. . ...: : .: :
CCDS81 CEKRIDMVPELLSSNLCSLKCDVDRLAFSCIWEMNHNA-EILKTKFTKSVINSKASLTYA
380 390 400 410 420
510 520 530 540 550 560
pF1KE5 AAQELLDGNLSVVDDIPEFKDLDEKSRQAKLEELVWAIGKLTDIARHVRAKRDGCGALEL
:: .: . .. ::: ..:. : .::. : .. : .. ::: :
CCDS81 EAQLRID-SANMNDDIT-----------TSLRGL----NKLAKILKKRRIEK---GALTL
430 440 450 460 470
570 580 590 600 610 620
pF1KE5 EGVEVCVQLDDKKNIHDLIPKQPLEVHET---VAECMILANHWVAKKIWESFPHQALLRQ
. :: ..:.. :: : : :..:: : : :.::: ::::: : : ..::::.
CCDS81 SSPEVRFHMDSET--HDPIDLQTKELRETNSMVEEFMLLANISVAKKIHEEFSEHALLRK
480 490 500 510 520
630 640 650 660 670 680
pF1KE5 HPPPHQEFFSELRECAKAKGFFIDTRSNKTLADSLDNANDPHDPIVNRLLRSMATQAMSN
:: : . : . :..... : : . :.::.:::.:..: : .: ::: .::. : .
CCDS81 HPAPPPSNYEILVKAARSRNLEIKTDTAKSLAESLDQAESPTFPYLNTLLRILATRCMMQ
530 540 550 560 570 580
690 700 710 720 730 740
pF1KE5 ALYFSTGSCAEEEFHHYGLALDKYTHFTSPIRRYSDIVVHRLLMAAISKDKKMEIKGNLF
:.:: .: ...::::::: :::::::::::.:..::::: .::. : . .:
CCDS81 AVYFCSG--MDNDFHHYGLASPIYTHFTSPIRRYADVIVHRLLAVAIGADCTYP---ELT
590 600 610 620 630 640
750 760 770 780 790 800
pF1KE5 SNKDLEELCRHINNRNQAAQHSQKQSTELFQCMYFKDKDPATEERCISDGVIYSIRTNGV
... : ..:...: :.. ::..:. :. . ..::.: ..:: . : .: :..
CCDS81 DKHKLADICKNLNFRHKMAQYAQRASVAFHTQLFFKSKGIVSEE-----AYILFVRKNAI
650 660 670 680 690
810 820 830 840 850 860
pF1KE5 LLFIPRFGIKGAAYLKNKDGLVISCGPDSCSEWKPGSLQRFQNKITSTTTDGESVTFHLF
...::..:..:......:: ::. ....: : :...::.:
CCDS81 VVLIPKYGLEGTVFFEEKD--------------KPNPQLIYDDEIPSLKI--EDTVFHVF
700 710 720 730 740
870 880 890 900 910 920
pF1KE5 DHVTVRISIQASRCHSDTIRLEIISNKPYKIPNTELIHQSSPLLKSELVKEVTKSVEEAQ
:.: :.: ...: . . ::. .. .: .::. . ..: .
CCDS81 DKVKVKIMLDSSNLQHQKIRMSLV--EP-QIPGISIPTDTSNMDLNGPKKKKMKLGK
750 760 770 780 790
930 940 950 960 970
pF1KE5 LAQEVKVNIIQEEYQEYRQTKGRSLYTLLEEIRDLALLDVSNNYGI
>>CCDS58752.1 DIS3L2 gene_id:129563|Hs108|chr2 (603 aa)
initn: 468 init1: 261 opt: 556 Z-score: 669.4 bits: 134.6 E(32554): 5.7e-31
Smith-Waterman score: 591; 30.1% identity (52.6% similar) in 529 aa overlap (129-558:34-540)
100 110 120 130 140 150
pF1KE5 VITFKNYLDNFWPDLKAAHELCDSILQSRRERENESQESHGKE---YPEHLPLEVLEAGI
....... ..::. . .. : . :.
CCDS58 PDYRMNLRPLGTPRGVSAVAGPHDIGASPGDKKSKNRSTRGKKKSIFETYMSKEDVSEGL
10 20 30 40 50 60
160 170 180 190 200 210
pF1KE5 KSGRYIQGILNVNKHRAQIEAFVRLQGASSKDSDLVSDILIHGMKARNRSIHGDVVVVEL
: : :::.: .: .. . :::. : :.: ::.: :. ::::...::.:::.:
CCDS58 KRGTLIQGVLRINPKKFH-EAFI-----PSPDGD--RDIFIDGVVARNRALNGDLVVVKL
70 80 90 100 110
220 230 240 250
pF1KE5 LPKNEWKGRTVALCENDCDDKASGES--PSE------PMPTGR-------VV--------
::...:: .: :: . .:. :: : : :. . . :.
CCDS58 LPEEHWK--VVKPESNDKETEAAYESDIPEELCGHHLPQQSLKSYNDSPDVIVEAQFDGS
120 130 140 150 160 170
260 270
pF1KE5 ------GILQKNWRDYVVTF--------------P-SKEEV------------QSQGKNA
:: :. : : . : .:.:. .: ..:
CCDS58 DSEDGHGITQNVLVDGVKKLSVCVSEKGREDGDAPVTKDETTCISQDTRALSEKSLQRSA
180 190 200 210 220 230
280 290 300
pF1KE5 QKI------------------------------LVTPWDYRIPKIRISTQQAETLQDFRV
. . : .: :.:.:.: . .. ::: .
CCDS58 KVVYILEKKHSRAATGFLKLLADKNSELFRKYALFSPSDHRVPRIYVPLKDCP--QDFVA
240 250 260 270 280 290
310 320 330 340 350
pF1KE5 ----------VVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENSISVIPFSEAQ
. :: .:. . :.... ::. :..: : ::.: ... ::
CCDS58 RPKDYANTLFICRIVDWKEDCNFALGQLAKSLGQAGEIEPETEGILTEYGVDFSDFSSEV
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE5 MCEMPVNTPESPWKVSPEEEQKRKDLRKSHLVFSIDPKGCEDVDDTLSVRTLNNGNLELG
. .: . : : . ::: .::.::::. .:.:::. .:.::.:: . : .::...:
CCDS58 LECLPQGLP---WTIPPEEFSKRRDLRKD-CIFTIDPSTARDLDDALSCKPLADGNFKVG
360 370 380 390 400
420 430 440 450 460 470
pF1KE5 VHIADVTHFVAPNSYIDIEARTRATTYYLADRRYDMLPSVLSADLCSLLGGVDRYAVSIM
::::::..:: .: .: : :::. ::... ::: .: .:::: :. . :..
CCDS58 VHIADVSYFVPEGSDLDKVAAERATSVYLVQKVVPMLPRLLCEELCSLNPMSDKLTFSVI
410 420 430 440 450 460
480 490 500 510 520 530
pF1KE5 WELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFKDLDEKSRQAKL
: : . .: :.::::::: :: :: :: ... : .. :: :.: : . .
CCDS58 WTLTPEG-KILDEWFGRTIIRSCTKLSYEHAQSMIE---SPTEKIPA-KELPPISPEHSS
470 480 490 500 510 520
540 550 560 570 580 590
pF1KE5 EELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIPKQPLEVHETVA
:: : . : : :..:
CCDS58 EE-VHQQNADKDGAAHLQASHSPSAEDAEAQPSTEERLPETRGICDRDPDTRLFFLQQQS
530 540 550 560 570 580
>>CCDS13527.1 HELZ2 gene_id:85441|Hs108|chr20 (2080 aa)
initn: 284 init1: 185 opt: 433 Z-score: 511.1 bits: 107.1 E(32554): 3.8e-22
Smith-Waterman score: 498; 24.7% identity (53.1% similar) in 729 aa overlap (108-781:491-1165)
80 90 100 110 120 130
pF1KE5 VMVTEDEEAIQQYGSETEGVFVITFKNYLDNFWP-DLKAAHELCDSILQSRRERENESQE
.::: : . . :.:: :: .:::.
CCDS13 VKEDVVPGACAAGAAAAAGVESTEAEDAEADFWPWDGELNAD--DAIL---RELLDESQK
470 480 490 500 510
140 150 160 170 180
pF1KE5 ---SHGKE-------YPEHLPLEVLEAGIKSGRYIQGILNVNKHRAQIEAFV--RLQGAS
. :.. :: : : .. . .. .:... .: . .:: .. ::
CCDS13 VMVTVGEDGLLDTVARPESLQQARLYENLPPAA-LRKLLHAEPERYRHCSFVPETFERAS
520 530 540 550 560 570
190 200 210 220 230
pF1KE5 SKDSDLVSD--ILIHGMKARNRSIHGDVVVVELL-----PKNEWKGRTVALCENDCDDKA
. : .:. : ..: . .. :: :.:.:: :... .::.... . . :
CCDS13 AIPLDDASSGPIQVRGRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELA
580 590 600 610 620 630
240 250 260 270 280 290
pF1KE5 -----SGESPSEPMP-TGRVVGILQKNWRDYVVTFPSKEEVQSQGKNAQKILVTPWDYRI
. .: .: .: :. :. . .: ::. . : :. :.
CCDS13 FVCRMDTWDPRIMVPINGSVTKIFVAELKD-----PSQVPIYSLRKG-----------RL
640 650 660 670
300 310 320 330 340 350
pF1KE5 PKIRISTQQAETLQDFRVVVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENSIS
.. . ::. .. :.: :.. :: : .:: . . : . . .: :.
CCDS13 QRVGLERLTAEARHSRLFWVQIVLWRQGFYYPLGIVREVLPEASTWEQGLRILGLEYSLR
680 690 700 710 720 730
360 370 380 390 400 410
pF1KE5 VIPFSEAQMCEMPVNTPESPWKVSPEEEQKRKDLRKSHLVFSIDPKGCEDVDDTLSVRTL
: : ..: . .. . .:. .:.: : . :.:..::.: ..::.:::: :
CCDS13 VPPSDQATITKVLQKYHTELGRVAG----RREDCR-AFLTFTVDPQGACNLDDALSVRDL
740 750 760 770 780 790
420 430 440 450 460 470
pF1KE5 NNGNLELGVHIADVTHFVAPNSYIDIEARTRATTYYLADRR-YDMLPSVLSADLCSLLGG
. :..:::.::. :: .. .:.::: .....: :. :::. : :. ::: :
CCDS13 GP-RCEVAVHITDVASFVPRDGVLDVEARRQGAAFYAPGREPVPMLPASLCQDVLSLLPG
800 810 820 830 840 850
480 490 500 510 520 530
pF1KE5 VDRYAVSIMWELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFKDL
:: :.:.. ..::: ..:.. .. ....: .: :: :.:.. . .. ..:
CCDS13 RDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLSYEEAEEVIRQHPGAGRELP-----
860 870 880 890 900
540 550 560 570 580 590
pF1KE5 DEKSRQAKLEELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIPKQ
.: ... : : .. . :. : . : : : . . . . : .. .
CCDS13 ---ARLDSVDACVVAACYFSRLLRRHRLRSD-C-FYEQPDEDGTLGF---RAAHIMVKEY
910 920 930 940 950
600 610 620
pF1KE5 PLEVHETVAECMILAN--HWVAKKIWESFPH----QALLRQH----P-------------
.. .. ::: .. .. . :. :. :. .:: ..: :
CCDS13 MIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDRVPLSLHLGHHLHGGG
960 970 980 990 1000 1010
630 640 650 660 670 680
pF1KE5 --PPHQEFFSELRECAKAKGFFIDTRSNKTLADSLDNANDPHDPIVNRLLRSMATQAMSN
:: .. : : : :.. . ..: : ...: : :.. :.. .:.
CCDS13 GSPPDTRLHL-LASLWKQVQFAARTQDYEQMVD-LVTTDDMH-PFLAPAGRDL-RKALER
1020 1030 1040 1050 1060 1070
690 700 710 720 730 740
pF1KE5 ALYFSTGSCA---EEEFHHYGLALDKYTHFTSPIRRYSDIVVHRLLMAAISKDKKMEIKG
. . : :: ... ::.: .: :: ::::::: :.:..: .. :... :
CCDS13 SAF---GRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLALGHG------G
1080 1090 1100 1110 1120
750 760 770 780 790 800
pF1KE5 NLFSNKDLEELCRHINNRNQAAQHSQKQSTELFQCMYFKDKDPATEERCISDGVIYSIRT
. .: .:.. ::. .. .. :: :... : . .:
CCDS13 SAYSARDIDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVEAGSRCFR
1130 1140 1150 1160 1170 1180
810 820 830 840 850 860
pF1KE5 NGVLLFIPRFGIKGAAYLKNKDGLVISCGPDSCSEWKPGSLQRFQNKITSTTTDGESVTF
CCDS13 LLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPPLPLPGTV
1190 1200 1210 1220 1230 1240
>>CCDS33508.1 HELZ2 gene_id:85441|Hs108|chr20 (2649 aa)
initn: 284 init1: 185 opt: 433 Z-score: 509.3 bits: 107.1 E(32554): 4.8e-22
Smith-Waterman score: 498; 24.7% identity (53.1% similar) in 729 aa overlap (108-781:1060-1734)
80 90 100 110 120 130
pF1KE5 VMVTEDEEAIQQYGSETEGVFVITFKNYLDNFWP-DLKAAHELCDSILQSRRERENESQE
.::: : . . :.:: :: .:::.
CCDS33 VKEDVVPGACAAGAAAAAGVESTEAEDAEADFWPWDGELNAD--DAIL---RELLDESQK
1030 1040 1050 1060 1070 1080
140 150 160 170 180
pF1KE5 ---SHGKE-------YPEHLPLEVLEAGIKSGRYIQGILNVNKHRAQIEAFV--RLQGAS
. :.. :: : : .. . .. .:... .: . .:: .. ::
CCDS33 VMVTVGEDGLLDTVARPESLQQARLYENLPPAA-LRKLLHAEPERYRHCSFVPETFERAS
1090 1100 1110 1120 1130 1140
190 200 210 220 230
pF1KE5 SKDSDLVSD--ILIHGMKARNRSIHGDVVVVELL-----PKNEWKGRTVALCENDCDDKA
. : .:. : ..: . .. :: :.:.:: :... .::.... . . :
CCDS33 AIPLDDASSGPIQVRGRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELA
1150 1160 1170 1180 1190 1200
240 250 260 270 280 290
pF1KE5 -----SGESPSEPMP-TGRVVGILQKNWRDYVVTFPSKEEVQSQGKNAQKILVTPWDYRI
. .: .: .: :. :. . .: ::. . : :. :.
CCDS33 FVCRMDTWDPRIMVPINGSVTKIFVAELKD-----PSQVPIYSLRKG-----------RL
1210 1220 1230 1240
300 310 320 330 340 350
pF1KE5 PKIRISTQQAETLQDFRVVVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENSIS
.. . ::. .. :.: :.. :: : .:: . . : . . .: :.
CCDS33 QRVGLERLTAEARHSRLFWVQIVLWRQGFYYPLGIVREVLPEASTWEQGLRILGLEYSLR
1250 1260 1270 1280 1290 1300
360 370 380 390 400 410
pF1KE5 VIPFSEAQMCEMPVNTPESPWKVSPEEEQKRKDLRKSHLVFSIDPKGCEDVDDTLSVRTL
: : ..: . .. . .:. .:.: : . :.:..::.: ..::.:::: :
CCDS33 VPPSDQATITKVLQKYHTELGRVAG----RREDCR-AFLTFTVDPQGACNLDDALSVRDL
1310 1320 1330 1340 1350 1360
420 430 440 450 460 470
pF1KE5 NNGNLELGVHIADVTHFVAPNSYIDIEARTRATTYYLADRR-YDMLPSVLSADLCSLLGG
. :..:::.::. :: .. .:.::: .....: :. :::. : :. ::: :
CCDS33 GP-RCEVAVHITDVASFVPRDGVLDVEARRQGAAFYAPGREPVPMLPASLCQDVLSLLPG
1370 1380 1390 1400 1410 1420
480 490 500 510 520 530
pF1KE5 VDRYAVSIMWELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFKDL
:: :.:.. ..::: ..:.. .. ....: .: :: :.:.. . .. ..:
CCDS33 RDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLSYEEAEEVIRQHPGAGRELP-----
1430 1440 1450 1460 1470
540 550 560 570 580 590
pF1KE5 DEKSRQAKLEELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIPKQ
.: ... : : .. . :. : . : : : . . . . : .. .
CCDS33 ---ARLDSVDACVVAACYFSRLLRRHRLRSD-C-FYEQPDEDGTLGF---RAAHIMVKEY
1480 1490 1500 1510 1520
600 610 620
pF1KE5 PLEVHETVAECMILAN--HWVAKKIWESFPH----QALLRQH----P-------------
.. .. ::: .. .. . :. :. :. .:: ..: :
CCDS33 MIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDRVPLSLHLGHHLHGGG
1530 1540 1550 1560 1570 1580
630 640 650 660 670 680
pF1KE5 --PPHQEFFSELRECAKAKGFFIDTRSNKTLADSLDNANDPHDPIVNRLLRSMATQAMSN
:: .. : : : :.. . ..: : ...: : :.. :.. .:.
CCDS33 GSPPDTRLHL-LASLWKQVQFAARTQDYEQMVD-LVTTDDMH-PFLAPAGRDL-RKALER
1590 1600 1610 1620 1630 1640
690 700 710 720 730 740
pF1KE5 ALYFSTGSCA---EEEFHHYGLALDKYTHFTSPIRRYSDIVVHRLLMAAISKDKKMEIKG
. . : :: ... ::.: .: :: ::::::: :.:..: .. :... :
CCDS33 SAF---GRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLALGHG------G
1650 1660 1670 1680 1690
750 760 770 780 790 800
pF1KE5 NLFSNKDLEELCRHINNRNQAAQHSQKQSTELFQCMYFKDKDPATEERCISDGVIYSIRT
. .: .:.. ::. .. .. :: :... : . .:
CCDS33 SAYSARDIDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVEAGSRCFR
1700 1710 1720 1730 1740 1750
810 820 830 840 850 860
pF1KE5 NGVLLFIPRFGIKGAAYLKNKDGLVISCGPDSCSEWKPGSLQRFQNKITSTTTDGESVTF
CCDS33 LLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPPLPLPGTV
1760 1770 1780 1790 1800 1810
971 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 06:02:03 2016 done: Tue Nov 8 06:02:03 2016
Total Scan time: 3.840 Total Display time: 0.280
Function used was FASTA [36.3.4 Apr, 2011]