FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4576, 763 aa 1>>>pF1KE4576 763 - 763 aa - 763 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0129+/-0.00103; mu= 15.9776+/- 0.061 mean_var=66.1997+/-13.196, 0's: 0 Z-trim(103.4): 34 B-trim: 6 in 1/48 Lambda= 0.157633 statistics sampled from 7367 (7401) to 7367 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.586), E-opt: 0.2 (0.227), width: 16 Scan time: 2.060 The best scores are: opt bits E(32554) CCDS1721.1 HADHA gene_id:3030|Hs108|chr2 ( 763) 4923 1129.0 0 CCDS3678.1 HADH gene_id:3033|Hs108|chr4 ( 314) 552 134.9 1.9e-31 CCDS54694.1 EHHADH gene_id:1962|Hs108|chr3 ( 627) 484 119.5 1.7e-26 CCDS33901.1 EHHADH gene_id:1962|Hs108|chr3 ( 723) 484 119.5 1.9e-26 CCDS82943.1 HADH gene_id:3033|Hs108|chr4 ( 318) 464 114.9 2.1e-25 CCDS54790.1 HADH gene_id:3033|Hs108|chr4 ( 331) 441 109.6 8.1e-24 CCDS6689.1 AUH gene_id:549|Hs108|chr9 ( 339) 378 95.3 1.7e-19 CCDS55600.1 ECHDC2 gene_id:55268|Hs108|chr1 ( 292) 371 93.7 4.5e-19 CCDS7681.1 ECHS1 gene_id:1892|Hs108|chr10 ( 290) 333 85.1 1.8e-16 CCDS78409.1 AUH gene_id:549|Hs108|chr9 ( 310) 272 71.2 2.8e-12 CCDS10464.1 ECI1 gene_id:1632|Hs108|chr16 ( 302) 259 68.2 2.1e-11 >>CCDS1721.1 HADHA gene_id:3030|Hs108|chr2 (763 aa) initn: 4923 init1: 4923 opt: 4923 Z-score: 6043.5 bits: 1129.0 E(32554): 0 Smith-Waterman score: 4923; 100.0% identity (100.0% similar) in 763 aa overlap (1-763:1-763) 10 20 30 40 50 60 pF1KE4 MVACRAIGILSRFSAFRILRSRGYICRNFTGSSALLTRTHINYGVKGDVAVVRINSPNSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 MVACRAIGILSRFSAFRILRSRGYICRNFTGSSALLTRTHINYGVKGDVAVVRINSPNSK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 VNTLSKELHSEFSEVMNEIWASDQIRSAVLISSKPGCFIAGADINMLAACKTLQEVTQLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 VNTLSKELHSEFSEVMNEIWASDQIRSAVLISSKPGCFIAGADINMLAACKTLQEVTQLS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 QEAQRIVEKLEKSTKPIVAAINGSCLGGGLEVAISCQYRIATKDRKTVLGTPEVLLGALP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 QEAQRIVEKLEKSTKPIVAAINGSCLGGGLEVAISCQYRIATKDRKTVLGTPEVLLGALP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 GAGGTQRLPKMVGVPAALDMMLTGRSIRADRAKKMGLVDQLVEPLGPGLKPPEERTIEYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 GAGGTQRLPKMVGVPAALDMMLTGRSIRADRAKKMGLVDQLVEPLGPGLKPPEERTIEYL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 EEVAITFAKGLADKKISPKRDKGLVEKLTAYAMTIPFVRQQVYKKVEEKVRKQTKGLYPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 EEVAITFAKGLADKKISPKRDKGLVEKLTAYAMTIPFVRQQVYKKVEEKVRKQTKGLYPA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 PLKIIDVVKTGIEQGSDAGYLCESQKFGELVMTKESKALMGLYHGQVLCKKNKFGAPQKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 PLKIIDVVKTGIEQGSDAGYLCESQKFGELVMTKESKALMGLYHGQVLCKKNKFGAPQKD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 VKHLAILGAGLMGAGIAQVSVDKGLKTILKDATLTALDRGQQQVFKGLNDKVKKKALTSF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 VKHLAILGAGLMGAGIAQVSVDKGLKTILKDATLTALDRGQQQVFKGLNDKVKKKALTSF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 ERDSIFSNLTGQLDYQGFEKADMVIEAVFEDLSLKHRVLKEVEAVIPDHCIFASNTSALP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 ERDSIFSNLTGQLDYQGFEKADMVIEAVFEDLSLKHRVLKEVEAVIPDHCIFASNTSALP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 ISEIAAVSKRPEKVIGMHYFSPVDKMQLLEIITTEKTSKDTSASAVAVGLKQGKVIIVVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 ISEIAAVSKRPEKVIGMHYFSPVDKMQLLEIITTEKTSKDTSASAVAVGLKQGKVIIVVK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 DGPGFYTTRCLAPMMSEVIRILQEGVDPKKLDSLTTSFGFPVGAATLVDEVGVDVAKHVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 DGPGFYTTRCLAPMMSEVIRILQEGVDPKKLDSLTTSFGFPVGAATLVDEVGVDVAKHVA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE4 EDLGKVFGERFGGGNPELLTQMVSKGFLGRKSGKGFYIYQEGVKRKDLNSDMDSILASLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 EDLGKVFGERFGGGNPELLTQMVSKGFLGRKSGKGFYIYQEGVKRKDLNSDMDSILASLK 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE4 LPPKSEVSSDEDIQFRLVTRFVNEAVMCLQEGILATPAEGDIGAVFGLGFPPCLGGPFRF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 LPPKSEVSSDEDIQFRLVTRFVNEAVMCLQEGILATPAEGDIGAVFGLGFPPCLGGPFRF 670 680 690 700 710 720 730 740 750 760 pF1KE4 VDLYGAQKIVDRLKKYEAAYGKQFTPCQLLADHANSPNKKFYQ ::::::::::::::::::::::::::::::::::::::::::: CCDS17 VDLYGAQKIVDRLKKYEAAYGKQFTPCQLLADHANSPNKKFYQ 730 740 750 760 >>CCDS3678.1 HADH gene_id:3033|Hs108|chr4 (314 aa) initn: 380 init1: 252 opt: 552 Z-score: 677.9 bits: 134.9 E(32554): 1.9e-31 Smith-Waterman score: 552; 33.9% identity (66.4% similar) in 289 aa overlap (361-640:27-314) 340 350 360 370 380 390 pF1KE4 VMTKESKALMGLYHGQVLCKKNKFGAPQKDVKHLAILGAGLMGAGIAQVSVDKGLKTILK :::....:.::::::::::.. : ..: CCDS36 MAFVTRQFMRSVSSSSTASASAKKIIVKHVTVIGGGLMGAGIAQVAAATGHTVVLV 10 20 30 40 50 400 410 420 430 440 pF1KE4 DATLTALDRGQQQVFKGLNDKVKKKALTSFERDSIF-----SNLTGQLDYQGF-EKADMV : : : .... . ..: .::: ... . : :... . : . ...:.: CCDS36 DQTEDILAKSKKGIEESLRKVAKKKFAENLKAGDEFVEKTLSTIATSTDAASVVHSTDLV 60 70 80 90 100 110 450 460 470 480 490 500 pF1KE4 IEAVFEDLSLKHRVLKEVEAVIPDHCIFASNTSALPISEIAAVSKRPEKVIGMHYFSPVD .::. :.:..:....:... .: :::::::.: :. :: .. : .. :.:.:.:: CCDS36 VEAIVENLKVKNELFKRLDKFAAEHTIFASNTSSLQITSIANATTRQDRFAGLHFFNPVP 120 130 140 150 160 170 510 520 530 540 550 560 pF1KE4 KMQLLEIITTEKTSKDTSASAVAVGLKQGKVIIVVKDGPGFYTTRCLAPMMSEVIRILQE :.:.:.: : ::. : : : . :: . :: ::: ..: :.:.. :.::. .. CCDS36 VMKLVEVIKTPMTSQKTFESLVDFSKALGKHPVSCKDTPGFIVNRLLVPYLMEAIRLYER 180 190 200 210 220 230 570 580 590 600 610 620 pF1KE4 GVDPKKLD---SLTTSFGFPVGAATLVDEVGVDVAKHVAEDLGKVFGERFGGGNPELLTQ : : .: : .. . :.:.: :.: ::.:..: ... .. .: :.. CCDS36 G-DASKEDIDTAMKLGAGYPMGPFELLDYVGLDTTKFIVDGWHEMDAENPLHQPSPSLNK 240 250 260 270 280 290 630 640 650 660 670 680 pF1KE4 MVSKGFLGRKSGKGFYIYQEGVKRKDLNSDMDSILASLKLPPKSEVSSDEDIQFRLVTRF .:... .:.:.:.::: :. CCDS36 LVAENKFGKKTGEGFYKYK 300 310 >>CCDS54694.1 EHHADH gene_id:1962|Hs108|chr3 (627 aa) initn: 783 init1: 385 opt: 484 Z-score: 589.2 bits: 119.5 E(32554): 1.7e-26 Smith-Waterman score: 902; 30.3% identity (61.1% similar) in 647 aa overlap (146-761:3-616) 120 130 140 150 160 170 pF1KE4 VTQLSQEAQRIVEKLEKSTKPIVAAINGSCLGGGLEVAISCQYRIATKDRKTVLGTPEVL .:::::.:..:.:::: . . .: ::: CCDS54 MAFGGGLELALGCHYRIAHAEAQ--VGLPEVT 10 20 30 180 190 200 210 220 230 pF1KE4 LGALPGAGGTQRLPKMVGVPAALDMMLTGRSIRADRAKKMGLVDQLVEPLGPGLKPPEER :: :::: ::: ::...:::::::.. .:: : ::.: :.:..:..:. : :: CCDS54 LGLLPGARGTQLLPRLTGVPAALDLITSGRRILADEALKLGILDKVVNS-----DPVEE- 40 50 60 70 80 240 250 260 270 280 290 pF1KE4 TIEYLEEVAITFAKGLADKKISPKRDKGLVEKLTAYAMTIPFVRQQVYKKVEEKVRKQTK :: ::. ..:. . .: : .: ...: . ....... :.:.: CCDS54 --------AIRFAQRVSDQPLESRR---LCNK---PIQSLPNM-DSIFSEALLKMRRQHP 90 100 110 120 300 310 320 330 340 350 pF1KE4 GLYPAPLKIIDVVKTGIEQGSDAGYLCESQKFGELVMTKESKALMGLYHGQVLCKKNKFG : : . .:..... ..: : . : :... ...::. . .. : ::.. CCDS54 GCL-AQEACVRAVQAAVQYPYEVGIKKEEELFLYLLQSGQARALQYAFFAER--KANKWS 130 140 150 160 170 180 360 370 380 390 400 pF1KE4 APQ---------KDVKHLAILGAGLMGAGIAQVSVDKGLKTILKDATLTALDRGQQQVFK .:. . :. ....: : :: ::. . . .: :. . : ..... . CCDS54 TPSGASWKTASARPVSSVGVVGLGTMGRGIVISFARARIPVIAVDSDKNQLATANKMITS 190 200 210 220 230 240 410 420 430 440 450 460 pF1KE4 GLNDKVKKKALTSFERDSIFSNLTGQLDYQGFEKADMVIEAVFEDLSLKHRVLKEVEAVI :. ...: .. .. ::... : .:.:::::::..:::..:. :. :: CCDS54 VLEKEASKMQQSGHPWSGPKPRLTSSVKELG--GVDLVIEAVFEEMSLKKQVFAELSAVC 250 260 270 280 290 300 470 480 490 500 510 520 pF1KE4 PDHCIFASNTSALPISEIAAVSKRPEKVIGMHYFSPVDKMQLLEIITTEKTSKDTSASAV . .. .::::: ..:::. . ::. ::: :.:::. :.:::.: .. .: : :... CCDS54 KPEAFLCTNTSALDVDEIASSTDRPHLVIGTHFFSPAHVMKLLEVIPSQYSSPTTIATVM 310 320 330 340 350 360 530 540 550 560 570 580 pF1KE4 AVGLKQGKVIIVVKDGPGFYTTRCLAPMMSEVIRILQEGVDPKKLDSLTTSFGFPVGAAT .. : :. .:: . :: .: : :..... .:.:: :...:.. ::: .: CCDS54 NLSKKIKKIGVVVGNCFGFVGNRMLNPYYNQAYFLLEEGSKPEEVDQVLEEFGFKMGPFR 370 380 390 400 410 420 590 600 610 620 630 pF1KE4 LVDEVGVDVAKHVAEDLGKVFGERFGG------GN------PELLTQMVSKGFLGRKSGK . : .:.::. . . : . . : :: :..: .. : .:.:.:: CCDS54 VSDLAGLDVGWKSRKGQGLTGPTLLPGTPARKRGNRRYCPIPDVLCEL---GRFGQKTGK 430 440 450 460 470 480 640 650 660 670 680 pF1KE4 GFYIYQEG---VKRKD--LNSDMDSILASLKLPPKSEVSSDEDIQFRLVTRFVNEAVMCL :.: :.. ... : :.. .. . .. :.. .:.:: .. : . ..::: : CCDS54 GWYQYDKPLGRIHKPDPWLSKFLSRYRKTHHIEPRT-ISQDEILE-RCLYSLINEAFRIL 490 500 510 520 530 690 700 710 720 730 740 pF1KE4 QEGILATPAEGDIGAVFGLGFPPCLGGPFRFVDLYGAQKIVDRLKKY--EAAYGKQFTPC ::: :.: . :. . : :.: :::. ... : ....:.:: . :. : CCDS54 GEGIAASPEHIDVVYLHGYGWPRHKGGPMFYASTVGLPTVLEKLQKYYRQNPDIPQLEPS 540 550 560 570 580 590 750 760 pF1KE4 QLL---ADHANSPNKKFYQ . : :...: : :.. CCDS54 DYLKKLASQGNPPLKEWQSLAGSPSSKL 600 610 620 >>CCDS33901.1 EHHADH gene_id:1962|Hs108|chr3 (723 aa) initn: 847 init1: 385 opt: 484 Z-score: 588.1 bits: 119.5 E(32554): 1.9e-26 Smith-Waterman score: 1028; 30.2% identity (61.2% similar) in 744 aa overlap (49-761:11-712) 20 30 40 50 60 70 pF1KE4 LRSRGYICRNFTGSSALLTRTHINYGVKGDVAVVRINSPNSKVNTLSKELHSEFSEVMNE .:..:. .: ::..: : ...: ... CCDS33 MAEYTRLHNALALIRLRNP--PVNAISTTLLRDIKEGLQK 10 20 30 80 90 100 110 120 130 pF1KE4 IWASDQIRSAVLISSKPGCFIAGADINMLAACKTLQEVTQLSQEAQRIVEKLEKSTKPIV . :. :..: . : : ::::: ..: .:. . ..:...... ::.: CCDS33 AVIDHTIK-AIVICGAEGKFSAGADIRGFSAPRTF------GLTLGHVVDEIQRNEKPVV 40 50 60 70 80 90 140 150 160 170 180 190 pF1KE4 AAINGSCLGGGLEVAISCQYRIATKDRKTVLGTPEVLLGALPGAGGTQRLPKMVGVPAAL :::.: .:::::.:..:.:::: . . .: ::: :: :::: ::: ::...:::::: CCDS33 AAIQGMAFGGGLELALGCHYRIAHAEAQ--VGLPEVTLGLLPGARGTQLLPRLTGVPAAL 100 110 120 130 140 200 210 220 230 240 250 pF1KE4 DMMLTGRSIRADRAKKMGLVDQLVEPLGPGLKPPEERTIEYLEEVAITFAKGLADKKISP :.. .:: : ::.: :.:..:..:. : :: :: ::. ..:. . CCDS33 DLITSGRRILADEALKLGILDKVVNS-----DPVEE---------AIRFAQRVSDQPLES 150 160 170 180 190 260 270 280 290 300 310 pF1KE4 KRDKGLVEKLTAYAMTIPFVRQQVYKKVEEKVRKQTKGLYPAPLKIIDVVKTGIEQGSDA .: : .: ...: . ....... :.:.: : : . .:..... .. CCDS33 RR---LCNK---PIQSLPNM-DSIFSEALLKMRRQHPGCL-AQEACVRAVQAAVQYPYEV 200 210 220 230 240 320 330 340 350 360 pF1KE4 GYLCESQKFGELVMTKESKALMGLYHGQVLCKKNKFGAPQ---------KDVKHLAILGA : : . : :... ...::. . .. : ::...:. . :. ....: CCDS33 GIKKEEELFLYLLQSGQARALQYAFFAER--KANKWSTPSGASWKTASARPVSSVGVVGL 250 260 270 280 290 300 370 380 390 400 410 420 pF1KE4 GLMGAGIAQVSVDKGLKTILKDATLTALDRGQQQVFKGLNDKVKKKALTSFERDSIFSNL : :: ::. . . .: :. . : ..... . :. ...: .. .. : CCDS33 GTMGRGIVISFARARIPVIAVDSDKNQLATANKMITSVLEKEASKMQQSGHPWSGPKPRL 310 320 330 340 350 360 430 440 450 460 470 480 pF1KE4 TGQLDYQGFEKADMVIEAVFEDLSLKHRVLKEVEAVIPDHCIFASNTSALPISEIAAVSK :... : .:.:::::::..:::..:. :. :: . .. .::::: ..:::. . CCDS33 TSSVKELG--GVDLVIEAVFEEMSLKKQVFAELSAVCKPEAFLCTNTSALDVDEIASSTD 370 380 390 400 410 420 490 500 510 520 530 540 pF1KE4 RPEKVIGMHYFSPVDKMQLLEIITTEKTSKDTSASAVAVGLKQGKVIIVVKDGPGFYTTR ::. ::: :.:::. :.:::.: .. .: : :... .. : :. .:: . :: .: CCDS33 RPHLVIGTHFFSPAHVMKLLEVIPSQYSSPTTIATVMNLSKKIKKIGVVVGNCFGFVGNR 430 440 450 460 470 480 550 560 570 580 590 600 pF1KE4 CLAPMMSEVIRILQEGVDPKKLDSLTTSFGFPVGAATLVDEVGVDVAKHVAEDLGKVFGE : :..... .:.:: :...:.. ::: .: . : .:.::. . . : . CCDS33 MLNPYYNQAYFLLEEGSKPEEVDQVLEEFGFKMGPFRVSDLAGLDVGWKSRKGQGLTGPT 490 500 510 520 530 540 610 620 630 640 650 pF1KE4 RFGG------GN------PELLTQMVSKGFLGRKSGKGFYIYQEG---VKRKD--LNSDM . : :: :..: .. : .:.:.:::.: :.. ... : :.. . CCDS33 LLPGTPARKRGNRRYCPIPDVLCEL---GRFGQKTGKGWYQYDKPLGRIHKPDPWLSKFL 550 560 570 580 590 600 660 670 680 690 700 710 pF1KE4 DSILASLKLPPKSEVSSDEDIQFRLVTRFVNEAVMCLQEGILATPAEGDIGAVFGLGFPP . . .. :.. .:.:: : : . ..::: : ::: :.: . :. . : :.: CCDS33 SRYRKTHHIEPRT-ISQDE-ILERCLYSLINEAFRILGEGIAASPEHIDVVYLHGYGWPR 610 620 630 640 650 720 730 740 750 760 pF1KE4 CLGGPFRFVDLYGAQKIVDRLKKY--EAAYGKQFTPCQLL---ADHANSPNKKFYQ :::. ... : ....:.:: . :. : . : :...: : :.. CCDS33 HKGGPMFYASTVGLPTVLEKLQKYYRQNPDIPQLEPSDYLKKLASQGNPPLKEWQSLAGS 660 670 680 690 700 710 CCDS33 PSSKL 720 >>CCDS82943.1 HADH gene_id:3033|Hs108|chr4 (318 aa) initn: 309 init1: 252 opt: 464 Z-score: 569.6 bits: 114.9 E(32554): 2.1e-25 Smith-Waterman score: 464; 31.2% identity (64.1% similar) in 276 aa overlap (374-640:44-318) 350 360 370 380 390 400 pF1KE4 HGQVLCKKNKFGAPQKDVKHLAILGAGLMGAGIAQVSVDKGLKTILKDATLTALDRGQQQ : . .:.. : ..: : : : .... CCDS82 LGVCWRKEHDPAEMLRVGRAELGGWKPSWEAIVKEVAAATGHTVVLVDQTEDILAKSKKG 20 30 40 50 60 70 410 420 430 440 450 pF1KE4 VFKGLNDKVKKKALTSFERDSIF-----SNLTGQLDYQGF-EKADMVIEAVFEDLSLKHR . ..: .::: ... . : :... . : . ...:.:.::. :.:..:.. CCDS82 IEESLRKVAKKKFAENLKAGDEFVEKTLSTIATSTDAASVVHSTDLVVEAIVENLKVKNE 80 90 100 110 120 130 460 470 480 490 500 510 pF1KE4 VLKEVEAVIPDHCIFASNTSALPISEIAAVSKRPEKVIGMHYFSPVDKMQLLEIITTEKT ..:... .: :::::::.: :. :: .. : .. :.:.:.:: :.:.:.: : : CCDS82 LFKRLDKFAAEHTIFASNTSSLQITSIANATTRQDRFAGLHFFNPVPVMKLVEVIKTPMT 140 150 160 170 180 190 520 530 540 550 560 570 pF1KE4 SKDTSASAVAVGLKQGKVIIVVKDGPGFYTTRCLAPMMSEVIRILQEGVDPKKLD---SL :. : : : . :: . :: ::: ..: :.:.. :.::. ..: : .: : .. CCDS82 SQKTFESLVDFSKALGKHPVSCKDTPGFIVNRLLVPYLMEAIRLYERG-DASKEDIDTAM 200 210 220 230 240 250 580 590 600 610 620 630 pF1KE4 TTSFGFPVGAATLVDEVGVDVAKHVAEDLGKVFGERFGGGNPELLTQMVSKGFLGRKSGK . :.:.: :.: ::.:..: ... .. .: :...:... .:.:.:. CCDS82 KLGAGYPMGPFELLDYVGLDTTKFIVDGWHEMDAENPLHQPSPSLNKLVAENKFGKKTGE 260 270 280 290 300 310 640 650 660 670 680 690 pF1KE4 GFYIYQEGVKRKDLNSDMDSILASLKLPPKSEVSSDEDIQFRLVTRFVNEAVMCLQEGIL ::: :. CCDS82 GFYKYK >>CCDS54790.1 HADH gene_id:3033|Hs108|chr4 (331 aa) initn: 372 init1: 244 opt: 441 Z-score: 541.0 bits: 109.6 E(32554): 8.1e-24 Smith-Waterman score: 513; 32.1% identity (63.3% similar) in 305 aa overlap (361-640:27-331) 340 350 360 370 380 390 pF1KE4 VMTKESKALMGLYHGQVLCKKNKFGAPQKDVKHLAILGAGLMGAGIAQVSVDKGLKTILK :::....:.::::::::::.. : ..: CCDS54 MAFVTRQFMRSVSSSSTASASAKKIIVKHVTVIGGGLMGAGIAQVAAATGHTVVLV 10 20 30 40 50 400 410 420 430 440 pF1KE4 DATLTALDRGQQQVFKGLNDKVKKKALTSFERDSIF-----SNLTGQLDYQGF-EKADMV : : : .... . ..: .::: ... . : :... . : . ...:.: CCDS54 DQTEDILAKSKKGIEESLRKVAKKKFAENLKAGDEFVEKTLSTIATSTDAASVVHSTDLV 60 70 80 90 100 110 450 460 470 480 490 500 pF1KE4 IEAVFEDLSLKHRVLKEVEAVIPDHCIFASNTSALPISEIAAVSKRPEKVIGMHYFSPVD .::. :.:..:....:... .: :::::::.: :. :: .. : .. :.:.:.:: CCDS54 VEAIVENLKVKNELFKRLDKFAAEHTIFASNTSSLQITSIANATTRQDRFAGLHFFNPVP 120 130 140 150 160 170 510 520 530 540 550 560 pF1KE4 KMQLLEIITTEKTSKDTSASAVAVGLKQGKVIIVVKDGPGFYTTRCLAPMMSEVIRILQE :.:.:.: : ::. : : : . :: . :: ::: ..: :.:.. :.::. .. CCDS54 VMKLVEVIKTPMTSQKTFESLVDFSKALGKHPVSCKDTPGFIVNRLLVPYLMEAIRLYER 180 190 200 210 220 230 570 580 590 600 pF1KE4 ----------GV------DPKKLD---SLTTSFGFPVGAATLVDEVGVDVAKHVAEDLGK :. : .: : .. . :.:.: :.: ::.:..: ... . CCDS54 DFQTCGDSNSGLGFSLKGDASKEDIDTAMKLGAGYPMGPFELLDYVGLDTTKFIVDGWHE 240 250 260 270 280 290 610 620 630 640 650 660 pF1KE4 VFGERFGGGNPELLTQMVSKGFLGRKSGKGFYIYQEGVKRKDLNSDMDSILASLKLPPKS . .: :...:... .:.:.:.::: :. CCDS54 MDAENPLHQPSPSLNKLVAENKFGKKTGEGFYKYK 300 310 320 330 670 680 690 700 710 720 pF1KE4 EVSSDEDIQFRLVTRFVNEAVMCLQEGILATPAEGDIGAVFGLGFPPCLGGPFRFVDLYG >>CCDS6689.1 AUH gene_id:549|Hs108|chr9 (339 aa) initn: 356 init1: 133 opt: 378 Z-score: 463.4 bits: 95.3 E(32554): 1.7e-19 Smith-Waterman score: 378; 30.4% identity (63.8% similar) in 260 aa overlap (22-276:65-317) 10 20 30 40 50 pF1KE4 MVACRAIGILSRFSAFRILRSRGYICRNFTGSSALLTRTHINYGVKGDVAV ::: .. . : .: :.. .: ..: CCDS66 RLPGSLAGRRAGPAIWAQGWVPAAGGPAPKRGY-SSEMKTEDELRVR-HLEEENRG-IVV 40 50 60 70 80 90 60 70 80 90 100 110 pF1KE4 VRINSPNSKVNTLSKELHSEFSEVMNEIWASDQIRSAVLISSKPGCFIAGADINMLAACK . :: .: :.:::.: . .:.... . .. ..:. .. : :: : ::::.. : . CCDS66 LGINRAYGK-NSLSKNLIKMLSKAVDALKSDKKVRTIIIRSEVPGIFCAGADLKERAKMS 100 110 120 130 140 150 120 130 140 150 160 170 pF1KE4 TLQEVTQLSQEAQRIVEKLEKSTKPIVAAINGSCLGGGLEVAISCQYRIATKDRKTVLGT . .:: . .. . ... . . : .:::.: ::::::.:..:. :.:... : .: CCDS66 S-SEVGPFVSKIRAVINDIANLPVPTIAAIDGLALGGGLELALACDIRVAASSAK--MGL 160 170 180 190 200 180 190 200 210 220 pF1KE4 PEVLLGALPGAGGTQRLPKMVGVPAALDMMLTGRSIRADRAKKMGLVDQLVEPLGPG--- :. :. .::.:::::::. .:. : ......: . . .:: .::.....: : CCDS66 VETKLAIIPGGGGTQRLPRAIGMSLAKELIFSARVLDGKEAKAVGLISHVLEQNQEGDAA 210 220 230 240 250 260 230 240 250 260 270 280 pF1KE4 LKPPEERTIEYLEE--VAITFAKGLADKKISPKRDKGLVEKLTAYAMTIPFVRQQVYKKV . . . :.: . ::. :: .. . ::. . . ::.::: CCDS66 YRKALDLAREFLPQGPVAMRVAKLAINQGMEVDLVTGLAIEEACYAQTIPTKDRLEGLLA 270 280 290 300 310 320 290 300 310 320 330 340 pF1KE4 EEKVRKQTKGLYPAPLKIIDVVKTGIEQGSDAGYLCESQKFGELVMTKESKALMGLYHGQ CCDS66 FKEKRPPRYKGE 330 >>CCDS55600.1 ECHDC2 gene_id:55268|Hs108|chr1 (292 aa) initn: 247 init1: 148 opt: 371 Z-score: 455.9 bits: 93.7 E(32554): 4.5e-19 Smith-Waterman score: 371; 29.7% identity (60.4% similar) in 273 aa overlap (9-276:4-270) 10 20 30 40 50 60 pF1KE4 MVACRAIGILSRFSAFRILRSRGYICRNFTGSSALLTRTHINYGVKGDVAVVRINSPNSK .: . .: ::.:: . .:.: . .:. : .. . .: :... CCDS55 MLRVLCLLRPWRPLRARGCASDGAAGGSEIQVRALA--GPDQGITEILMNRPSAR 10 20 30 40 50 70 80 90 100 110 120 pF1KE4 VNTLSKELHSEFSEVMNEIWASDQIRSAVLISSKPGCFIAGADINMLAACKTLQEVTQLS :.:.. . ::. :.. .. . :.: .. :. : : ::::.. . :: . CCDS55 -NALGNVFVSELLETLAQLREDRQVRVLLFRSGVKGVFCAGADLKEREQMSE-AEVGVFV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE4 QEAQRIVEKLEKSTKPIVAAINGSCLGGGLEVAISCQYRIATKDRKTVLGTPEVLLGALP :. . ... . : .::..: ::::::.:..:. :.:... .:.: :. : :: CCDS55 QRLRGLMNDIAAFPAPTIAAMDGFALGGGLELALACDLRVAASS--AVMGLIETTRGLLP 120 130 140 150 160 190 200 210 220 230 pF1KE4 GAGGTQRLPKMVGVPAALDMMLTGRSIRADRAKKMGLVDQLVEPLGPGLKPPEE-RTI-- :::::::::. .:: : ....::: . . .:. .:::.. : : .. :.. CCDS55 GAGGTQRLPRCLGVALAKELIFTGRRLSGTEAHVLGLVNHAVAQNEEGDAAYQRARALAQ 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE4 EYLEE--VAITFAKGLADKKISPKRDKGLVEKLTAYAMTIPFVRQQVYKKVEEKVRKQTK : : . .:. ..: :. .:.. . ::..:: CCDS55 EILPQAPIAVRLGKVAIDRGTEVDIASGMAIEGMCYAQNIPTRDRLEGMAAFREKRTPKF 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE4 GLYPAPLKIIDVVKTGIEQGSDAGYLCESQKFGELVMTKESKALMGLYHGQVLCKKNKFG CCDS55 VGK 290 >>CCDS7681.1 ECHS1 gene_id:1892|Hs108|chr10 (290 aa) initn: 271 init1: 182 opt: 333 Z-score: 409.3 bits: 85.1 E(32554): 1.8e-16 Smith-Waterman score: 333; 34.2% identity (66.8% similar) in 184 aa overlap (44-225:42-218) 20 30 40 50 60 70 pF1KE4 SAFRILRSRGYICRNFTGSSALLTRTHINYGVKGDVAVVRINSPNSKVNTLSKELHSEFS : .. :.....: :.. .:.: : .:.. CCDS76 RGPLRPPVRCPAWRPFASGANFEYIIAEKRGKNNTVGLIQLNRPKA-LNALCDGLIDELN 20 30 40 50 60 70 80 90 100 110 120 130 pF1KE4 EVMNEIWASDQIRSAVLISSKPGCFIAGADINMLAACKTLQEVTQLSQEAQRIVEKLEKS ... . . : .:..... : :::::. . ..:. :.. . ..: . CCDS76 QAL-KTFEEDPAVGAIVLTGGDKAFAAGADIKEM---QNLSFQDCYSSKFLKHWDHLTQV 80 90 100 110 120 140 150 160 170 180 190 pF1KE4 TKPIVAAINGSCLGGGLEVAISCQYRIATKDRKTVLGTPEVLLGALPGAGGTQRLPKMVG ::..::.:: .::: :.:. :. : .:. .. ::.:.:..::::::::: . :: CCDS76 KKPVIAAVNGYAFGGGCELAMMCD--IIYAGEKAQFAQPEILIGTIPGAGGTQRLTRAVG 130 140 150 160 170 180 200 210 220 230 240 250 pF1KE4 VPAALDMMLTGRSIRADRAKKMGLVDQL--VEPLGPGLKPPEERTIEYLEEVAITFAKGL :..:.::: : :. ::. :::... :: : CCDS76 KSLAMEMVLTGDRISAQDAKQAGLVSKICPVETLVEEAIQCAEKIASNSKIVVAMAKESV 190 200 210 220 230 240 260 270 280 290 300 310 pF1KE4 ADKKISPKRDKGLVEKLTAYAMTIPFVRQQVYKKVEEKVRKQTKGLYPAPLKIIDVVKTG CCDS76 NAAFEMTLTEGSKLEKKLFYSTFATDDRKEGMTAFVEKRKANFKDQ 250 260 270 280 290 >>CCDS78409.1 AUH gene_id:549|Hs108|chr9 (310 aa) initn: 251 init1: 133 opt: 272 Z-score: 333.8 bits: 71.2 E(32554): 2.8e-12 Smith-Waterman score: 289; 28.5% identity (57.7% similar) in 260 aa overlap (22-276:65-288) 10 20 30 40 50 pF1KE4 MVACRAIGILSRFSAFRILRSRGYICRNFTGSSALLTRTHINYGVKGDVAV ::: .. . : .: :.. .: ..: CCDS78 RLPGSLAGRRAGPAIWAQGWVPAAGGPAPKRGY-SSEMKTEDELRVR-HLEEENRG-IVV 40 50 60 70 80 90 60 70 80 90 100 110 pF1KE4 VRINSPNSKVNTLSKELHSEFSEVMNEIWASDQIRSAVLISSKPGCFIAGADINMLAACK . :: .: :.:::.: . .:.... . .. ..:. .. : :: : : :.. . CCDS78 LGINRAYGK-NSLSKNLIKMLSKAVDALKSDKKVRTIIIRSEVPGIFCA-ANLPV----- 100 110 120 130 140 120 130 140 150 160 170 pF1KE4 TLQEVTQLSQEAQRIVEKLEKSTKPIVAAINGSCLGGGLEVAISCQYRIATKDRKTVLGT : .:::.: ::::::.:..:. :.:... : .: CCDS78 ------------------------PTIAAIDGLALGGGLELALACDIRVAASSAK--MGL 150 160 170 180 190 200 210 220 pF1KE4 PEVLLGALPGAGGTQRLPKMVGVPAALDMMLTGRSIRADRAKKMGLVDQLVEPLGPG--- :. :. .::.:::::::. .:. : ......: . . .:: .::.....: : CCDS78 VETKLAIIPGGGGTQRLPRAIGMSLAKELIFSARVLDGKEAKAVGLISHVLEQNQEGDAA 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE4 LKPPEERTIEYLEE--VAITFAKGLADKKISPKRDKGLVEKLTAYAMTIPFVRQQVYKKV . . . :.: . ::. :: .. . ::. . . ::.::: CCDS78 YRKALDLAREFLPQGPVAMRVAKLAINQGMEVDLVTGLAIEEACYAQTIPTKDRLEGLLA 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE4 EEKVRKQTKGLYPAPLKIIDVVKTGIEQGSDAGYLCESQKFGELVMTKESKALMGLYHGQ CCDS78 FKEKRPPRYKGE 300 310 763 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 23:48:47 2016 done: Sat Nov 5 23:48:47 2016 Total Scan time: 2.060 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]