FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6415, 480 aa 1>>>pF1KE6415 480 - 480 aa - 480 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5980+/-0.000992; mu= 15.9996+/- 0.059 mean_var=64.4450+/-13.131, 0's: 0 Z-trim(103.2): 41 B-trim: 0 in 0/51 Lambda= 0.159764 statistics sampled from 7253 (7292) to 7253 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.594), E-opt: 0.2 (0.224), width: 16 Scan time: 1.840 The best scores are: opt bits E(32554) CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 480) 3185 743.3 1.3e-214 CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 422) 1652 389.9 2.8e-108 CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 497) 1652 389.9 3.2e-108 CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 518) 1652 389.9 3.4e-108 CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 ( 501) 1294 307.4 2.3e-83 CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 405) 1271 302.1 7.4e-82 CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 512) 1271 302.1 9.1e-82 CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 ( 470) 1201 286.0 6e-77 CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 ( 517) 1201 286.0 6.6e-77 CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 ( 517) 1180 281.1 1.9e-75 CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 801) 870 209.8 9e-54 CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 902) 870 209.8 1e-53 CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 912) 870 209.8 1e-53 CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 ( 923) 829 200.3 7.1e-51 CCDS55057.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 437) 821 198.4 1.3e-50 CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 ( 518) 683 166.6 5.8e-41 CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 487) 628 153.9 3.6e-37 CCDS4555.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 535) 542 134.1 3.6e-31 CCDS4556.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 548) 542 134.1 3.7e-31 CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 539) 472 118.0 2.6e-26 CCDS82090.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 380) 376 95.8 8.7e-20 CCDS11212.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 453) 376 95.8 1e-19 CCDS5172.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 433) 369 94.2 3e-19 CCDS11210.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 485) 361 92.4 1.2e-18 CCDS32589.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 508) 361 92.4 1.2e-18 CCDS9826.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 535) 323 83.6 5.6e-16 CCDS12766.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 802) 310 80.7 6.5e-15 CCDS53272.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 503) 265 70.2 5.6e-12 CCDS188.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 563) 265 70.3 6.2e-12 CCDS46141.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 751) 266 70.5 6.9e-12 >>CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 (480 aa) initn: 3185 init1: 3185 opt: 3185 Z-score: 3966.2 bits: 743.3 E(32554): 1.3e-214 Smith-Waterman score: 3185; 100.0% identity (100.0% similar) in 480 aa overlap (1-480:1-480) 10 20 30 40 50 60 pF1KE6 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEVGKLIQEAAGRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEVGKLIQEAAGRS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 NLKRVTLELGGKSPNIIFADADLDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 NLKRVTLELGGKSPNIIFADADLDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 RSVERAKRRVVGSPFDPTTEQGPQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 RSVERAKRRVVGSPFDPTTEQGPQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 IEPTVFSNVTDDMRIAKEEIFGPVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 IEPTVFSNVTDDMRIAKEEIFGPVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKAL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE6 TVSSAMQAGTVWINCYNALNAQSPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TVSSAMQAGTVWINCYNALNAQSPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS 430 440 450 460 470 480 >>CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 (422 aa) initn: 1652 init1: 1652 opt: 1652 Z-score: 2057.4 bits: 389.9 E(32554): 2.8e-108 Smith-Waterman score: 2466; 91.0% identity (91.0% similar) in 422 aa overlap (97-480:1-422) 70 80 90 100 110 120 pF1KE6 CEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATMESL :::::::::::::::::::::::::::::: CCDS45 MDASERGRLLDKLADLVERDRAVLATMESL 10 20 30 130 140 150 160 170 180 pF1KE6 NGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQIIPW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 NGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQIIPW 40 50 60 70 80 90 190 200 210 220 pF1KE6 NFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKE------------------ :::::::::::::::::::::::::::::::::::::::::: CCDS45 NFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGPTA 100 110 120 130 140 150 230 240 250 260 pF1KE6 --------------------VGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAVE :::::::::::::::::::::::::::::::::::::::: CCDS45 GAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAVE 160 170 180 190 200 210 270 280 290 300 310 320 pF1KE6 QAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQIDKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 QAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQIDKK 220 230 240 250 260 270 330 340 350 360 370 380 pF1KE6 QYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 QYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEIL 280 290 300 310 320 330 390 400 410 420 430 440 pF1KE6 RFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFGGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 RFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFGGF 340 350 360 370 380 390 450 460 470 480 pF1KE6 KMSGNGREMGEFGLREYSEVKTVTVKIPQKNS :::::::::::::::::::::::::::::::: CCDS45 KMSGNGREMGEFGLREYSEVKTVTVKIPQKNS 400 410 420 >>CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 (497 aa) initn: 1652 init1: 1652 opt: 1652 Z-score: 2056.3 bits: 389.9 E(32554): 3.2e-108 Smith-Waterman score: 2856; 91.5% identity (91.5% similar) in 484 aa overlap (35-480:14-497) 10 20 30 40 50 60 pF1KE6 KIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNPATGE :: ::::::::::::::::::::::::: CCDS55 MKNQCETVWLKSPIKLKLIFINNEWQNSESGRVFPVYNPATGE 10 20 30 40 70 80 90 100 110 120 pF1KE6 QVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATME :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 QVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATME 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE6 SLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 SLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQII 110 120 130 140 150 160 190 200 210 220 pF1KE6 PWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKE---------------- :::::::::::::::::::::::::::::::::::::::::::: CCDS55 PWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGP 170 180 190 200 210 220 230 240 250 260 pF1KE6 ----------------------VGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYA :::::::::::::::::::::::::::::::::::::: CCDS55 TAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYA 230 240 250 260 270 280 270 280 290 300 310 320 pF1KE6 VEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQID 290 300 310 320 330 340 330 340 350 360 370 380 pF1KE6 KKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 KKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQE 350 360 370 380 390 400 390 400 410 420 430 440 pF1KE6 ILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFG 410 420 430 440 450 460 450 460 470 480 pF1KE6 GFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS :::::::::::::::::::::::::::::::::: CCDS55 GFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS 470 480 490 >>CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 (518 aa) initn: 1652 init1: 1652 opt: 1652 Z-score: 2056.0 bits: 389.9 E(32554): 3.4e-108 Smith-Waterman score: 3066; 92.6% identity (92.6% similar) in 512 aa overlap (7-480:7-518) 10 20 30 40 50 60 pF1KE6 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC 130 140 150 160 170 180 190 200 210 220 pF1KE6 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKE------------ :::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILP 190 200 210 220 230 240 230 240 250 260 pF1KE6 --------------------------VGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD :::::::::::::::::::::::::::::::::: CCDS10 GYGPTAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD 250 260 270 280 290 300 270 280 290 300 310 320 pF1KE6 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG 310 320 330 340 350 360 330 340 350 360 370 380 pF1KE6 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG 370 380 390 400 410 420 390 400 410 420 430 440 pF1KE6 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ 430 440 450 460 470 480 450 460 470 480 pF1KE6 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS :::::::::::::::::::::::::::::::::::::: CCDS10 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS 490 500 510 >>CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 (501 aa) initn: 1294 init1: 1294 opt: 1294 Z-score: 1610.3 bits: 307.4 E(32554): 2.3e-83 Smith-Waterman score: 2212; 66.7% identity (84.0% similar) in 493 aa overlap (26-480:9-501) 10 20 30 40 50 60 pF1KE6 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP :: .:.:.::::::::::..: ::. :::.:: CCDS66 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNP 10 20 30 40 70 80 90 100 110 120 pF1KE6 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL :: :..:.:.:.:: :.::::.::: ::..:: :: :::::::::: :::::.:::: .: CCDS66 ATEEELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLL 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE6 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC :::::.:::: . .:. :: : :::.:: :::::::.: :::.::..::.::::::::: CCDS66 ATMESMNGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVC 110 120 130 140 150 160 190 200 210 220 pF1KE6 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKE------------ ::::::::::.:. :::.::: ::::::.::::::::.::....:::: CCDS66 GQIIPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVP 170 180 190 200 210 220 230 240 250 260 pF1KE6 --------------------------VGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD :::::.::::.::::::::::::::: :..:::: CCDS66 GYGPTAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADAD 230 240 250 260 270 280 270 280 290 300 310 320 pF1KE6 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG :: ::: ::.:::..::::: :.::::::::::.:::::::::::. ..:.:. : . :: CCDS66 LDNAVEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQG 290 300 310 320 330 340 330 340 350 360 370 380 pF1KE6 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG :::::.::.:::.::.:: ::::::::: : ::.:..:::::::::.:::::::::: CCDS66 PQIDKEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFG 350 360 370 380 390 400 390 400 410 420 430 440 pF1KE6 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ :::.:..::..:.::.::::. .:: :.:::.::.::.:.:::.::::::.:::....:: CCDS66 PVQQIMKFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQ 410 420 430 440 450 460 450 460 470 480 pF1KE6 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS :::::::::::::.::.:..::.::::::::: :::: CCDS66 CPFGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS 470 480 490 500 >>CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 (405 aa) initn: 1694 init1: 1271 opt: 1271 Z-score: 1583.1 bits: 302.1 E(32554): 7.4e-82 Smith-Waterman score: 1584; 57.7% identity (74.7% similar) in 454 aa overlap (26-479:20-404) 10 20 30 40 50 60 pF1KE6 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP :: : :::.:.:::::::::..:.::. : . :: CCDS76 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNP 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL .: ::.:::.:.:: :.::::.::..::. :: :::.:: ::::: .::::::::::.: CCDS76 STREQICEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC : ::. : :: CCDS76 A-----------------------------AGF----------------------PPGVV 120 190 200 210 220 230 240 pF1KE6 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEVGKLIQEAAGRS . :.: : . : . : . : .. . :. :::::..:::.:: CCDS76 N-IVPGFGPTVGAAISSHPQI---NKIA------------FTGS--TEVGKLVKEAASRS 130 140 150 160 250 260 270 280 290 300 pF1KE6 NLKRVTLELGGKSPNIIFADADLDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVR ::::::::::::.: :. :::::: ::: :::::::::::::::.::.::::..: :::: CCDS76 NLKRVTLELGGKNPCIVCADADLDLAVECAHQGVFFNQGQCCTAASRVFVEEQVYSEFVR 170 180 190 200 210 220 310 320 330 340 350 360 pF1KE6 RSVERAKRRVVGSPFDPTTEQGPQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFF :::: ::.: ::.::: ::::::::.::..::::::.:: :::::::::... ::.: CCDS76 RSVEYAKKRPVGDPFDVKTEQGPQIDQKQFDKILELIESGKKEGAKLECGGSAMEDKGLF 230 240 250 260 270 280 370 380 390 400 410 420 pF1KE6 IEPTVFSNVTDDMRIAKEEIFGPVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKAL :.:::::.:::.::::::::::::: ::.::...:::.:::..:.::.:::::....::: CCDS76 IKPTVFSEVTDNMRIAKEEIFGPVQPILKFKSIEEVIKRANSTDYGLTAAVFTKNLDKAL 290 300 310 320 330 340 430 440 450 460 470 480 pF1KE6 TVSSAMQAGTVWINCYNALNAQSPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS ..::...::::::::::: ::.:::::::::::::.::..: ::.::::::.:. .:: CCDS76 KLASALESGTVWINCYNALYAQAPFGGFKMSGNGRELGEYALAEYTEVKTVTIKLGDKNP 350 360 370 380 390 400 >>CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 (512 aa) initn: 1271 init1: 1271 opt: 1271 Z-score: 1581.5 bits: 302.1 E(32554): 9.1e-82 Smith-Waterman score: 2195; 65.9% identity (84.1% similar) in 492 aa overlap (26-479:20-511) 10 20 30 40 50 60 pF1KE6 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP :: : :::.:.:::::::::..:.::. : . :: CCDS10 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNP 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL .: ::.:::.:.:: :.::::.::..::. :: :::.:: ::::: .::::::::::.: CCDS10 STREQICEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC :..:... :::::.::..::.: :.:.::.:::::::.: :::.: . :::::::::: CCDS10 AALETMDTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTDDNVVCFTRHEPIGVC 120 130 140 150 160 170 190 200 210 220 pF1KE6 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKE------------ : : ::::::::..::.:::::::::.:.::::::::.:::.:.:::: CCDS10 GAITPWNFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVP 180 190 200 210 220 230 230 240 250 260 pF1KE6 --------------------------VGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD ::::..:::.::::::::::::::.: :. :::: CCDS10 GFGPTVGAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADAD 240 250 260 270 280 290 270 280 290 300 310 320 pF1KE6 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG :: ::: :::::::::::::::.::.::::..: :::::::: ::.: ::.::: :::: CCDS10 LDLAVECAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQG 300 310 320 330 340 350 330 340 350 360 370 380 pF1KE6 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG ::::.::..::::::.:: :::::::::... ::.::.:::::.:::.:::::::::: CCDS10 PQIDQKQFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFG 360 370 380 390 400 410 390 400 410 420 430 440 pF1KE6 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ ::: ::.::...:::.:::..:.::.:::::....::: ..::...::::::::::: :: CCDS10 PVQPILKFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQ 420 430 440 450 460 470 450 460 470 480 pF1KE6 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS .:::::::::::::.::..: ::.::::::.:. .:: CCDS10 APFGGFKMSGNGRELGEYALAEYTEVKTVTIKLGDKNP 480 490 500 510 >>CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 (470 aa) initn: 1347 init1: 1201 opt: 1201 Z-score: 1494.9 bits: 286.0 E(32554): 6e-77 Smith-Waterman score: 1728; 54.2% identity (73.1% similar) in 498 aa overlap (21-480:20-470) 10 20 30 40 50 60 pF1KE6 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP :. . .:.:. . :. ..:::::::... : ..::. :: CCDS55 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNP 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL .::: .:.: :.::: CCDS55 STGEVICQVAEGDKA--------------------------------------------- 60 70 130 140 150 160 170 180 pF1KE6 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC .:.:..:::.. .. :::. :.: .::::::::: :: :::.:::.:..:::::.::: CCDS55 --LETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVC 80 90 100 110 120 130 190 200 210 220 pF1KE6 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKE------------ :::::::::::: :::..::: ::.::.: ::::::.:::.. :::: CCDS55 GQIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVP 140 150 160 170 180 190 230 240 250 260 pF1KE6 --------------------------VGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD .:..:: ::: ::::::::::::::::::..::: CCDS55 GFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDAD 200 210 220 230 240 250 270 280 290 300 310 320 pF1KE6 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG .:.:::::: ..:::::::: :::: ::.:.::.:::.::: ::: ::::.::: :::: CCDS55 MDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQG 260 270 280 290 300 310 330 340 350 360 370 380 pF1KE6 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG ::.:. :..::: :..: ::::: ::: . .:.::.::::..: : : :::::::: CCDS55 PQVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFG 320 330 340 350 360 370 390 400 410 420 430 440 pF1KE6 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ ::..::.:::..::. ::::: .::.:::::.:..:: .:.:.::::::.:::....:: CCDS55 PVMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQ 380 390 400 410 420 430 450 460 470 480 pF1KE6 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS :::::.::::.:::.::.::. :.::::::::.::::: CCDS55 SPFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS 440 450 460 470 >>CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 (517 aa) initn: 1201 init1: 1201 opt: 1201 Z-score: 1494.2 bits: 286.0 E(32554): 6.6e-77 Smith-Waterman score: 2062; 61.0% identity (81.7% similar) in 498 aa overlap (21-480:20-517) 10 20 30 40 50 60 pF1KE6 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP :. . .:.:. . :. ..:::::::... : ..::. :: CCDS91 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNP 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL .::: .:.: :.:: :.::::.::: ::.::: :::::::.:::::..::::.::::. : CCDS91 STGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC :..:.:..:::.. .. :::. :.: .::::::::: :: :::.:::.:..:::::.::: CCDS91 AALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVC 120 130 140 150 160 170 190 200 210 220 pF1KE6 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKE------------ :::::::::::: :::..::: ::.::.: ::::::.:::.. :::: CCDS91 GQIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVP 180 190 200 210 220 230 230 240 250 260 pF1KE6 --------------------------VGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD .:..:: ::: ::::::::::::::::::..::: CCDS91 GFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDAD 240 250 260 270 280 290 270 280 290 300 310 320 pF1KE6 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG .:.:::::: ..:::::::: :::: ::.:.::.:::.::: ::: ::::.::: :::: CCDS91 MDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQG 300 310 320 330 340 350 330 340 350 360 370 380 pF1KE6 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG ::.:. :..::: :..: ::::: ::: . .:.::.::::..: : : :::::::: CCDS91 PQVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFG 360 370 380 390 400 410 390 400 410 420 430 440 pF1KE6 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ ::..::.:::..::. ::::: .::.:::::.:..:: .:.:.::::::.:::....:: CCDS91 PVMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQ 420 430 440 450 460 470 450 460 470 480 pF1KE6 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS :::::.::::.:::.::.::. :.::::::::.::::: CCDS91 SPFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS 480 490 500 510 >>CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 (517 aa) initn: 1180 init1: 1180 opt: 1180 Z-score: 1468.1 bits: 281.1 E(32554): 1.9e-75 Smith-Waterman score: 2051; 60.5% identity (81.4% similar) in 501 aa overlap (18-480:17-517) 10 20 30 40 50 60 pF1KE6 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP : ..: :::: : .: :...:::::::.. : ..::. :: CCDS66 MLRFLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNP 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL .::: . .: :.:.::.:.::.::: :: ::: :::::::::::::..:::::::::. : CCDS66 TTGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNRLADLVERDRVYL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC :..:.:..:::: ... .::. :::..::.:::::: :: :::.::..: ::::::.::: CCDS66 ASLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVGVC 120 130 140 150 160 170 190 200 210 220 pF1KE6 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKE------------ ::::::::::.: .::.:::: :::::.: ::::::::::...:::: CCDS66 GQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIIT 180 190 200 210 220 230 230 240 250 260 pF1KE6 --------------------------VGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD ::.:::.::: :::::::::::::::.:..:::: CCDS66 GYGPTAGAAIAQHVDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADAD 240 250 260 270 280 290 270 280 290 300 310 320 pF1KE6 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG ...:::: :...:::.:::: :::: :::::::.::..:.::.::.: ::.::. :.:: CCDS66 MEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQG 300 310 320 330 340 350 330 340 350 360 370 380 pF1KE6 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG ::.::.:....: :: : ::::: :::. .:..::::.::::..: :::::::::::: CCDS66 PQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFG 360 370 380 390 400 410 390 400 410 420 430 440 pF1KE6 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ ::: ...:: ..::.:::::. .::.::::: :..::. ..:.::::::.: :: .. . CCDS66 PVQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVTCH 420 430 440 450 460 470 450 460 470 480 pF1KE6 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS .:::::: ::::::.:: ::. :.::::::.:.::::: CCDS66 TPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS 480 490 500 510 480 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 13:03:37 2016 done: Tue Nov 8 13:03:37 2016 Total Scan time: 1.840 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]