FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4487, 508 aa 1>>>pF1KE4487 508 - 508 aa - 508 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3716+/- 0.001; mu= 17.6167+/- 0.060 mean_var=68.9520+/-13.676, 0's: 0 Z-trim(104.0): 40 B-trim: 53 in 1/48 Lambda= 0.154455 statistics sampled from 7629 (7668) to 7629 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.602), E-opt: 0.2 (0.236), width: 16 Scan time: 2.540 The best scores are: opt bits E(32554) CCDS32589.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 508) 3337 753.1 1.7e-217 CCDS11210.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 485) 3164 714.5 6.4e-206 CCDS11212.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 453) 2109 479.4 3.6e-135 CCDS82090.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 380) 1848 421.2 9.9e-118 CCDS73335.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 468) 1687 385.4 7.4e-107 CCDS73336.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 431) 1480 339.3 5.3e-93 CCDS31622.1 ALDH3B2 gene_id:222|Hs108|chr11 ( 385) 1357 311.8 8.6e-85 CCDS76443.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 351) 720 169.9 4.3e-42 CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 512) 536 129.0 1.3e-29 CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 ( 501) 521 125.6 1.3e-28 CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 422) 481 116.6 5.4e-26 CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 497) 481 116.7 6.1e-26 CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 518) 481 116.7 6.4e-26 CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 ( 517) 472 114.7 2.5e-25 CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 ( 923) 470 114.4 5.6e-25 CCDS4555.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 535) 460 112.0 1.7e-24 CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 405) 422 103.5 4.7e-22 CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 801) 414 101.9 2.8e-21 CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 902) 414 101.9 3.1e-21 CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 ( 518) 411 101.1 3.2e-21 CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 912) 414 101.9 3.2e-21 CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 480) 361 89.9 6.7e-18 CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 ( 470) 360 89.7 7.7e-18 CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 ( 517) 360 89.7 8.3e-18 CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 539) 342 85.7 1.4e-16 CCDS4556.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 548) 339 85.1 2.2e-16 >>CCDS32589.1 ALDH3A2 gene_id:224|Hs108|chr17 (508 aa) initn: 3337 init1: 3337 opt: 3337 Z-score: 4018.4 bits: 753.1 E(32554): 1.7e-217 Smith-Waterman score: 3337; 100.0% identity (100.0% similar) in 508 aa overlap (1-508:1-508) 10 20 30 40 50 60 pF1KE4 MELEVRRVRQAFLSGRSRPLRFRLQQLEALRRMVQEREKDILTAIAADLCKSEFNVYSQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MELEVRRVRQAFLSGRSRPLRFRLQQLEALRRMVQEREKDILTAIAADLCKSEFNVYSQE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 VITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQPLGVVLIIGAWNYPFVLTIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 VITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQPLGVVLIIGAWNYPFVLTIQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 PLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLYIVINGGVEETTELLKQRFDH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLYIVINGGVEETTELLKQRFDH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 IFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDCDLDIVCRRITWGKYMNCGQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 IFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDCDLDIVCRRITWGKYMNCGQT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 CIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYERIINLRHFKRILSLLEGQKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 CIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYERIINLRHFKRILSLLEGQKI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 AFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINFINEREKPLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 AFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINFINEREKPLA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 LYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFGGVGSSGMGAYHGKHSFDTFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFGGVGSSGMGAYHGKHSFDTFS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 HQRPCLLKSLKREGANKLRYPPNSQSKVDWGKFFLLKRFNKEKLGLLLLTFLGIVAAVLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 HQRPCLLKSLKREGANKLRYPPNSQSKVDWGKFFLLKRFNKEKLGLLLLTFLGIVAAVLV 430 440 450 460 470 480 490 500 pF1KE4 KKYQAVLRRKALLIFLVVHRLRWSSKQR :::::::::::::::::::::::::::: CCDS32 KKYQAVLRRKALLIFLVVHRLRWSSKQR 490 500 >>CCDS11210.1 ALDH3A2 gene_id:224|Hs108|chr17 (485 aa) initn: 3164 init1: 3164 opt: 3164 Z-score: 3810.4 bits: 714.5 E(32554): 6.4e-206 Smith-Waterman score: 3164; 100.0% identity (100.0% similar) in 481 aa overlap (1-481:1-481) 10 20 30 40 50 60 pF1KE4 MELEVRRVRQAFLSGRSRPLRFRLQQLEALRRMVQEREKDILTAIAADLCKSEFNVYSQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MELEVRRVRQAFLSGRSRPLRFRLQQLEALRRMVQEREKDILTAIAADLCKSEFNVYSQE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 VITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQPLGVVLIIGAWNYPFVLTIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 VITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQPLGVVLIIGAWNYPFVLTIQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 PLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLYIVINGGVEETTELLKQRFDH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLYIVINGGVEETTELLKQRFDH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 IFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDCDLDIVCRRITWGKYMNCGQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 IFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDCDLDIVCRRITWGKYMNCGQT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 CIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYERIINLRHFKRILSLLEGQKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 CIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYERIINLRHFKRILSLLEGQKI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 AFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINFINEREKPLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 AFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINFINEREKPLA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 LYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFGGVGSSGMGAYHGKHSFDTFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFGGVGSSGMGAYHGKHSFDTFS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 HQRPCLLKSLKREGANKLRYPPNSQSKVDWGKFFLLKRFNKEKLGLLLLTFLGIVAAVLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 HQRPCLLKSLKREGANKLRYPPNSQSKVDWGKFFLLKRFNKEKLGLLLLTFLGIVAAVLV 430 440 450 460 470 480 490 500 pF1KE4 KKYQAVLRRKALLIFLVVHRLRWSSKQR : CCDS11 KAEYY >>CCDS11212.1 ALDH3A1 gene_id:218|Hs108|chr17 (453 aa) initn: 2088 init1: 2088 opt: 2109 Z-score: 2540.3 bits: 479.4 E(32554): 3.6e-135 Smith-Waterman score: 2109; 67.7% identity (90.9% similar) in 439 aa overlap (5-443:8-446) 10 20 30 40 50 pF1KE4 MELEVRRVRQAFLSGRSRPLRFRLQQLEALRRMVQEREKDILTAIAADLCKSEFNVY :.:.: :: :::.:::.::.::::::.:..::.:.... :.:::: :.:.:.: CCDS11 MSKISEAVKRARAAFSSGRTRPLQFRIQQLEALQRLIQEQEQELVGALAADLHKNEWNAY 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 SQEVITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQPLGVVLIIGAWNYPFVL .::. :: ::..:...::::.. .::.:. :. :: ::. .::::::.::.::::: : CCDS11 YEEVVYVLEEIEYMIQKLPEWAADEPVEKTPQTQQDELYIHSEPLGVVLVIGTWNYPFNL 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 TIQPLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLYIVINGGVEETTELLKQR ::::..:::::::.:..:::::::: :..:: ..:::::.::: :::::: :::::::.: CCDS11 TIQPMVGAIAAGNSVVLKPSELSENMASLLATIIPQYLDKDLYPVINGGVPETTELLKER 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 FDHIFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDCDLDIVCRRITWGKYMNC ::::.:::.:.::::.: ::::::::::::::::::::.::.::::..::::.:::.:: CCDS11 FDHILYTGSTGVGKIIMTAAAKHLTPVTLELGGKSPCYVDKNCDLDVACRRIAWGKFMNS 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE4 GQTCIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYERIINLRHFKRILSLLEG ::::.:::::::. :.::::: :.:...::::::. :.: :: :::. :::.:...:.:: CCDS11 GQTCVAPDYILCDPSIQNQIVEKLKKSLKEFYGEDAKKSRDYGRIISARHFQRVMGLIEG 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE4 QKIAFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINFINEREK ::.:.:: : ::::::::.::::::.. :::::::::.:::: :....:::.:::.::: CCDS11 QKVAYGGTGDAATRYIAPTILTDVDPQSPVMQEEIFGPVLPIVCVRSLEEAIQFINQREK 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE4 PLALYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFGGVGSSGMGAYHGKHSFD :::::.:: : :.::.:: :::::::..::::.:.::.:.::::::.::::.::::.::. CCDS11 PLALYMFSSNDKVIKKMIAETSSGGVAANDVIVHITLHSLPFGGVGNSGMGSYHGKKSFE 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE4 TFSHQRPCLLKSLKREGANKLRYPPNSQSKVDWGKFFLLKRFNKEKLGLLLLTFLGIVAA ::::.: ::.. : . . :.::::. CCDS11 TFSHRRSCLVRPLMNDEGLKVRYPPSPAKMTQH 430 440 450 >>CCDS82090.1 ALDH3A1 gene_id:218|Hs108|chr17 (380 aa) initn: 1837 init1: 1837 opt: 1848 Z-score: 2227.1 bits: 421.2 E(32554): 9.9e-118 Smith-Waterman score: 1848; 69.4% identity (91.2% similar) in 373 aa overlap (71-443:1-373) 50 60 70 80 90 100 pF1KE4 ILTAIAADLCKSEFNVYSQEVITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQ :...::::.. .::.:. :. :: ::. . CCDS82 MIQKLPEWAADEPVEKTPQTQQDELYIHSE 10 20 30 110 120 130 140 150 160 pF1KE4 PLGVVLIIGAWNYPFVLTIQPLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLY ::::::.::.::::: :::::..:::::::.:..:::::::: :..:: ..:::::.::: CCDS82 PLGVVLVIGTWNYPFNLTIQPMVGAIAAGNSVVLKPSELSENMASLLATIIPQYLDKDLY 40 50 60 70 80 90 170 180 190 200 210 220 pF1KE4 IVINGGVEETTELLKQRFDHIFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDC :::::: :::::::.:::::.:::.:.::::.: ::::::::::::::::::::.::.: CCDS82 PVINGGVPETTELLKERFDHILYTGSTGVGKIIMTAAAKHLTPVTLELGGKSPCYVDKNC 100 110 120 130 140 150 230 240 250 260 270 280 pF1KE4 DLDIVCRRITWGKYMNCGQTCIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYE :::..::::.:::.:: ::::.:::::::. :.::::: :.:...::::::. :.: :: CCDS82 DLDVACRRIAWGKFMNSGQTCVAPDYILCDPSIQNQIVEKLKKSLKEFYGEDAKKSRDYG 160 170 180 190 200 210 290 300 310 320 330 340 pF1KE4 RIINLRHFKRILSLLEGQKIAFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIV :::. :::.:...:.::::.:.:: : ::::::::.::::::.. :::::::::.:::: CCDS82 RIISARHFQRVMGLIEGQKVAYGGTGDAATRYIAPTILTDVDPQSPVMQEEIFGPVLPIV 220 230 240 250 260 270 350 360 370 380 390 400 pF1KE4 PVKNVDEAINFINEREKPLALYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFG :....:::.:::.::::::::.:: : :.::.:: :::::::..::::.:.::.:.::: CCDS82 CVRSLEEAIQFINQREKPLALYMFSSNDKVIKKMIAETSSGGVAANDVIVHITLHSLPFG 280 290 300 310 320 330 410 420 430 440 450 460 pF1KE4 GVGSSGMGAYHGKHSFDTFSHQRPCLLKSLKREGANKLRYPPNSQSKVDWGKFFLLKRFN :::.::::.::::.::.::::.: ::.. : . . :.::::. CCDS82 GVGNSGMGSYHGKKSFETFSHRRSCLVRPLMNDEGLKVRYPPSPAKMTQH 340 350 360 370 380 470 480 490 500 pF1KE4 KEKLGLLLLTFLGIVAAVLVKKYQAVLRRKALLIFLVVHRLRWSSKQR >>CCDS73335.1 ALDH3B1 gene_id:221|Hs108|chr11 (468 aa) initn: 1711 init1: 1686 opt: 1687 Z-score: 2031.9 bits: 385.4 E(32554): 7.4e-107 Smith-Waterman score: 1687; 55.2% identity (80.0% similar) in 444 aa overlap (5-448:8-451) 10 20 30 40 50 pF1KE4 MELEVRRVRQAFLSGRSRPLRFRLQQLEALRRMVQEREKDILTAIAADLCKSEFNVY .::.:.:: .::.:: .:: ::..: :..:: .. . :.: :: :: :. CCDS73 MDPLGDTLRRLREAFHAGRTRPAEFRAAQLQGLGRFLQENKQLLHDALAQDLHKSAFESE 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 SQEVITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQPLGVVLIIGAWNYPFVL .:: ::. . :.:: :. . : ::. :.:: :.:. .:.:.::::. ::::. : CCDS73 VSEVAISQGEVTLALRNLRAWMKDERVPKNLATQLDSAFIRKEPFGLVLIIAPWNYPLNL 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 TIQPLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLYIVINGGVEETTELLKQR :. ::.::.:::: :..::::.:.:. ::::..::::.::. . :. :: .:: .::..: CCDS73 TLVPLVGALAAGNCVVLKPSEISKNVEKILAEVLPQYVDQSCFAVVLGGPQETGQLLEHR 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 FDHIFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDCDLDIVCRRITWGKYMNC ::.::.::. :::::: ::::::::::::::::.:::.: .:: . : :..: .:.: CCDS73 FDYIFFTGSPRVGKIVMTAAAKHLTPVTLELGGKNPCYVDDNCDPQTVANRVAWFRYFNA 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE4 GQTCIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYERIINLRHFKRILSLLEG ::::.::::.:: .:.... .. :. .:::.. . ::. :::: ..:.:. .:: CCDS73 GQTCVAPDYVLCSPEMQERLLPALQSTITRFYGDDPQSSPNLGRIINQKQFQRLRALLGC 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE4 QKIAFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINFINEREK ..:.::..::. ::::::::.::. :::::::::::::: :...::::.:::.::: CCDS73 GRVAIGGQSDESDRYIAPTVLVDVQEMEPVMQEEIFGPILPIVNVQSLDEAIEFINRREK 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE4 PLALYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFGGVGSSGMGAYHGKHSFD :::::.::.. ...::.. .::::: ::: .::.:: :.::::::.:::: :::: ::: CCDS73 PLALYAFSNSSQVVKRVLTQTSSGGFCGNDGFMHMTLASLPFGGVGASGMGRYHGKFSFD 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE4 TFSHQRPCLLKSLKREGANKLRYPPNSQSKVDWGKFFLLKRFNKEKLGLLLLTFLGIVAA ::::.: :::.: : : :::::.: .. CCDS73 TFSHHRACLLRSPGMEKLNALRYPPQSPRRLRMLLVAMEAQGCSCTLL 430 440 450 460 480 490 500 pF1KE4 VLVKKYQAVLRRKALLIFLVVHRLRWSSKQR >>CCDS73336.1 ALDH3B1 gene_id:221|Hs108|chr11 (431 aa) initn: 1605 init1: 1479 opt: 1480 Z-score: 1783.1 bits: 339.3 E(32554): 5.3e-93 Smith-Waterman score: 1536; 52.3% identity (75.5% similar) in 444 aa overlap (5-448:8-414) 10 20 30 40 50 pF1KE4 MELEVRRVRQAFLSGRSRPLRFRLQQLEALRRMVQEREKDILTAIAADLCKSEFNVY .::.:.:: .::.:: .:: ::..: :..:: .. . :.: :: :. CCDS73 MDPLGDTLRRLREAFHAGRTRPAEFRAAQLQGLGRFLQENKQLLHDALAQDLHKA----- 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 SQEVITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQPLGVVLIIGAWNYPFVL :.:: :.:. .:.:.::::. ::::. : CCDS73 --------------------------------TQLDSAFIRKEPFGLVLIIAPWNYPLNL 60 70 80 120 130 140 150 160 170 pF1KE4 TIQPLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLYIVINGGVEETTELLKQR :. ::.::.:::: :..::::.:.:. ::::..::::.::. . :. :: .:: .::..: CCDS73 TLVPLVGALAAGNCVVLKPSEISKNVEKILAEVLPQYVDQSCFAVVLGGPQETGQLLEHR 90 100 110 120 130 140 180 190 200 210 220 230 pF1KE4 FDHIFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDCDLDIVCRRITWGKYMNC ::.::.::. :::::: ::::::::::::::::.:::.: .:: . : :..: .:.: CCDS73 FDYIFFTGSPRVGKIVMTAAAKHLTPVTLELGGKNPCYVDDNCDPQTVANRVAWFRYFNA 150 160 170 180 190 200 240 250 260 270 280 290 pF1KE4 GQTCIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYERIINLRHFKRILSLLEG ::::.::::.:: .:.... .. :. .:::.. . ::. :::: ..:.:. .:: CCDS73 GQTCVAPDYVLCSPEMQERLLPALQSTITRFYGDDPQSSPNLGRIINQKQFQRLRALLGC 210 220 230 240 250 260 300 310 320 330 340 350 pF1KE4 QKIAFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINFINEREK ..:.::..::. ::::::::.::. :::::::::::::: :...::::.:::.::: CCDS73 GRVAIGGQSDESDRYIAPTVLVDVQEMEPVMQEEIFGPILPIVNVQSLDEAIEFINRREK 270 280 290 300 310 320 360 370 380 390 400 410 pF1KE4 PLALYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFGGVGSSGMGAYHGKHSFD :::::.::.. ...::.. .::::: ::: .::.:: :.::::::.:::: :::: ::: CCDS73 PLALYAFSNSSQVVKRVLTQTSSGGFCGNDGFMHMTLASLPFGGVGASGMGRYHGKFSFD 330 340 350 360 370 380 420 430 440 450 460 470 pF1KE4 TFSHQRPCLLKSLKREGANKLRYPPNSQSKVDWGKFFLLKRFNKEKLGLLLLTFLGIVAA ::::.: :::.: : : :::::.: .. CCDS73 TFSHHRACLLRSPGMEKLNALRYPPQSPRRLRMLLVAMEAQGCSCTLL 390 400 410 420 430 480 490 500 pF1KE4 VLVKKYQAVLRRKALLIFLVVHRLRWSSKQR >>CCDS31622.1 ALDH3B2 gene_id:222|Hs108|chr11 (385 aa) initn: 1347 init1: 1347 opt: 1357 Z-score: 1635.8 bits: 311.8 E(32554): 8.6e-85 Smith-Waterman score: 1357; 52.0% identity (80.2% similar) in 373 aa overlap (82-451:4-376) 60 70 80 90 100 110 pF1KE4 SEFNVYSQEVITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQPLGVVLIIGAW .: . :.. :: ..: .:.:.::::. : CCDS31 MKDEPRSTNLFMKLDSVFIWKEPFGLVLIIAPW 10 20 30 120 130 140 150 160 170 pF1KE4 NYPFVLTIQPLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLYIVINGGVEETT :::. ::. :.::.:::. :..::::.:..: :.::..:::::::. . :. :: .:: CCDS31 NYPLNLTLVLLVGALAAGSCVVLKPSEISQGTEKVLAEVLPQYLDQSCFAVVLGGPQETG 40 50 60 70 80 90 180 190 200 210 220 230 pF1KE4 ELLKQRFDHIFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDCDLDIVCRRITW .::....:.::.::. :::::: ::.:::::::::::::.:::.: .:: . : :..: CCDS31 QLLEHKLDYIFFTGSPRVGKIVMTAATKHLTPVTLELGGKNPCYVDDNCDPQTVANRVAW 100 110 120 130 140 150 240 250 260 270 280 290 pF1KE4 GKYMNCGQTCIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYERIINLRHFKRI :.: ::::.::::.:: .:.... .. :. .:::.. . ::. .::: ..:.:. CCDS31 FCYFNAGQTCVAPDYVLCSPEMQERLLPALQSTITRFYGDDPQSSPNLGHIINQKQFQRL 160 170 180 190 200 210 300 310 320 330 340 350 pF1KE4 LSLLEGQKIAFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINF .:: ...:.::...:. ::::::::.::. :::::::::::::: :..:::::.: CCDS31 RALLGCSRVAIGGQSNESDRYIAPTVLVDVQETEPVMQEEIFGPILPIVNVQSVDEAIKF 220 230 240 250 260 270 360 370 380 390 400 410 pF1KE4 INEREKPLALYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFGGVGSSGMGAYH ::..:::::::.::.. .....:...::::. ::. . ...: : :::::: :::: :: CCDS31 INRQEKPLALYAFSNSSQVVNQMLERTSSGSFGGNEGFTYISLLSVPFGGVGHSGMGRYH 280 290 300 310 320 330 420 430 440 450 460 pF1KE4 GKHSFDTFSHQRPCLLKSLKREGANKLRYPPNS---QSKVDWGKFFLLKRFNKEKLGLLL :: .::::::.: ::: : ....::: . :. . :: CCDS31 GKFTFDTFSHHRTCLLAPSGLEKLKEIHYPPYTDWNQQLLRWGMGSQSCTLL 340 350 360 370 380 470 480 490 500 pF1KE4 LTFLGIVAAVLVKKYQAVLRRKALLIFLVVHRLRWSSKQR >>CCDS76443.1 ALDH3B1 gene_id:221|Hs108|chr11 (351 aa) initn: 1231 init1: 714 opt: 720 Z-score: 869.2 bits: 169.9 E(32554): 4.3e-42 Smith-Waterman score: 976; 41.2% identity (59.0% similar) in 444 aa overlap (5-448:8-334) 10 20 30 40 50 pF1KE4 MELEVRRVRQAFLSGRSRPLRFRLQQLEALRRMVQEREKDILTAIAADLCKSEFNVY .::.:.:: .::.:: .:: ::..: :..:: .. . :.: :: :: :. CCDS76 MDPLGDTLRRLREAFHAGRTRPAEFRAAQLQGLGRFLQENKQLLHDALAQDLHKSAFESE 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 SQEVITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQPLGVVLIIGAWNYPFVL .:: ::. . :.:: :. . : ::. :.:: :.:. .:.:.::::. ::::. : CCDS76 VSEVAISQGEVTLALRNLRAWMKDERVPKNLATQLDSAFIRKEPFGLVLIIAPWNYPLNL 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 TIQPLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLYIVINGGVEETTELLKQR :. ::.::.:::: :..::::.:.:. ::::..::::.::. CCDS76 TLVPLVGALAAGNCVVLKPSEISKNVEKILAEVLPQYVDQS------------------- 130 140 150 160 180 190 200 210 220 230 pF1KE4 FDHIFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDCDLDIVCRRITWGKYMNC CCDS76 ------------------------------------------------------------ 240 250 260 270 280 290 pF1KE4 GQTCIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYERIINLRHFKRILSLLEG ::. :::: ..:.:. .:: CCDS76 --------------------------------------SPNLGRIINQKQFQRLRALLGC 170 180 300 310 320 330 340 350 pF1KE4 QKIAFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINFINEREK ..:.::..::. ::::::::.::. :::::::::::::: :...::::.:::.::: CCDS76 GRVAIGGQSDESDRYIAPTVLVDVQEMEPVMQEEIFGPILPIVNVQSLDEAIEFINRREK 190 200 210 220 230 240 360 370 380 390 400 410 pF1KE4 PLALYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFGGVGSSGMGAYHGKHSFD :::::.::.. ...::.. .::::: ::: .::.:: :.::::::.:::: :::: ::: CCDS76 PLALYAFSNSSQVVKRVLTQTSSGGFCGNDGFMHMTLASLPFGGVGASGMGRYHGKFSFD 250 260 270 280 290 300 420 430 440 450 460 470 pF1KE4 TFSHQRPCLLKSLKREGANKLRYPPNSQSKVDWGKFFLLKRFNKEKLGLLLLTFLGIVAA ::::.: :::.: : : :::::.: .. CCDS76 TFSHHRACLLRSPGMEKLNALRYPPQSPRRLRMLLVAMEAQGCSCTLL 310 320 330 340 350 480 490 500 pF1KE4 VLVKKYQAVLRRKALLIFLVVHRLRWSSKQR >>CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 (512 aa) initn: 468 init1: 150 opt: 536 Z-score: 645.2 bits: 129.0 E(32554): 1.3e-29 Smith-Waterman score: 536; 28.2% identity (57.2% similar) in 432 aa overlap (16-428:84-506) 10 20 30 40 pF1KE4 MELEVRRVRQAFLSGRSRPLRFRLQQLEALRRMVQ-----EREKD :. : : ::. : : . : ::.. CCDS10 PSTREQICEVEEGDKPDVDKAVEAAQVAFQRGSPWR-RLDALSRGRLLHQLADLVERDRA 60 70 80 90 100 110 50 60 70 80 90 pF1KE4 ILTAIAA-DLCKSEFNVYSQEVITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEA--YI :.:. . : : .... : . : : :. . : : .. ... :.. . CCDS10 TLAALETMDTGKPFLHAF---FIDLEGCIR-TLRYFAGW--ADKIQGKTIPTDDNVVCFT 120 130 140 150 160 100 110 120 130 140 150 pF1KE4 QPQPLGVVLIIGAWNYPFVLTIQPLIGAIAAGNAVIIKPSELSENTAKILAKLLPQY-LD . .:.:: : ::.:... . : :. ::....::.: . :: :..:. . . CCDS10 RHEPIGVCGAITPWNFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFP 170 180 190 200 210 220 160 170 180 190 200 210 pF1KE4 QDLYIVING-GVEETTELLKQ-RFDHIFYTGNTAVGKIVMEAAAK-HLTPVTLELGGKSP . .. : : . . .. ....: .::.: :::.: :::.. .: ::::::::.: CCDS10 PGVVNIVPGFGPTVGAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNP 230 240 250 260 270 280 220 230 240 250 260 270 pF1KE4 CYIDKDCDLDIVCRRITWGKYMNCGQTCIAPDYILCEASLQNQIVWKIKETVKEF-YGEN : . : :::.. . : ..: :: : : . .. : .. ...: . : .:. :. CCDS10 CIVCADADLDLAVECAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDP 290 300 310 320 330 340 280 290 300 310 320 pF1KE4 IKESPDYERIINLRHFKRILSLLE-----GQKIAFGGET-DEATRYIAPTVLTDVDPKTK . . . :. ..: .:: :.: : :. :: . .. .: :::...: . . CCDS10 FDVKTEQGPQIDQKQFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMR 350 360 370 380 390 400 330 340 350 360 370 380 pF1KE4 VMQEEIFGPILPIVPVKNVDEAINFINEREKPLALYVFSHNHKLIKRMIDETSSGGVTGN . .::::::. ::. :...:.:. : . :. ::..: .. . :: : : CCDS10 IAKEEIFGPVQPILKFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWIN 410 420 430 440 450 460 390 400 410 420 430 440 pF1KE4 DVIMHFTLNSFPFGGVGSSGMGAYHGKHSFDTFSHQRPCLLKSLKREGANKLRYPPNSQS .. . :::: :: : :.... ... . .: CCDS10 --CYNALYAQAPFGGFKMSGNGRELGEYALAEYTEVKTVTIKLGDKNP 470 480 490 500 510 450 460 470 480 490 500 pF1KE4 KVDWGKFFLLKRFNKEKLGLLLLTFLGIVAAVLVKKYQAVLRRKALLIFLVVHRLRWSSK >>CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 (501 aa) initn: 443 init1: 172 opt: 521 Z-score: 627.3 bits: 125.6 E(32554): 1.3e-28 Smith-Waterman score: 521; 28.2% identity (56.7% similar) in 443 aa overlap (5-428:64-495) 10 20 30 pF1KE4 MELEVRRVRQAFLSG---RSRPLRFRLQQLEALR :. .:::: : :. : . : : CCDS66 SGKKFPVFNPATEEELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLA 40 50 60 70 80 90 40 50 60 70 80 pF1KE4 RMVQEREKDILTAIAA-DLCKSEFNVYSQEVITVLGEIDFMLENLPEWVTAK--PVKKNV .. ::.. .:... . . : :.: ... . . . . . . .. :. : CCDS66 DLI-ERDRLLLATMESMNGGKLYSNAYLNDLAGCIKTLRYC-AGWADKIQGRTIPIDGNF 100 110 120 130 140 150 90 100 110 120 130 140 pF1KE4 LTMLDEAYIQPQPLGVVLIIGAWNYPFVLTIQPLIGAIAAGNAVIIKPSELSENTAKILA .: : . .:.:: : ::.:.:. : . :.. ::.:..::.: . :: .: CCDS66 FT-----YTRHEPIGVCGQIIPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVA 160 170 180 190 200 150 160 170 180 190 200 pF1KE4 KLLPQY-LDQDLYIVINGGVEETTELLKQRFD--HIFYTGNTAVGKIVMEAAAK-HLTPV .:. . . . .. : . .....: .. .::.: :::.. :::.: .: : CCDS66 SLIKEAGFPPGVVNIVPGYGPTAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRV 210 220 230 240 250 260 210 220 230 240 250 260 pF1KE4 TLELGGKSPCYIDKDCDLDIVCRRITWGKYMNCGQTCIAPDYILCEASLQNQIVWKIKET :::::::::: . : ::: . . : ... :: ::: . :. : :. ...: . : CCDS66 TLELGGKSPCIVLADADLDNAVEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVER 270 280 290 300 310 320 270 280 290 300 310 pF1KE4 VKEFY-GENIKESPDYERIINLRHFKRILSLLE-----GQKIAFGGET-DEATRYIAPTV .:.. :. . . :. ... .::.:.: : :. :: . .. ::: CCDS66 AKKYILGNPLTPGVTQGPQIDKEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTV 330 340 350 360 370 380 320 330 340 350 360 370 pF1KE4 LTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINFINEREKPLALYVFSHNHKLIKRMIDE ...: . .. .::::::. :. :..:..:. :. :. ::. : : . : CCDS66 FSNVTDEMRIAKEEIFGPVQQIMKFKSLDDVIKRANNTFYGLSAGVFT---KDIDKAIT- 390 400 410 420 430 440 380 390 400 410 420 430 pF1KE4 TSSGGVTGNDVIMHFTLNS--FPFGGVGSSGMGAYHGKHSFDTFSHQRPCLLKSLKREGA ::. .:. . . . : :::: :: : :...: ... . .: CCDS66 ISSALQAGTVWVNCYGVVSAQCPFGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS 450 460 470 480 490 500 440 450 460 470 480 490 pF1KE4 NKLRYPPNSQSKVDWGKFFLLKRFNKEKLGLLLLTFLGIVAAVLVKKYQAVLRRKALLIF 508 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 00:49:03 2016 done: Sun Nov 6 00:49:03 2016 Total Scan time: 2.540 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]