FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB4181, 902 aa 1>>>pF1KB4181 902 - 902 aa - 902 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7966+/-0.0011; mu= 17.8765+/- 0.065 mean_var=66.9929+/-13.403, 0's: 0 Z-trim(101.7): 46 B-trim: 0 in 0/51 Lambda= 0.156697 statistics sampled from 6585 (6627) to 6585 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.558), E-opt: 0.2 (0.204), width: 16 Scan time: 3.680 The best scores are: opt bits E(32554) CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 902) 5987 1363.3 0 CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 912) 5987 1363.3 0 CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 ( 923) 4673 1066.2 0 CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 801) 4501 1027.3 0 CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 518) 1585 368.0 2.5e-101 CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 497) 1583 367.6 3.2e-101 CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 ( 501) 1553 360.8 3.6e-99 CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 ( 517) 1552 360.6 4.3e-99 CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 512) 1517 352.7 1e-96 CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 ( 517) 1512 351.5 2.3e-96 CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 422) 1452 338.0 2.3e-92 CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 ( 470) 1271 297.0 5.2e-80 CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 ( 518) 1140 267.4 4.7e-71 CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 487) 1071 251.8 2.2e-66 CCDS4555.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 535) 987 232.9 1.3e-60 CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 405) 969 228.8 1.6e-59 CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 480) 868 205.9 1.4e-52 CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 539) 706 169.3 1.7e-41 CCDS55057.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 437) 669 160.9 4.6e-39 CCDS5172.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 433) 640 154.4 4.2e-37 CCDS4556.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 548) 641 154.6 4.5e-37 CCDS9826.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 535) 625 151.0 5.4e-36 CCDS61501.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 522) 499 122.5 2e-27 CCDS11212.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 453) 440 109.2 1.8e-23 CCDS53272.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 503) 438 108.7 2.7e-23 CCDS188.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 563) 438 108.8 3e-23 CCDS82090.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 380) 410 102.4 1.7e-21 CCDS11210.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 485) 405 101.3 4.6e-21 CCDS32589.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 508) 405 101.3 4.8e-21 CCDS12766.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 802) 362 91.6 6.2e-18 CCDS56380.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 475) 344 87.5 6.4e-17 CCDS81273.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 512) 328 83.9 8.4e-16 CCDS73335.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 468) 324 83.0 1.5e-15 CCDS73336.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 431) 303 78.2 3.6e-14 CCDS31622.1 ALDH3B2 gene_id:222|Hs108|chr11 ( 385) 293 75.9 1.6e-13 CCDS46141.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 751) 271 71.0 9.1e-12 >>CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 (902 aa) initn: 5987 init1: 5987 opt: 5987 Z-score: 7307.1 bits: 1363.3 E(32554): 0 Smith-Waterman score: 5987; 99.9% identity (99.9% similar) in 902 aa overlap (1-902:1-902) 10 20 30 40 50 60 pF1KB4 MKIAVIGQSLFGQEVYCHLRKEGHEVVGVFTVPDKDGKADPLGLEAEKDGVPVFKYSRWR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 MKIAVIGQSLFGQEVYCHLRKEGHEVVGVFTVPDKDGKADPLGLEAEKDGVPVFKYSRWR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 AKGQALPDVVAKYQALGAELNVLPFCSQFIPMEIISAPRHGSIIYHPSLLPRHRGASAIN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 AKGQALPDVVAKYQALGAELNVLPFCSQFIPMEIISAPRHGSIIYHPSLLPRHRGASAIN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 WTLIHGDKKGGFSIFWADDGLDTGDLLLQKECEVLPDDTVSTLYNRFLFPEGIKGMVQAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 WTLIHGDKKGGFSIFWADDGLDTGDLLLQKECEVLPDDTVSTLYNRFLFPEGIKGMVQAV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 RLIAEGKAPRLPQPEEGATYEGIQKKETAKINWDQPAEAIHNWIRGNDKVPGAWTEACEQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 RLIAEGKAPRLPQPEEGATYEGIQKKETAKINWDQPAEAIHNWIRGNDKVPGAWTEACEQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 KLTFFNSTLNTSGLVPEGDALPIPGAHRPGVVTKAGLILFGNDDKMLLVKNIQLEDGKMI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 KLTFFNSTLNTSGLVPEGDALPIPGAHRPGVVTKAGLILFGNDDKMLLVKNIQLEDGKMI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 LASNFFKGAASSVLELTEAELVTAEAVRSVWQRILPKVLEVEDSTDFFKSGAASVDVVRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 LASNFFKGAASSVLELTEAELVTAEAVRSVWQRILPKVLEVEDSTDFFKSGAASVDVVRL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB4 VEEVKELCDGLELENEDVYMASTFGDFIQLLVRKLRGDDEEGECSIDYVEMAVNKRTVRM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 VEEVKELCDGLELENEDVYMASTFGDFIQLLVRKLRGDDEEGECSIDYVEMAVNKRTVRM 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB4 PHQLFIGGEFVDAEGAKTSETINPTDGSVICQVSLAQVTDVDKAVAAAKDAFENGRWGKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 PHQLFIGGEFVDAEGAKTSETINPTDGSVICQVSLAQVTDVDKAVAAAKDAFENGRWGKI 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB4 SARDRGRLMYRLADLMEQHQEELATIEALDAGAVYTLALKTHVGMSIQTFRYFAGWCDKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 SARDRGRLMYRLADLMEQHQEELATIEALDAGAVYTLALKTHVGMSIQTFRYFAGWCDKI 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB4 QGSTIPINQARPNRNLTLTRKEPVGVCGIIIPWNYPLMMLSWKTAACLAAGNTVVIKPAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 QGSTIPINQARPNRNLTLTRKEPVGVCGIIIPWNYPLMMLSWKTAACLAAGNTVVIKPAQ 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB4 VTPLTALKFAELTLKAGIPKGVVNVLPGSGSLVGQRLSDHPDVRKIGFTGSTEVGKHIMK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 VTPLTALKFAELTLKAGIPKGVVNVLPGSGSLVGQRLSDHPDVRKIGFTGSTEVGKHIMK 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB4 SCAISNVKKVSLELGGKSPLIIFADCDLNKAVQMGMSSVFFNKGENCIAAGRLFVEDSIH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 SCAISNVKKVSLELGGKSPLIIFADCDLNKAVQMGMSSVFFNKGENCIAAGRLFVEDSIH 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB4 DEFVRRVVEEVRKMKVGNPLDRDTDHGPQNHHAHLVKLMEYCQHGVKEGATLVCGGNQVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 DEFVRRVVEEVRKMKVGNPLDRDTDHGPQNHHAHLVKLMEYCQHGVKEGATLVCGGNQVP 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB4 RPGFFFEPTVFTGVEDHMFIAKEESFGPVMIISRFADGDLDAVLSRANATEFGLASGVFT :::::::::::: ::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 RPGFFFEPTVFTDVEDHMFIAKEESFGPVMIISRFADGDLDAVLSRANATEFGLASGVFT 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB4 RDINKALYVSDKLQAGTVFVNTYNKTDVAAPFGGFKQSGFGKDLGEAALNEYLRVKTVTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 RDINKALYVSDKLQAGTVFVNTYNKTDVAAPFGGFKQSGFGKDLGEAALNEYLRVKTVTF 850 860 870 880 890 900 pF1KB4 EY :: CCDS30 EY >>CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 (912 aa) initn: 5987 init1: 5987 opt: 5987 Z-score: 7307.0 bits: 1363.3 E(32554): 0 Smith-Waterman score: 5987; 99.9% identity (99.9% similar) in 902 aa overlap (1-902:11-912) 10 20 30 40 50 pF1KB4 MKIAVIGQSLFGQEVYCHLRKEGHEVVGVFTVPDKDGKADPLGLEAEKDG :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 MAGPSNPPATMKIAVIGQSLFGQEVYCHLRKEGHEVVGVFTVPDKDGKADPLGLEAEKDG 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB4 VPVFKYSRWRAKGQALPDVVAKYQALGAELNVLPFCSQFIPMEIISAPRHGSIIYHPSLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 VPVFKYSRWRAKGQALPDVVAKYQALGAELNVLPFCSQFIPMEIISAPRHGSIIYHPSLL 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB4 PRHRGASAINWTLIHGDKKGGFSIFWADDGLDTGDLLLQKECEVLPDDTVSTLYNRFLFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 PRHRGASAINWTLIHGDKKGGFSIFWADDGLDTGDLLLQKECEVLPDDTVSTLYNRFLFP 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB4 EGIKGMVQAVRLIAEGKAPRLPQPEEGATYEGIQKKETAKINWDQPAEAIHNWIRGNDKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 EGIKGMVQAVRLIAEGKAPRLPQPEEGATYEGIQKKETAKINWDQPAEAIHNWIRGNDKV 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB4 PGAWTEACEQKLTFFNSTLNTSGLVPEGDALPIPGAHRPGVVTKAGLILFGNDDKMLLVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 PGAWTEACEQKLTFFNSTLNTSGLVPEGDALPIPGAHRPGVVTKAGLILFGNDDKMLLVK 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB4 NIQLEDGKMILASNFFKGAASSVLELTEAELVTAEAVRSVWQRILPKVLEVEDSTDFFKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 NIQLEDGKMILASNFFKGAASSVLELTEAELVTAEAVRSVWQRILPKVLEVEDSTDFFKS 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB4 GAASVDVVRLVEEVKELCDGLELENEDVYMASTFGDFIQLLVRKLRGDDEEGECSIDYVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GAASVDVVRLVEEVKELCDGLELENEDVYMASTFGDFIQLLVRKLRGDDEEGECSIDYVE 370 380 390 400 410 420 420 430 440 450 460 470 pF1KB4 MAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQVSLAQVTDVDKAVAAAKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 MAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQVSLAQVTDVDKAVAAAKD 430 440 450 460 470 480 480 490 500 510 520 530 pF1KB4 AFENGRWGKISARDRGRLMYRLADLMEQHQEELATIEALDAGAVYTLALKTHVGMSIQTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 AFENGRWGKISARDRGRLMYRLADLMEQHQEELATIEALDAGAVYTLALKTHVGMSIQTF 490 500 510 520 530 540 540 550 560 570 580 590 pF1KB4 RYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIIIPWNYPLMMLSWKTAACLAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 RYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIIIPWNYPLMMLSWKTAACLAA 550 560 570 580 590 600 600 610 620 630 640 650 pF1KB4 GNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLPGSGSLVGQRLSDHPDVRKIGFTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLPGSGSLVGQRLSDHPDVRKIGFTG 610 620 630 640 650 660 660 670 680 690 700 710 pF1KB4 STEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKAVQMGMSSVFFNKGENCIAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 STEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKAVQMGMSSVFFNKGENCIAA 670 680 690 700 710 720 720 730 740 750 760 770 pF1KB4 GRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNHHAHLVKLMEYCQHGVKEGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNHHAHLVKLMEYCQHGVKEGA 730 740 750 760 770 780 780 790 800 810 820 830 pF1KB4 TLVCGGNQVPRPGFFFEPTVFTGVEDHMFIAKEESFGPVMIISRFADGDLDAVLSRANAT :::::::::::::::::::::: ::::::::::::::::::::::::::::::::::::: CCDS58 TLVCGGNQVPRPGFFFEPTVFTDVEDHMFIAKEESFGPVMIISRFADGDLDAVLSRANAT 790 800 810 820 830 840 840 850 860 870 880 890 pF1KB4 EFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTDVAAPFGGFKQSGFGKDLGEAALN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 EFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTDVAAPFGGFKQSGFGKDLGEAALN 850 860 870 880 890 900 900 pF1KB4 EYLRVKTVTFEY :::::::::::: CCDS58 EYLRVKTVTFEY 910 >>CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 (923 aa) initn: 3322 init1: 3322 opt: 4673 Z-score: 5701.5 bits: 1066.2 E(32554): 0 Smith-Waterman score: 4673; 74.1% identity (92.5% similar) in 902 aa overlap (1-902:23-923) 10 20 30 pF1KB4 MKIAVIGQSLFGQEVYCHLRKEGHEVVGVFTVPDKDGK .:.:.::::::::::: :::::::.::::::::::::: CCDS31 MLRRGSQALRRFSTGRVYFKNKLKLALIGQSLFGQEVYSHLRKEGHRVVGVFTVPDKDGK 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB4 ADPLGLEAEKDGVPVFKYSRWRAKGQALPDVVAKYQALGAELNVLPFCSQFIPMEIISAP ::::.: :::::.:::: .::.::... .:. :...::::::::::.:::::.::..: CCDS31 ADPLALAAEKDGTPVFKLPKWRVKGKTIKEVAEAYRSVGAELNVLPFCTQFIPMDIIDSP 70 80 90 100 110 120 100 110 120 130 140 150 pF1KB4 RHGSIIYHPSLLPRHRGASAINWTLIHGDKKGGFSIFWADDGLDTGDLLLQKECEVLPDD .:::::::::.::::::::::::::: ::::.:::.:::::::::: .:::. :.: :.: CCDS31 KHGSIIYHPSILPRHRGASAINWTLIMGDKKAGFSVFWADDGLDTGPILLQRSCDVEPND 130 140 150 160 170 180 160 170 180 190 200 210 pF1KB4 TVSTLYNRFLFPEGIKGMVQAVRLIAEGKAPRLPQPEEGATYEGIQKKETAKINWDQPAE ::..::::::::::::.::.::.:::.:::::.::::::::::::::::.:.:.::: :: CCDS31 TVDALYNRFLFPEGIKAMVEAVQLIADGKAPRIPQPEEGATYEGIQKKENAEISWDQSAE 190 200 210 220 230 240 220 230 240 250 260 270 pF1KB4 AIHNWIRGNDKVPGAWTEACEQKLTFFNSTLNTSGLVPEGDALPIPGAHRPGVVTKAGLI ..::::::.::::::::: : .::..::: .:. :: :. : : ::..::.::: ::. CCDS31 VLHNWIRGHDKVPGAWTEINGQMVTFYGSTLLNSS-VPPGEPLEIKGAKKPGLVTKNGLV 250 260 270 280 290 280 290 300 310 320 330 pF1KB4 LFGNDDKMLLVKNIQLEDGKMILASNFFKGAASSVLELTEAELVTAEAVRSVWQRILPKV ::::: : : :.:.:.:::::: ::..:. . .::.::: :. .::... .: :: .: CCDS31 LFGNDGKALTVRNLQFEDGKMIPASQYFSTGETSVVELTAEEVKVAETIKVIWAGILSNV 300 310 320 330 340 350 340 350 360 370 380 390 pF1KB4 LEVEDSTDFFKSGAASVDVVRLVEEVKELCDGLELENEDVYMASTFGDFIQLLVRKLRGD .:::::::::::.:.::.:::::... : ::.:.:::::::. : ::: .::::::. CCDS31 PIIEDSTDFFKSGASSMDVARLVEEIRQKCGGLQLQNEDVYMATKFEGFIQKVVRKLRGE 360 370 380 390 400 410 400 410 420 430 440 450 pF1KB4 DEEGECSIDYVEMAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQVSLAQV :.: : .::. ::. :.::.: ::.:.:.::. .:: .::::::::.::.:: :.. CCDS31 DQEVELVVDYISKEVNEIMVKMPYQCFINGQFTDADDGKTYDTINPTDGSTICKVSYASL 420 430 440 450 460 470 460 470 480 490 500 510 pF1KB4 TDVDKAVAAAKDAFENGRWGKISARDRGRLMYRLADLMEQHQEELATIEALDAGAVYTLA .::::::::::::::::.::...::.:::::::::::.:..:::::::::::.::::::: CCDS31 ADVDKAVAAAKDAFENGEWGRMNARERGRLMYRLADLLEENQEELATIEALDSGAVYTLA 480 490 500 510 520 530 520 530 540 550 560 570 pF1KB4 LKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIIIPWNYPLM ::::.:::.::::::::::::::::::::::::::::::.:.:::.:::.:::::::::: CCDS31 LKTHIGMSVQTFRYFAGWCDKIQGSTIPINQARPNRNLTFTKKEPLGVCAIIIPWNYPLM 540 550 560 570 580 590 580 590 600 610 620 630 pF1KB4 MLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLPGSGSLVGQRLS ::.::.:::::::::.:.::::::::::::::::..:::.::::.:..::::...::::: CCDS31 MLAWKSAACLAAGNTLVLKPAQVTPLTALKFAELSVKAGFPKGVINIIPGSGGIAGQRLS 600 610 620 630 640 650 640 650 660 670 680 690 pF1KB4 DHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKAVQMGMSS .:::.::.:::::: .::.::::::.::.:::::::::::::::: ::.:.:::.:::.. CCDS31 EHPDIRKLGFTGSTPIGKQIMKSCAVSNLKKVSLELGGKSPLIIFNDCELDKAVRMGMGA 660 670 680 690 700 710 700 710 720 730 740 750 pF1KB4 VFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNHHAHLVKL ::::::::::::::::::.::::::: :::::..:::.:.::::.::::::::.::: :: CCDS31 VFFNKGENCIAAGRLFVEESIHDEFVTRVVEEIKKMKIGDPLDRSTDHGPQNHKAHLEKL 720 730 740 750 760 770 760 770 780 790 800 810 pF1KB4 MEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTGVEDHMFIAKEESFGPVMIISRFADG ..::. ::::::::: :: :: :::::.:::::: :::.:..::::::::.:.::.: .: CCDS31 LQYCETGVKEGATLVYGGRQVQRPGFFMEPTVFTDVEDYMYLAKEESFGPIMVISKFQNG 780 790 800 810 820 830 820 830 840 850 860 870 pF1KB4 DLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTDVAAPFGGFKQS :.:.::.:::.::.::::::::::::::.:::.::.:::::.:::::::::::::: ::: CCDS31 DIDGVLQRANSTEYGLASGVFTRDINKAMYVSEKLEAGTVFINTYNKTDVAAPFGGVKQS 840 850 860 870 880 890 880 890 900 pF1KB4 GFGKDLGEAALNEYLRVKTVTFEY :::::::: ::::::..::::.:: CCDS31 GFGKDLGEEALNEYLKTKTVTLEY 900 910 920 >>CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 (801 aa) initn: 4501 init1: 4501 opt: 4501 Z-score: 5492.4 bits: 1027.3 E(32554): 0 Smith-Waterman score: 5084; 88.7% identity (88.7% similar) in 902 aa overlap (1-902:1-801) 10 20 30 40 50 60 pF1KB4 MKIAVIGQSLFGQEVYCHLRKEGHEVVGVFTVPDKDGKADPLGLEAEKDGVPVFKYSRWR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 MKIAVIGQSLFGQEVYCHLRKEGHEVVGVFTVPDKDGKADPLGLEAEKDGVPVFKYSRWR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 AKGQALPDVVAKYQALGAELNVLPFCSQFIPMEIISAPRHGSIIYHPSLLPRHRGASAIN ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 AKGQALPDVVAKYQALGAELNVLPFCSQFIPMEIISAPRHGSIIYHPSLLPRHRGASAI- 70 80 90 100 110 130 140 150 160 170 180 pF1KB4 WTLIHGDKKGGFSIFWADDGLDTGDLLLQKECEVLPDDTVSTLYNRFLFPEGIKGMVQAV CCDS58 ------------------------------------------------------------ 190 200 210 220 230 240 pF1KB4 RLIAEGKAPRLPQPEEGATYEGIQKKETAKINWDQPAEAIHNWIRGNDKVPGAWTEACEQ :::::::::::::::::::: CCDS58 ----------------------------------------HNWIRGNDKVPGAWTEACEQ 120 130 250 260 270 280 290 300 pF1KB4 KLTFFNSTLNTSGLVPEGDALPIPGAHRPGVVTKAGLILFGNDDKMLLVKNIQLEDGKMI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 KLTFFNSTLNTSGLVPEGDALPIPGAHRPGVVTKAGLILFGNDDKMLLVKNIQLEDGKMI 140 150 160 170 180 190 310 320 330 340 350 360 pF1KB4 LASNFFKGAASSVLELTEAELVTAEAVRSVWQRILPKVLEVEDSTDFFKSGAASVDVVRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 LASNFFKGAASSVLELTEAELVTAEAVRSVWQRILPKVLEVEDSTDFFKSGAASVDVVRL 200 210 220 230 240 250 370 380 390 400 410 420 pF1KB4 VEEVKELCDGLELENEDVYMASTFGDFIQLLVRKLRGDDEEGECSIDYVEMAVNKRTVRM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 VEEVKELCDGLELENEDVYMASTFGDFIQLLVRKLRGDDEEGECSIDYVEMAVNKRTVRM 260 270 280 290 300 310 430 440 450 460 470 480 pF1KB4 PHQLFIGGEFVDAEGAKTSETINPTDGSVICQVSLAQVTDVDKAVAAAKDAFENGRWGKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 PHQLFIGGEFVDAEGAKTSETINPTDGSVICQVSLAQVTDVDKAVAAAKDAFENGRWGKI 320 330 340 350 360 370 490 500 510 520 530 540 pF1KB4 SARDRGRLMYRLADLMEQHQEELATIEALDAGAVYTLALKTHVGMSIQTFRYFAGWCDKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SARDRGRLMYRLADLMEQHQEELATIEALDAGAVYTLALKTHVGMSIQTFRYFAGWCDKI 380 390 400 410 420 430 550 560 570 580 590 600 pF1KB4 QGSTIPINQARPNRNLTLTRKEPVGVCGIIIPWNYPLMMLSWKTAACLAAGNTVVIKPAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 QGSTIPINQARPNRNLTLTRKEPVGVCGIIIPWNYPLMMLSWKTAACLAAGNTVVIKPAQ 440 450 460 470 480 490 610 620 630 640 650 660 pF1KB4 VTPLTALKFAELTLKAGIPKGVVNVLPGSGSLVGQRLSDHPDVRKIGFTGSTEVGKHIMK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 VTPLTALKFAELTLKAGIPKGVVNVLPGSGSLVGQRLSDHPDVRKIGFTGSTEVGKHIMK 500 510 520 530 540 550 670 680 690 700 710 720 pF1KB4 SCAISNVKKVSLELGGKSPLIIFADCDLNKAVQMGMSSVFFNKGENCIAAGRLFVEDSIH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SCAISNVKKVSLELGGKSPLIIFADCDLNKAVQMGMSSVFFNKGENCIAAGRLFVEDSIH 560 570 580 590 600 610 730 740 750 760 770 780 pF1KB4 DEFVRRVVEEVRKMKVGNPLDRDTDHGPQNHHAHLVKLMEYCQHGVKEGATLVCGGNQVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 DEFVRRVVEEVRKMKVGNPLDRDTDHGPQNHHAHLVKLMEYCQHGVKEGATLVCGGNQVP 620 630 640 650 660 670 790 800 810 820 830 840 pF1KB4 RPGFFFEPTVFTGVEDHMFIAKEESFGPVMIISRFADGDLDAVLSRANATEFGLASGVFT :::::::::::: ::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 RPGFFFEPTVFTDVEDHMFIAKEESFGPVMIISRFADGDLDAVLSRANATEFGLASGVFT 680 690 700 710 720 730 850 860 870 880 890 900 pF1KB4 RDINKALYVSDKLQAGTVFVNTYNKTDVAAPFGGFKQSGFGKDLGEAALNEYLRVKTVTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 RDINKALYVSDKLQAGTVFVNTYNKTDVAAPFGGFKQSGFGKDLGEAALNEYLRVKTVTF 740 750 760 770 780 790 pF1KB4 EY :: CCDS58 EY 800 >>CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 (518 aa) initn: 1304 init1: 973 opt: 1585 Z-score: 1932.8 bits: 368.0 E(32554): 2.5e-101 Smith-Waterman score: 1585; 51.0% identity (77.0% similar) in 478 aa overlap (423-899:39-510) 400 410 420 430 440 450 pF1KB4 RKLRGDDEEGECSIDYVEMAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQ ..::..:. ..:.... . ::. : .:. CCDS10 PGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNPATGEQVCE 10 20 30 40 50 60 460 470 480 490 500 510 pF1KB4 VSLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQEELATIEALDA :. :. .:.:::: ::. :: : : ...: .::::. .::::.:. . :::.:.:.. CCDS10 VQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATMESLNG 70 80 90 100 110 120 520 530 540 550 560 570 pF1KB4 GAVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIII : . :. . . :.::::.::: :::.: :::.. . .:.::.::.:::: :: CCDS10 GKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVD----GDYFTFTRHEPIGVCGQII 130 140 150 160 170 180 580 590 600 610 620 630 pF1KB4 PWNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLPGSGS :::.::.:..:: : : :::::::::. :::.:: .. : .::.: ::.:.::: : CCDS10 PWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGP 190 200 210 220 230 240 640 650 660 670 680 690 pF1KB4 LVGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKA .: ...: . ::.::::::::: :... . ::.:.:.:::::::: ::::: ::. : CCDS10 TAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYA 250 260 270 280 290 300 700 710 720 730 740 750 pF1KB4 VQMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNH :... ..::::.:. : :..:.:::.::..::::: ::.... ::.:.: :..::: CCDS10 VEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQID 310 320 330 340 350 360 760 770 780 790 800 810 pF1KB4 HAHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTGVEDHMFIAKEESFGPVMI . . :..: : :: ::: : :::. . : :::.:::::..: : : ::::: ::::. CCDS10 KKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQE 370 380 390 400 410 420 820 830 840 850 860 870 pF1KB4 ISRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTDVAAP : :: .: :. ::: ..:::...::: :::::: ::. .:::::..: :: .. .: CCDS10 ILRFK--TMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSP 430 440 450 460 470 480 880 890 900 pF1KB4 FGGFKQSGFGKDLGEAALNEYLRVKTVTFEY :::::.:: :...:: .: :: .::::: CCDS10 FGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS 490 500 510 >>CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 (497 aa) initn: 1302 init1: 973 opt: 1583 Z-score: 1930.6 bits: 367.6 E(32554): 3.2e-101 Smith-Waterman score: 1583; 51.2% identity (76.9% similar) in 477 aa overlap (424-899:19-489) 400 410 420 430 440 450 pF1KB4 KLRGDDEEGECSIDYVEMAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQV .::..:. ..:.... . ::. : .:.: CCDS55 MKNQCETVWLKSPIKLKLIFINNEWQNSESGRVFPVYNPATGEQVCEV 10 20 30 40 460 470 480 490 500 510 pF1KB4 SLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQEELATIEALDAG . :. .:.:::: ::. :: : : ...: .::::. .::::.:. . :::.:.:..: CCDS55 QEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATMESLNGG 50 60 70 80 90 100 520 530 540 550 560 570 pF1KB4 AVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIIIP . :. . . :.::::.::: :::.: :::.. . .:.::.::.:::: ::: CCDS55 KPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVD----GDYFTFTRHEPIGVCGQIIP 110 120 130 140 150 160 580 590 600 610 620 630 pF1KB4 WNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLPGSGSL ::.::.:..:: : : :::::::::. :::.:: .. : .::.: ::.:.::: : CCDS55 WNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGPT 170 180 190 200 210 220 640 650 660 670 680 690 pF1KB4 VGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKAV .: ...: . ::.::::::::: :... . ::.:.:.:::::::: ::::: ::. :: CCDS55 AGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAV 230 240 250 260 270 280 700 710 720 730 740 750 pF1KB4 QMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNHH ... ..::::.:. : :..:.:::.::..::::: ::.... ::.:.: :..::: . CCDS55 EQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQIDK 290 300 310 320 330 340 760 770 780 790 800 810 pF1KB4 AHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTGVEDHMFIAKEESFGPVMII . :..: : :: ::: : :::. . : :::.:::::..: : : ::::: ::::. : CCDS55 KQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEI 350 360 370 380 390 400 820 830 840 850 860 870 pF1KB4 SRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTDVAAPF :: .: :. ::: ..:::...::: :::::: ::. .:::::..: :: .. .:: CCDS55 LRFK--TMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPF 410 420 430 440 450 460 880 890 900 pF1KB4 GGFKQSGFGKDLGEAALNEYLRVKTVTFEY ::::.:: :...:: .: :: .::::: CCDS55 GGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS 470 480 490 >>CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 (501 aa) initn: 1304 init1: 946 opt: 1553 Z-score: 1893.9 bits: 360.8 E(32554): 3.6e-99 Smith-Waterman score: 1553; 50.6% identity (76.8% similar) in 478 aa overlap (423-899:22-493) 400 410 420 430 440 450 pF1KB4 RKLRGDDEEGECSIDYVEMAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQ ..::..:. :. ..: ..::. .:: CCDS66 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPATEEELCQ 10 20 30 40 50 460 470 480 490 500 510 pF1KB4 VSLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQEELATIEALDA : .. :::::: ::..::. : : ..: .::::.:.::::.:. . :::.:.... CCDS66 VEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATMESMNG 60 70 80 90 100 110 520 530 540 550 560 570 pF1KB4 GAVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIII : .:. : . .. :.:.:: ::: ::::: ::::. . .: ::.::.:::: :: CCDS66 GKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPID----GNFFTYTRHEPIGVCGQII 120 130 140 150 160 580 590 600 610 620 630 pF1KB4 PWNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLPGSGS :::.::.:: :: . :. :::::.:::. ::::::. : : .::.: ::::..:: : CCDS66 PWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYGP 170 180 190 200 210 220 640 650 660 670 680 690 pF1KB4 LVGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKA .: .:.: :. :..::::::::: : .. . ::.:.:.:::::::: :..:: ::..: CCDS66 TAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDNA 230 240 250 260 270 280 700 710 720 730 740 750 pF1KB4 VQMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNH :... .::...:. ::::.:.:::.::.:::::: ::...:. .:::: . .::: CCDS66 VEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQID 290 300 310 320 330 340 760 770 780 790 800 810 pF1KB4 HAHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTGVEDHMFIAKEESFGPVMI . . :... . : :::: : :::. :.: .::::..: :.: ::::: ::::. CCDS66 KEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGPVQQ 350 360 370 380 390 400 820 830 840 850 860 870 pF1KB4 ISRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTDVAAP : .: .:: :..::: : .::..::::.::.::. .:. ::::::.:: :. ... : CCDS66 IMKFK--SLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQCP 410 420 430 440 450 460 880 890 900 pF1KB4 FGGFKQSGFGKDLGEAALNEYLRVKTVTFEY :::::.:: :..::: ...:: .::::: CCDS66 FGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS 470 480 490 500 >>CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 (517 aa) initn: 1544 init1: 920 opt: 1552 Z-score: 1892.5 bits: 360.6 E(32554): 4.3e-99 Smith-Waterman score: 1552; 50.0% identity (77.5% similar) in 484 aa overlap (420-901:34-511) 390 400 410 420 430 440 pF1KB4 LLVRKLRGDDEEGECSIDYVEMAVNKRTVRMPH-QLFIGGEFVDAEGAKTSETINPTDGS .:. ::::..:. :: . :: :.::: : CCDS66 FLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNPTTGE 10 20 30 40 50 60 450 460 470 480 490 500 pF1KB4 VICQVSLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQEELATIE :: .:. .. .:::.:: ::..::. : : ...: .::::. :::::.:. . ::..: CCDS66 VIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNRLADLVERDRVYLASLE 70 80 90 100 110 120 510 520 530 540 550 560 pF1KB4 ALDAGAVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVC .:: : . . . :...:::::: :: .:.:::.. .... .::.:::::: CCDS66 TLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMD----GQHFCFTRHEPVGVC 130 140 150 160 170 570 580 590 600 610 620 pF1KB4 GIIIPWNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLP : :::::.::.: .:: : ::.:::::.: :. :::.:: .: : .::.: ::::.. CCDS66 GQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIIT 180 190 200 210 220 230 630 640 650 660 670 680 pF1KB4 GSGSLVGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCD : : .: ...: :: :..::::::::. :.:. . ::.:.:.:::::::: :..:: : CCDS66 GYGPTAGAAIAQHVDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADAD 240 250 260 270 280 290 690 700 710 720 730 740 pF1KB4 LNKAVQMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHG ...::.. ..::: :. : :..: :::.::..::..:.::.... :::::.. ::..: CCDS66 MEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQG 300 310 320 330 340 350 750 760 770 780 790 800 pF1KB4 PQNHHAHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTGVEDHMFIAKEESFG :: . .. ... : : : :::: :.:::.. . :::..:::: ::.: : ::::: :: CCDS66 PQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFG 360 370 380 390 400 410 810 820 830 840 850 860 pF1KB4 PVMIISRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTD ::. . .: .. :. ::: :..:::..:::::..::.: .. ::::::.::::: . CCDS66 PVQPLFKFKK--IEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVT 420 430 440 450 460 470 870 880 890 900 pF1KB4 VAAPFGGFKQSGFGKDLGEAALNEYLRVKTVTFEY .::::::.:: :..::: .:. : .:::::.. CCDS66 CHTPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS 480 490 500 510 >>CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 (512 aa) initn: 1508 init1: 933 opt: 1517 Z-score: 1849.8 bits: 352.7 E(32554): 1e-96 Smith-Waterman score: 1517; 48.5% identity (76.0% similar) in 480 aa overlap (423-901:33-506) 400 410 420 430 440 450 pF1KB4 RKLRGDDEEGECSIDYVEMAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQ ..::..:. .....: : ::. ::. CCDS10 TANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPSTREQICE 10 20 30 40 50 60 460 470 480 490 500 510 pF1KB4 VSLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQEELATIEALDA : .. :::::: ::. ::. : : ...: .::::...::::.:. . ::..:..:. CCDS10 VEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLAALETMDT 70 80 90 100 110 120 520 530 540 550 560 570 pF1KB4 GAVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIII : . :. . :.:.:::::: :::::.::: . . . .::.::.:::: : CCDS10 GKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTD----DNVVCFTRHEPIGVCGAIT 130 140 150 160 170 580 590 600 610 620 630 pF1KB4 PWNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLPGSGS :::.::.:: :: : : :::.:.:::. :::::: .. : .::.: ::::..:: : CCDS10 PWNFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPGFGP 180 190 200 210 220 230 640 650 660 670 680 690 pF1KB4 LVGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKA :: .:.::.. ::.::::::::: . .. . ::.:.:.::::::.: :. :: ::. : CCDS10 TVGAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADLDLA 240 250 260 270 280 290 700 710 720 730 740 750 pF1KB4 VQMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNH :. . ..::::.:. : ::.:.:::.....::::: :: ..: ::.:.: :..::: CCDS10 VECAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGPQID 300 310 320 330 340 350 760 770 780 790 800 810 pF1KB4 HAHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTGVEDHMFIAKEESFGPVMI . .. :..: . : :::: : :::. . :.:..::::. : :.: ::::: ::::. CCDS10 QKQFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGPVQP 360 370 380 390 400 410 820 830 840 850 860 870 pF1KB4 ISRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTDVAAP : .: ... :..:::.:..::...:::....::: ... :..:::..: :: . :: CCDS10 ILKFK--SIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQAP 420 430 440 450 460 470 880 890 900 pF1KB4 FGGFKQSGFGKDLGEAALNEYLRVKTVTFEY :::::.:: :..::: :: :: .:::::.. CCDS10 FGGFKMSGNGRELGEYALAEYTEVKTVTIKLGDKNP 480 490 500 510 >>CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 (517 aa) initn: 1512 init1: 890 opt: 1512 Z-score: 1843.6 bits: 351.5 E(32554): 2.3e-96 Smith-Waterman score: 1512; 48.3% identity (75.7% similar) in 489 aa overlap (412-899:27-509) 390 400 410 420 430 440 pF1KB4 STFGDFIQLLVRKLRGDDEEGECSIDYVEMAVNKRTVRMPHQLFIGGEFVDAEGAKTSET : :.. . .:.::..:. :: . :: : CCDS91 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPT 10 20 30 40 50 450 460 470 480 490 500 pF1KB4 INPTDGSVICQVSLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQ .::. : :::::. .. :::::: ::. ::. : : ...: ::::. :::::.:. . CCDS91 VNPSTGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDR 60 70 80 90 100 110 510 520 530 540 550 560 pF1KB4 EELATIEALDAGAVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTR ::..:.:: : :... . . : .. .::.::: :: .:.::::. . .. :: CCDS91 TYLAALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPID----GDFFSYTR 120 130 140 150 160 170 570 580 590 600 610 620 pF1KB4 KEPVGVCGIIIPWNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPK .::::::: :::::.::.: .:: . ::.::.::.: :. :::::: :.: .::.: CCDS91 HEPVGVCGQIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPP 180 190 200 210 220 230 630 640 650 660 670 680 pF1KB4 GVVNVLPGSGSLVGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPL ::::..:: : .: ...: :: :..::::::.:. :. . . ::.:.:.:::::::: CCDS91 GVVNIVPGFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPN 240 250 260 270 280 290 690 700 710 720 730 740 pF1KB4 IIFADCDLNKAVQMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPL ::..: :.. ::... ..:::.:. : :..: ::...:.::::.: : .... ::::. CCDS91 IIMSDADMDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPF 300 310 320 330 340 350 750 760 770 780 790 800 pF1KB4 DRDTDHGPQNHHAHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTGVEDHMFI : :..::: .... :.. : . : .::: :.:::. . :.:..:::: :.: : : CCDS91 DSKTEQGPQVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTI 360 370 380 390 400 410 810 820 830 840 850 860 pF1KB4 AKEESFGPVMIISRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFV :::: ::::: : .: .. :..::: . .:::..:::.:..:: :.:. ::::::.: CCDS91 AKEEIFGPVMQILKFK--TIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWV 420 430 440 450 460 470 870 880 890 900 pF1KB4 NTYNKTDVAAPFGGFKQSGFGKDLGEAALNEYLRVKTVTFEY : :. . .::::.:.:: :..::: .:. : .::::: CCDS91 NCYDVFGAQSPFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS 480 490 500 510 902 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 04:39:36 2016 done: Mon Nov 7 04:39:37 2016 Total Scan time: 3.680 Total Display time: 0.260 Function used was FASTA [36.3.4 Apr, 2011]