FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6402, 535 aa 1>>>pF1KE6402 535 - 535 aa - 535 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7216+/-0.00109; mu= 15.7326+/- 0.065 mean_var=64.3187+/-13.059, 0's: 0 Z-trim(103.0): 41 B-trim: 448 in 2/45 Lambda= 0.159921 statistics sampled from 7171 (7211) to 7171 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.583), E-opt: 0.2 (0.222), width: 16 Scan time: 2.560 The best scores are: opt bits E(32554) CCDS9826.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 535) 3520 821.3 0 CCDS61501.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 522) 2791 653.1 2.2e-187 CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 ( 518) 800 193.8 4.2e-49 CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 487) 780 189.2 9.7e-48 CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 ( 501) 775 188.0 2.2e-47 CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 512) 768 186.4 6.9e-47 CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 ( 517) 763 185.2 1.5e-46 CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 518) 758 184.1 3.5e-46 CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 497) 752 182.7 8.7e-46 CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 ( 517) 716 174.4 2.8e-43 CCDS4555.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 535) 705 171.9 1.7e-42 CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 ( 923) 679 165.9 1.8e-40 CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 422) 649 158.9 1.1e-38 CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 801) 627 153.9 6.5e-37 CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 902) 627 153.9 7.2e-37 CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 912) 627 153.9 7.3e-37 CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 ( 470) 610 149.9 6e-36 CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 539) 558 138.0 2.8e-32 CCDS5172.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 433) 550 136.1 8.2e-32 CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 405) 439 110.5 3.9e-24 CCDS56380.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 475) 406 102.9 8.9e-22 CCDS53272.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 503) 342 88.1 2.6e-17 CCDS188.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 563) 342 88.1 2.9e-17 CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 480) 323 83.7 5.2e-16 CCDS4556.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 548) 287 75.4 1.9e-13 CCDS55057.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 437) 256 68.3 2.2e-11 CCDS81273.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 512) 248 66.4 9e-11 >>CCDS9826.1 ALDH6A1 gene_id:4329|Hs108|chr14 (535 aa) initn: 3520 init1: 3520 opt: 3520 Z-score: 4386.4 bits: 821.3 E(32554): 0 Smith-Waterman score: 3520; 100.0% identity (100.0% similar) in 535 aa overlap (1-535:1-535) 10 20 30 40 50 60 pF1KE6 MAALLAAAAVRARILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 MAALLAAAAVRARILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 NPATNEVIGRVPQATKAEMDAAIASCKRAFPAWADTSVLSRQQVLLRYQQLIKENLKEIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 NPATNEVIGRVPQATKAEMDAAIASCKRAFPAWADTSVLSRQQVLLRYQQLIKENLKEIA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 KLITLEQGKTLADAEGDVFRGLQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLGVCA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 KLITLEQGKTLADAEGDVFRGLQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLGVCA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 GIAPFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNIIHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 GIAPFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNIIHG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 QHEAVNFICDHPDIKAISFVGSNKAGEYIFERGSRHGKRVQANMGAKNHGVVMPDANKEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 QHEAVNFICDHPDIKAISFVGSNKAGEYIFERGSRHGKRVQANMGAKNHGVVMPDANKEN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 TLNQLVGAAFGAAGQRCMALSTAVLVGEAKKWLPELVEHAKNLRVNAGDQPGADLGPLIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 TLNQLVGAAFGAAGQRCMALSTAVLVGEAKKWLPELVEHAKNLRVNAGDQPGADLGPLIT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 PQAKERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIISNVKPNMTCYKEEIFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 PQAKERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIISNVKPNMTCYKEEIFG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE6 PVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVNVPIPVPLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 PVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVNVPIPVPLP 430 440 450 460 470 480 490 500 510 520 530 pF1KE6 MFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPTMGR ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 MFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPTMGR 490 500 510 520 530 >>CCDS61501.1 ALDH6A1 gene_id:4329|Hs108|chr14 (522 aa) initn: 2787 init1: 2787 opt: 2791 Z-score: 3477.6 bits: 653.1 E(32554): 2.2e-187 Smith-Waterman score: 3406; 97.6% identity (97.6% similar) in 535 aa overlap (1-535:1-522) 10 20 30 40 50 60 pF1KE6 MAALLAAAAVRARILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 MAALLAAAAVRARILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 NPATNEVIGRVPQATKAEMDAAIASCKRAFPAWADTSVLSRQQVLLRYQQLIKENLKEIA ::::::::::::::::::::::::::::::::::::::::::: :::: CCDS61 NPATNEVIGRVPQATKAEMDAAIASCKRAFPAWADTSVLSRQQ-------------KEIA 70 80 90 100 130 140 150 160 170 180 pF1KE6 KLITLEQGKTLADAEGDVFRGLQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLGVCA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 KLITLEQGKTLADAEGDVFRGLQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLGVCA 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE6 GIAPFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNIIHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 GIAPFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNIIHG 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE6 QHEAVNFICDHPDIKAISFVGSNKAGEYIFERGSRHGKRVQANMGAKNHGVVMPDANKEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 QHEAVNFICDHPDIKAISFVGSNKAGEYIFERGSRHGKRVQANMGAKNHGVVMPDANKEN 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE6 TLNQLVGAAFGAAGQRCMALSTAVLVGEAKKWLPELVEHAKNLRVNAGDQPGADLGPLIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 TLNQLVGAAFGAAGQRCMALSTAVLVGEAKKWLPELVEHAKNLRVNAGDQPGADLGPLIT 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE6 PQAKERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIISNVKPNMTCYKEEIFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 PQAKERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIISNVKPNMTCYKEEIFG 350 360 370 380 390 400 430 440 450 460 470 480 pF1KE6 PVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVNVPIPVPLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 PVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVNVPIPVPLP 410 420 430 440 450 460 490 500 510 520 530 pF1KE6 MFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPTMGR ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 MFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPTMGR 470 480 490 500 510 520 >>CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 (518 aa) initn: 689 init1: 371 opt: 800 Z-score: 995.1 bits: 193.8 E(32554): 4.2e-49 Smith-Waterman score: 800; 30.5% identity (62.1% similar) in 515 aa overlap (10-512:3-507) 10 20 30 40 50 pF1KE6 MAALLAAAAVRARILQVSSKVKS-SPTWYSASSFSSSVPTVKL-FIGGKFVESKSDKWID .:: . .: ..: :. .: : .. : . : . :: :: . . . CCDS12 MFLRAGLAALSPLLRSLRPSPVAAMSTGTFVVSQPLNYRGGARVEPADASGTE 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 -IHNPATNEVIGRVPQATKAEMDAAIASCKRAFPAWADTSVLSRQQVLLRYQQLIKENLK .:::..::. . . :.. :. . : :: :.. : . : ..::. ..:.: CCDS12 KAFEPATGRVIATFTCSGEKEVNLAVQNAKAAFKIWSQKSGMERCRILLEAARIIRERED 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 EIAKLITLEQGKTLADAEGDVFRGLQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLG ::: . ...::.. .:. :. . : .:. .... : :: . .. :. : ::: CCDS12 EIATMECINNGKSIFEARLDIDISWQCLEYYAGLAASMAGEHIQLPGGSFG-YTRREPLG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 VCAGIAPFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNI ::.::. .:.: .: : :..:::....::: .: ...:::.. ...:.: : .:. CCDS12 VCVGIGAWNYPFQIASWKSAPALACGNAMVFKPSPFTPVSALLLAEIYSEAGVPPGLFNV 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 IHGQHEAVNFICDHPDIKAISFVGSNKAGEYIFERGSRHGKRVQANMGAKNHGVVMPDAN ..: . .:.:.:::. .::.:: .: :.: ... : : ..:.:. ... : . CCDS12 VQGGAATGQFLCQHPDVAKVSFTGSVPTGMKIMEMSAKGIKPVTLELGGKSPLIIFSDCD 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 KENTLNQLVGAAFGAAGQRCMALSTAVLVGEA--KKWLPELVEHAKNLRVNAGDQPGAD- .:... . : : . :: : .: :.: . :. :.:.... :.. :: : CCDS12 MNNAVKGALMANFLTQGQVCCN-GTRVFVQKEILDKFTEEVVKQTQ--RIKIGDPLLEDT 300 310 320 330 340 360 370 380 390 400 410 pF1KE6 -LGPLITPQAKERVCNLIDSGTKEGASILLDGRKIKVK---GYENGNFVGPTIISNVKPN .::::. ::: ... . ..::..: : : : ..: .. : ...: . . CCDS12 RMGPLINRPHLERVLGFVKVAKEQGAKVLCGG-DIYVPEDPKLKDGYYMRPCVLTNCRDD 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE6 MTCYKEEIFGPVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVG ::: ::::::::. .: .: :... .:.. .: ....:: . :.. . ...: CCDS12 MTCVKEEIFGPVMSILSFDTEAEVLERANDTTFGLAAGVFTRDIQRAHRVVAELQAGTCF 410 420 430 440 450 460 480 490 500 510 520 pF1KE6 VNVPI--PVPLPMFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAV .: :: :: : : ..: : : :. :..:.::::. CCDS12 INNYNVSPVELP---FGGYKKSGFGREN--GRVTIEYYSQLKTVCVEMGDVESAF 470 480 490 500 510 530 pF1KE6 VMPTMGR >>CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 (487 aa) initn: 651 init1: 203 opt: 780 Z-score: 970.6 bits: 189.2 E(32554): 9.7e-48 Smith-Waterman score: 780; 31.3% identity (64.9% similar) in 479 aa overlap (43-513:13-484) 20 30 40 50 60 70 pF1KE6 RILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIHNPATNEVIGRVP :: :::. .: .:: ..:.:.:: ::: CCDS51 MAGTNALLMLENFIDGKFLPCSS--YIDSYDPSTGEVYCRVP 10 20 30 40 80 90 100 110 120 130 pF1KE6 QATKAEMDAAIASCKRAFPAWADTSVLSRQQVLLRYQQLIKENLKEIAKLITLEQGKTLA .. : :..::. . ..:::.:.. : :..:: . .:....:.:.:. . .:::::: CCDS51 NSGKDEIEAAVKAAREAFPSWSSRSPQERSRVLNQVADLLEQSLEEFAQAESKDQGKTLA 50 60 70 80 90 100 140 150 160 170 180 190 pF1KE6 DAEG-DVFRGLQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLGVCAGIAPFNFPAMI :. :. :..: . : . .: :. : :.:: . :.:.:.: .. CCDS51 LARTMDIPRSVQNFRFFASSSLHHTSECTQMDHLGCMHYTVRAPVGVAGLISPWNLPLYL 110 120 130 140 150 160 200 210 220 230 240 250 pF1KE6 PLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNIIHGQHEAVNF-ICD : . ::. ::: . :::: . .. .: :::. .:.: :..::. : :. . . CCDS51 LTWKIAPAMAAGNTVIAKPSELTSVTAWMLCKLLDKAGVPPGVVNIVFGTGPRVGEALVS 170 180 190 200 210 220 260 270 280 290 300 310 pF1KE6 HPDIKAISFVGSNKAGEYIFERGSRHGKRVQANMGAKNHGVVMPDANKENTLNQLVGAAF ::.. :::.::. ..: : . .. : :... ..:.:: .... ::: .. . : ..: CCDS51 HPEVPLISFTGSQPTAERITQLSAPHCKKLSLELGGKNPAIIFEDANLDECIPATVRSSF 230 240 250 260 270 280 320 330 340 350 360 pF1KE6 GAAGQRCMALSTAVLVGEA--KKWLPELVEHAKNLRVNAGDQPGADLGPLITPQAKERVC . :. :. : ..: .. ...: ..:: ... .:. ..: ...: ::. :.: CCDS51 ANQGEICLCTSR-IFVQKSIYSEFLKRFVEATRKWKVGIPSDPLVSIGALISKAHLEKVR 290 300 310 320 330 370 380 390 400 410 420 pF1KE6 NLIDSGTKEGASIL----LDGRKIKVKGYENGNFVGPTIISNVKPNMTCYKEEIFGPVLV . . . :::.: .: .. ... . : :. ::.:...: . :. ::::::: CCDS51 SYVKRALAEGAQIWCGEGVDKLSLPARN-QAGYFMLPTVITDIKDESCCMTEEIFGPVTC 340 350 360 370 380 390 430 440 450 460 470 480 pF1KE6 VLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVNVPIPVPLPMFSF :. .. .:.:. .:: :: .......: . ... :. .. : : .: . : . : CCDS51 VVPFDSEEEVIERANNVKYGLAATVWSSNVGRVHRVAKKLQSGLVWTNCWLIRELNL-PF 400 410 420 430 440 450 490 500 510 520 530 pF1KE6 TGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPTMGR : .:: : . .:.. .:.:..:::: CCDS51 GGMKSSGIGREG--AKDSYDFFTEIKTITVKH 460 470 480 >>CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 (501 aa) initn: 554 init1: 222 opt: 775 Z-score: 964.1 bits: 188.0 E(32554): 2.2e-47 Smith-Waterman score: 775; 30.4% identity (63.9% similar) in 493 aa overlap (37-521:18-501) 10 20 30 40 50 60 pF1KE6 AAAVRARILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIHNPATNE . .:.::.... .: : : . . ::::.: CCDS66 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPATEE 10 20 30 40 70 80 90 100 110 120 pF1KE6 VIGRVPQATKAEMDAAIASCKRAFPA---WADTSVLSRQQVLLRYQQLIKENLKEIAKLI . .: .. : ..: :. . ..:: : .. : ..: . .::... .: . CCDS66 ELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATME 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE6 TLEQGKTLADAEGDVFRG-LQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLGVCAGI ... :: ..: . . : ...... . .. ..:.:.: : .. :. . :.:::. : CCDS66 SMNGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIP-IDGNFFTYTRHEPIGVCGQI 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE6 APFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNIIHGQH :.::: .. .: . :. :::: ..::.:..: ... .:.:....: : :..::. : CCDS66 IPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYG 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE6 EAVNF-ICDHPDIKAISFVGSNKAGEYIFER-GSRHGKRVQANMGAKNHGVVMPDANKEN ... : .: :: ..:.::...:. : : :. . ::: ..:.:. .:. ::. .: CCDS66 PTAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDN 230 240 250 260 270 280 310 320 330 340 350 pF1KE6 TLNQLVGAAFGAAGQRCMALSTAVLVGEA--KKWLPELVEHAKNLRVNAGDQPGADLGPL ... ..: :: :.: : ..: :. ... . ::.::. .. ::. :: CCDS66 AVEFAHHGVFYHQGQCCIAASR-IFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQ 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE6 ITPQAKERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIISNVKPNMTCYKEEI : . ... .::.:: ::::.. : ::: :: ::..::: .: :::: CCDS66 IDKEQYDKILDLIESGKKEGAKLECGGGPWGNKGY----FVQPTVFSNVTDEMRIAKEEI 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE6 FGPVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVNVPIPVP :::: ... ..::..:. .::. :: ....:: . : . ...: : :: : CCDS66 FGPVQQIMKFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNC-YGVV 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE6 LPMFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPTMGR . : : . : :. :. :.. ::..::.: . ..... CCDS66 SAQCPFGGFKMS--GNGRELGEYGFHEYTEVKTVTVKISQKNS 470 480 490 500 >>CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 (512 aa) initn: 654 init1: 215 opt: 768 Z-score: 955.2 bits: 186.4 E(32554): 6.9e-47 Smith-Waterman score: 768; 31.8% identity (63.9% similar) in 485 aa overlap (37-513:29-504) 10 20 30 40 50 60 pF1KE6 AAAVRARILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIHNPATNE : .:.::.... :::: : . ::.: : CCDS10 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPSTRE 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 VIGRVPQATKAEMDAAIASCKRAFP---AWADTSVLSRQQVLLRYQQLIKENLKEIAKLI : .: .. : ..: :. . . :: : ..::: ..: . .:.... .: : CCDS10 QICEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLAALE 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 TLEQGKTLADAEGDVFRG-LQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLGVCAGI :.. :: . : ..: ...... . .. ..:.:.:. .. .. . :.:::..: CCDS10 TMDTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPT-DDNVVCFTRHEPIGVCGAI 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE6 APFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNIIHGQH .:.::: .. .: . :. ::::...::.:..: ... :..:....: : :..::. : CCDS10 TPWNFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPGFG 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE6 EAVNF-ICDHPDIKAISFVGSNKAGEYIFERGSRHG-KRVQANMGAKNHGVVMPDANKEN .:. : .::.:. :.:.::...:. . : .:: . ::: ..:.:: .: ::. . CCDS10 PTVGAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADLDL 240 250 260 270 280 290 310 320 330 340 350 pF1KE6 TLNQLVGAAFGAAGQRCMALSTAVLVGEA--KKWLPELVEHAKNLRVNAGDQPGADLGPL ... ..: :: : : : :.: : .... . ::.::. :. . .. :: CCDS10 AVECAHQGVFFNQGQCCTAASR-VFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGPQ 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 ITPQAKERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIISNVKPNMTCYKEEI : . ... .::.:: ::::.. : .. :: :. ::..:.: :: :::: CCDS10 IDQKQFDKILELIESGKKEGAKLECGGSAMEDKGL----FIKPTVFSEVTDNMRIAKEEI 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE6 FGPVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVNVPIPVP :::: .:. ....:.:. .:.. :: .:.:: : : : : .. : : .: . CCDS10 FGPVQPILKFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNAL- 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE6 LPMFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPTMGR . : : . : :. :. .. ::..::.: CCDS10 YAQAPFGGFKMS--GNGRELGEYALAEYTEVKTVTIKLGDKNP 480 490 500 510 >>CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 (517 aa) initn: 637 init1: 205 opt: 763 Z-score: 948.9 bits: 185.2 E(32554): 1.5e-46 Smith-Waterman score: 763; 29.5% identity (63.5% similar) in 526 aa overlap (4-521:1-517) 10 20 30 40 50 60 pF1KE6 MAALLAAAAVRARILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIH .: : : :: . :: . . .. ..: .:::.... .. : : . CCDS66 MLRFLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTV 10 20 30 40 50 70 80 90 100 110 pF1KE6 NPATNEVIGRVPQATKAEMDAAIASCKRAF---PAWADTSVLSRQQVLLRYQQLIKENLK ::.:.::::.: .. .:..: :. . ..:: : .. : ..: : .:.... CCDS66 NPTTGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNRLADLVERDRV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 EIAKLITLEQGKTLADAEG-DVFRGLQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPL .:.: ::..:: . .. . :. . ..: .. . .. :.:.: . . .. . :. CCDS66 YLASLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIP-MDGQHFCFTRHEPV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 GVCAGIAPFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLN :::. : :.::: .. : . :.. ::: .:: .:..: ... ::.:....: : :..: CCDS66 GVCGQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVN 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 IIHGQHEAVNF-ICDHPDIKAISFVGSNKAGEYIFER-GSRHGKRVQANMGAKNHGVVMP :: : ... : .: :. ..:.::...:. : . :. . ::: ..:.:. ..:. CCDS66 IITGYGPTAGAAIAQHVDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLA 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 DANKENTLNQLVGAAFGAAGQRCMALSTAVLVGEA--KKWLPELVEHAKNLRVNAGDQPG ::. :....: : : :: : : : . .: :. ...: . ::.::. .:. . CCDS66 DADMEHAVEQCHEALFFNMGQCCCAGSRT-FVEESIYNEFLERTVEKAKQRKVGNPFELD 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 ADLGPLITPQAKERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIISNVKPNMT .. :: . . ::: . :. : ::::..: :... .:. :. ::....:. .: CCDS66 TQQGPQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGF----FIKPTVFGGVQDDMR 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE6 CYKEEIFGPVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVN :::::::: ... . ..:... .::. :: ..:.:: . : ... ...: : :: CCDS66 IAKEEIFGPVQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVN 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE6 VPIPVPLPMFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPT . . : : . : :. :..:.. ::..::.: . .... CCDS66 T-YNIVTCHTPFGGFKES--GNGRELGEDGLKAYTEVKTVTIKVPQKNS 480 490 500 510 pF1KE6 MGR >>CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 (518 aa) initn: 616 init1: 203 opt: 758 Z-score: 942.7 bits: 184.1 E(32554): 3.5e-46 Smith-Waterman score: 766; 28.9% identity (63.4% similar) in 522 aa overlap (15-521:6-518) 10 20 30 40 50 pF1KE6 MAALLAAAAVRARILQVSSKVKSSPTWYSASSFSSSVPT-------VKLFIGGKFVESKS ... ..::..:. :: :: .:.::.... .:.: CCDS10 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSES 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 DKWIDIHNPATNEVIGRVPQATKAEMDAAIASCKRAFP---AWADTSVLSRQQVLLRYQQ . . ..::::.: . .: .: ::..: :. . . :: .: .. : ..: . . CCDS10 GRVFPVYNPATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLAD 60 70 80 90 100 110 120 130 140 150 160 pF1KE6 LIKENLKEIAKLITLEQGKTLADAEGDVFRG-LQVVEHACSVTSLMMGETMPSITKDMDL :.... .: . .:. :: . .: ..: ... .. . .. . : :.: . :. CCDS10 LVERDRAVLATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIP-VDGDYFT 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE6 YSYRLPLGVCAGIAPFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSG .. . :.:::. : :.::: .. : . :. :::: ..::.:..: ... .. :....: CCDS10 FTRHEPIGVCGQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAG 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE6 APDGTLNIIHGQHEAVNF-ICDHPDIKAISFVGSNKAGEYIFERGSRHG-KRVQANMGAK : :..::. : ... : .: : :.:.::...:. : : ..: . ::: ..:.: CCDS10 FPPGVINILPGYGPTAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGK 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE6 NHGVVMPDANKENTLNQLVGAAFGAAGQRCMALSTAVLVGEA--KKWLPELVEHAKNLRV . .... ::. . ...: ..: :: : : : ..: :. .... . ::.:: : CCDS10 SPNIIFADADLDYAVEQAHQGVFFNQGQCCTAGSR-IFVEESIYEEFVRRSVERAKRRVV 300 310 320 330 340 350 360 370 380 390 400 pF1KE6 NAGDQPGADLGPLITPQAKERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIIS .. .: .. :: : . ... .::.::. :::.. :. . ::. :. ::..: CCDS10 GSPFDPTTEQGPQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGF----FIEPTVFS 350 360 370 380 390 400 410 420 430 440 450 460 pF1KE6 NVKPNMTCYKEEIFGPVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVD :: .: :::::::: .:. .:.::.:. .::. .: .:.::.. : . .. CCDS10 NVTDDMRIAKEEIFGPVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQ 410 420 430 440 450 460 470 480 490 500 510 520 pF1KE6 VGQVGVNVPIPVPLPMFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSS .: : .: . . : : . : :. .:. :.. :...::.: . .... CCDS10 AGTVWINCYNALN-AQSPFGGFKMS--GNGREMGEFGLREYSEVKTVTVKIPQKNS 470 480 490 500 510 530 pF1KE6 PAVVMPTMGR >>CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 (497 aa) initn: 609 init1: 203 opt: 752 Z-score: 935.5 bits: 182.7 E(32554): 8.7e-46 Smith-Waterman score: 752; 28.8% identity (64.2% similar) in 497 aa overlap (33-521:10-497) 10 20 30 40 50 60 pF1KE6 ALLAAAAVRARILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIHNP ..: . .::.... .:.: . . ..:: CCDS55 MKNQCETVWLKSPIKLKLIFINNEWQNSESGRVFPVYNP 10 20 30 70 80 90 100 110 pF1KE6 ATNEVIGRVPQATKAEMDAAIASCKRAFP---AWADTSVLSRQQVLLRYQQLIKENLKEI ::.: . .: .: ::..: :. . . :: .: .. : ..: . .:.... . CCDS55 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL 40 50 60 70 80 90 120 130 140 150 160 170 pF1KE6 AKLITLEQGKTLADAEGDVFRG-LQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLGV : . .:. :: . .: ..: ... .. . .. . : :.: . :. .. . :.:: CCDS55 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIP-VDGDYFTFTRHEPIGV 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE6 CAGIAPFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNII :. : :.::: .. : . :. :::: ..::.:..: ... .. :....: : :..::. CCDS55 CGQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINIL 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE6 HGQHEAVNF-ICDHPDIKAISFVGSNKAGEYIFERGSRHG-KRVQANMGAKNHGVVMPDA : ... : .: : :.:.::...:. : : ..: . ::: ..:.:. .... :: CCDS55 PGYGPTAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADA 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE6 NKENTLNQLVGAAFGAAGQRCMALSTAVLVGEA--KKWLPELVEHAKNLRVNAGDQPGAD . . ...: ..: :: : : .. ..: :. .... . ::.:: :.. .: .. CCDS55 DLDYAVEQAHQGVFFNQGQCCTA-GSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTE 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE6 LGPLITPQAKERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIISNVKPNMTCY :: : . ... .::.::. :::.. :. . ::. :. ::..::: .: CCDS55 QGPQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGF----FIEPTVFSNVTDDMRIA 340 350 360 370 380 390 420 430 440 450 460 470 pF1KE6 KEEIFGPVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVNVP :::::::: .:. .:.::.:. .::. .: .:.::.. : . ...: : .: CCDS55 KEEIFGPVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCY 400 410 420 430 440 450 480 490 500 510 520 530 pF1KE6 IPVPLPMFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPTMG . . : : . : :. .:. :.. :...::.: . .... CCDS55 NALN-AQSPFGGFKMS--GNGREMGEFGLREYSEVKTVTVKIPQKNS 460 470 480 490 pF1KE6 R >>CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 (517 aa) initn: 544 init1: 203 opt: 716 Z-score: 890.3 bits: 174.4 E(32554): 2.8e-43 Smith-Waterman score: 716; 30.1% identity (61.3% similar) in 488 aa overlap (41-521:38-517) 20 30 40 50 60 70 pF1KE6 RARILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIHNPATNEVIGR ..::.... .. : : . ::.:.::: . CCDS91 FGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPSTGEVICQ 10 20 30 40 50 60 80 90 100 110 120 pF1KE6 VPQATKAEMDAAIASCKRAFP---AWADTSVLSRQQVLLRYQQLIKENLKEIAKLITLEQ : .. : ..: :. . . :: : .. : ..: : .::... .: : ::.. CCDS91 VAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLAALETLDN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 GKT-LADAEGDVFRGLQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLGVCAGIAPFN :: . . :. :. ... . .. . :.:.: : :. :. . :.:::. : :.: CCDS91 GKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIP-IDGDFFSYTRHEPVGVCGQIIPWN 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 FPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNIIHG-QHEAV :: .. : . :.. ::. .:: .:..: ... .:.:....: : :..::. : : CCDS91 FPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPGFGPTAG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 NFICDHPDIKAISFVGSNKAGEYI-FERGSRHGKRVQANMGAKNHGVVMPDANKENTLNQ : .: :. ..:.::.. :. : :: . ::: ..:.:. ...: ::. . ...: CCDS91 AAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADMDWAVEQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 LVGAAFGAAGQRCMALS-TAVLVGEAKKWLPELVEHAKNLRVNAGDQPGADLGPLITPQA : : :: : : : : : ... . : .::. :. . .. :: . CCDS91 AHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGPQVDETQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 KERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIISNVKPNMTCYKEEIFGPVL ... . :..: .:::..: : .:: :. ::....:. .:: ::::::::. CCDS91 FKKILGYINTGKQEGAKLLCGGGIAADRGY----FIQPTVFGDVQDGMTIAKEEIFGPVM 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE6 VVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVNVPIPVPLPMFS .:. .:..:.. .::. :: ..:.:: . : .. ...: : :: : . CCDS91 QILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNC-YDVFGAQSP 430 440 450 460 470 480 490 500 510 520 530 pF1KE6 FTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPTMGR : : . : :. :. :.: ::..::.: . .... CCDS91 FGGYKMS--GSGRELGEYGLQAYTEVKTVTVKVPQKNS 490 500 510 535 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 12:55:34 2016 done: Tue Nov 8 12:55:34 2016 Total Scan time: 2.560 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]