FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0799, 501 aa
1>>>pF1KE0799 501 - 501 aa - 501 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.6558+/-0.000905; mu= 15.9668+/- 0.054
mean_var=66.6698+/-13.571, 0's: 0 Z-trim(105.7): 39 B-trim: 348 in 1/50
Lambda= 0.157076
statistics sampled from 8538 (8577) to 8538 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.638), E-opt: 0.2 (0.263), width: 16
Scan time: 3.150
The best scores are: opt bits E(32554)
CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 ( 501) 3357 769.8 0
CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 518) 2528 582.0 5.4e-166
CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 497) 2489 573.1 2.4e-163
CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 512) 2438 561.6 7.3e-160
CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 ( 517) 2352 542.1 5.4e-154
CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 ( 517) 2245 517.9 1.1e-146
CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 422) 2216 511.3 8.6e-145
CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 ( 470) 1911 442.2 6.1e-124
CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 801) 1555 361.6 1.9e-99
CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 902) 1555 361.6 2.1e-99
CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 912) 1555 361.6 2.1e-99
CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 ( 923) 1555 361.6 2.1e-99
CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 405) 1455 338.8 6.8e-93
CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 480) 1294 302.3 7.6e-82
CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 ( 518) 1181 276.7 4.2e-74
CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 487) 1150 269.7 5.1e-72
CCDS4555.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 535) 928 219.4 7.8e-57
CCDS9826.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 535) 775 184.7 2.1e-46
CCDS55057.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 437) 766 182.7 7.3e-46
CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 539) 719 172.1 1.4e-42
CCDS61501.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 522) 666 160.0 5.7e-39
CCDS4556.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 548) 622 150.1 5.9e-36
CCDS5172.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 433) 613 148.0 2e-35
CCDS11212.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 453) 573 138.9 1.1e-32
CCDS82090.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 380) 526 128.3 1.5e-29
CCDS11210.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 485) 521 127.2 4.1e-29
CCDS32589.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 508) 521 127.2 4.3e-29
CCDS12766.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 802) 503 123.2 1.1e-27
CCDS188.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 563) 496 121.5 2.4e-27
CCDS53272.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 503) 481 118.1 2.3e-26
CCDS81273.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 512) 405 100.9 3.6e-21
CCDS31622.1 ALDH3B2 gene_id:222|Hs108|chr11 ( 385) 336 85.2 1.4e-16
CCDS73335.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 468) 329 83.7 5e-16
CCDS73336.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 431) 304 78.0 2.4e-14
CCDS46141.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 751) 280 72.6 1.7e-12
>>CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 (501 aa)
initn: 3357 init1: 3357 opt: 3357 Z-score: 4109.2 bits: 769.8 E(32554): 0
Smith-Waterman score: 3357; 100.0% identity (100.0% similar) in 501 aa overlap (1-501:1-501)
10 20 30 40 50 60
pF1KE0 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPATEEELCQVEEGDKEDV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPATEEELCQVEEGDKEDV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 DKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATMESMNGGKLYSNAYL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 DKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATMESMNGGKLYSNAYL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 NDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVCGQIIPWNFPLVMLIWKI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 NDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVCGQIIPWNFPLVMLIWKI
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 GPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYGPTAGAAISSHMDID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 GPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYGPTAGAAISSHMDID
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 KVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDNAVEFAHHGVFYHQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 KVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDNAVEFAHHGVFYHQG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 QCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQIDKEQYDKILDLIES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 QCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQIDKEQYDKILDLIES
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 GKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGPVQQIMKFKSLDDVIKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 GKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGPVQQIMKFKSLDDVIKR
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE0 ANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQCPFGGFKMSGNGRELGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 ANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQCPFGGFKMSGNGRELGE
430 440 450 460 470 480
490 500
pF1KE0 YGFHEYTEVKTVTVKISQKNS
:::::::::::::::::::::
CCDS66 YGFHEYTEVKTVTVKISQKNS
490 500
>>CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 (518 aa)
initn: 2528 init1: 2528 opt: 2528 Z-score: 3093.6 bits: 582.0 E(32554): 5.4e-166
Smith-Waterman score: 2528; 73.2% identity (91.5% similar) in 493 aa overlap (9-501:26-518)
10 20 30 40
pF1KE0 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNP
:: .:.:.::::::::::..: ::. :::.::
CCDS10 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE0 ATEEELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLL
:: :..:.:.:.:: :.::::.::: ::..:: :: :::::::::: :::::.:::: .:
CCDS10 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE0 ATMESMNGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVC
:::::.:::: . .:. :: : :::.:: :::::::.: :::.::..::.:::::::::
CCDS10 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE0 GQIIPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVP
::::::::::.:. :::.::: ::::::.::::::::.::....:::::::::::.::.:
CCDS10 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILP
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE0 GYGPTAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADAD
::::::::::.::. :::.::::::::::::.::::.::::::::::::::: :..::::
CCDS10 GYGPTAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD
250 260 270 280 290 300
290 300 310 320 330 340
pF1KE0 LDNAVEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQG
:: ::: ::.:::..::::: :.::::::::::.:::::::::::. ..:.:. : . ::
CCDS10 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG
310 320 330 340 350 360
350 360 370 380 390 400
pF1KE0 PQIDKEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFG
:::::.::.:::.::.:: ::::::::: : ::.:..:::::::::.::::::::::
CCDS10 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG
370 380 390 400 410 420
410 420 430 440 450 460
pF1KE0 PVQQIMKFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQ
:::.:..::..:.::.::::. .:: :.:::.::.::.:.:::.::::::.:::....::
CCDS10 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ
430 440 450 460 470 480
470 480 490 500
pF1KE0 CPFGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS
:::::::::::::.::.:..::.::::::::: ::::
CCDS10 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
490 500 510
>>CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 (497 aa)
initn: 2487 init1: 2487 opt: 2489 Z-score: 3046.2 bits: 573.1 E(32554): 2.4e-163
Smith-Waterman score: 2489; 73.3% identity (91.5% similar) in 484 aa overlap (18-501:14-497)
10 20 30 40 50 60
pF1KE0 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPATEEELCQVEEGDKEDV
:. :::::::..: ::. :::.:::: :..:.:.:.:: :.
CCDS55 MKNQCETVWLKSPIKLKLIFINNEWQNSESGRVFPVYNPATGEQVCEVQEADKADI
10 20 30 40 50
70 80 90 100 110 120
pF1KE0 DKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATMESMNGGKLYSNAYL
::::.::: ::..:: :: :::::::::: :::::.:::: .::::::.:::: . .:.
CCDS55 DKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATMESLNGGKPFLQAFY
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE0 NDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVCGQIIPWNFPLVMLIWKI
:: : :::.:: :::::::.: :::.::..::.:::::::::::::::::::.:. :::
CCDS55 VDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQIIPWNFPLLMFAWKI
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE0 GPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYGPTAGAAISSHMDID
.::: ::::::.::::::::.::....:::::::::::.::.:::::::::::.::. ::
CCDS55 APALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGPTAGAAIASHIGID
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE0 KVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDNAVEFAHHGVFYHQG
:.::::::::::::.::::.::::::::::::::: :..:::::: ::: ::.:::..::
CCDS55 KIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAVEQAHQGVFFNQG
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE0 QCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQIDKEQYDKILDLIES
::: :.::::::::::.:::::::::::. ..:.:. : . :::::::.::.:::.::.:
CCDS55 QCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQIDKKQYNKILELIQS
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE0 GKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGPVQQIMKFKSLDDVIKR
: ::::::::: : ::.:..:::::::::.:::::::::::::.:..::..:.::.:
CCDS55 GVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEILRFKTMDEVIER
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE0 ANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQCPFGGFKMSGNGRELGE
:::. .:: :.:::.::.::.:.:::.::::::.:::....:: :::::::::::::.::
CCDS55 ANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFGGFKMSGNGREMGE
420 430 440 450 460 470
490 500
pF1KE0 YGFHEYTEVKTVTVKISQKNS
.:..::.::::::::: ::::
CCDS55 FGLREYSEVKTVTVKIPQKNS
480 490
>>CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 (512 aa)
initn: 2438 init1: 2438 opt: 2438 Z-score: 2983.5 bits: 561.6 E(32554): 7.3e-160
Smith-Waterman score: 2438; 70.9% identity (89.7% similar) in 494 aa overlap (7-500:18-511)
10 20 30 40
pF1KE0 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPATEEEL
: :: . .:....::::::::::.: ::::: . ::.:.:..
CCDS10 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPSTREQI
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE0 CQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATMESM
:.:::::: ::::::.::. ::: ::::: .:: :::::..::::.:::: ::..:.:
CCDS10 CEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLAALETM
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE0 NGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVCGQIIPW
. :: . .:.. :: :::.:::: :::::::::.::: : : .:::::::::: : ::
CCDS10 DTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTDDNVVCFTRHEPIGVCGAITPW
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE0 NFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYGPTA
::::.::.::..::: ::::.:.:::::::::::...::::::::::::::::::.:::.
CCDS10 NFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPGFGPTV
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE0 GAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDNAVE
::::::: .:.:.:::::::::::.::::..:::::::::::::.:::: :::::: :::
CCDS10 GAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADLDLAVE
250 260 270 280 290 300
290 300 310 320 330 340
pF1KE0 FAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQIDKE
::.:::..::::: ::::.::::..:.:::::::: ::: .:.:. . ::::::..
CCDS10 CAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGPQIDQK
310 320 330 340 350 360
350 360 370 380 390 400
pF1KE0 QYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGPVQQIM
:.::::.::::::::::::::::. .:: :..:::::.:::.::::::::::::: :.
CCDS10 QFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGPVQPIL
370 380 390 400 410 420
410 420 430 440 450 460
pF1KE0 KFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQCPFGGF
::::...::::::.: :::.:.::::..:::. ..:::..::::.:::... :: :::::
CCDS10 KFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQAPFGGF
430 440 450 460 470 480
470 480 490 500
pF1KE0 KMSGNGRELGEYGFHEYTEVKTVTVKISQKNS
::::::::::::.. :::::::::.:...::
CCDS10 KMSGNGRELGEYALAEYTEVKTVTIKLGDKNP
490 500 510
>>CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 (517 aa)
initn: 2344 init1: 2344 opt: 2352 Z-score: 2878.1 bits: 542.1 E(32554): 5.4e-154
Smith-Waterman score: 2352; 68.1% identity (86.8% similar) in 501 aa overlap (1-501:17-517)
10 20 30 40
pF1KE0 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPA
.:...: .:. . .. ..:::::::::.:: : ::. ::.
CCDS91 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPS
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE0 TEEELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLA
: : .::: ::::::::::::::: :::.::::: ::::.::::: .::::::::: ::
CCDS91 TGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLA
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE0 TMESMNGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVCG
..:....:: : .:: :: .: ::: :::::: .:.::::::.::.::::::.::::
CCDS91 ALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCG
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE0 QIIPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPG
:::::::::.: ::.::::. ::.::.: :::::::::.::.:::::::::::::::::
CCDS91 QIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPG
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE0 YGPTAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADL
.::::::::.:: :.::::::::::.:..:. :::.::::::::::::::: :...:::.
CCDS91 FGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADM
250 260 270 280 290 300
290 300 310 320 330 340
pF1KE0 DNAVEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGP
: ::: :: ..:..::::: :.:: ::.:.::::::.::: :::. ..:::. . :::
CCDS91 DWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGP
310 320 330 340 350 360
350 360 370 380 390 400
pF1KE0 QIDKEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGP
:.:. :. ::: :..::.::::: :::: ...:::.:::::..: : : :::::::::
CCDS91 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP
370 380 390 400 410 420
410 420 430 440 450 460
pF1KE0 VQQIMKFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQC
:.::.:::....:. ::::. :::.:.:::::.::: .:.:::::::::::: : .::
CCDS91 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQS
430 440 450 460 470 480
470 480 490 500
pF1KE0 PFGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS
::::.::::.::::::::.. ::::::::::. ::::
CCDS91 PFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
490 500 510
>>CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 (517 aa)
initn: 2242 init1: 2242 opt: 2245 Z-score: 2747.1 bits: 517.9 E(32554): 1.1e-146
Smith-Waterman score: 2245; 64.8% identity (87.4% similar) in 500 aa overlap (2-501:21-517)
10 20 30 40
pF1KE0 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVF
:... :. :.: : : :...::::::.:.:: : ::.
CCDS66 MLRFLAPRLLSLQGRTARYSSAAALPS-PILNPD--IPYNQLFINNEWQDAVSKKTFPTV
10 20 30 40 50
50 60 70 80 90 100
pF1KE0 NPATEEELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRL
::.: : . .: :::. :::.::::::.::..::::: :::::::::: .::::.::::.
CCDS66 NPTTGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNRLADLVERDRV
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE0 LLATMESMNGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIG
::..:....:: ....: :: ::. :: :::::: .:.:::.::. : .:::::.:
CCDS66 YLASLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVG
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE0 VCGQIIPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNI
:::::::::::::: ::..:::. :::::.: ::::::.::..::::::::::::::::
CCDS66 VCGQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNI
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE0 VPGYGPTAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLAD
. ::::::::::..:.:.::::::::::::.::..::: ::::::::::::::: :::::
CCDS66 ITGYGPTAGAAIAQHVDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLAD
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE0 ADLDNAVEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVT
::...::: :...:...:::: :.:: :::::::.::..:.::.::. .:::. .
CCDS66 ADMEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQ
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE0 QGPQIDKEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEI
::::.::::....: :. :.:::::: ::: .:..:.:..::::..: :.::::::::
CCDS66 QGPQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEI
360 370 380 390 400 410
410 420 430 440 450 460
pF1KE0 FGPVQQIMKFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVS
::::: ..:::....:..::::: :::.:.:::.:.:::. ...:::::::::: :..:.
CCDS66 FGPVQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVT
420 430 440 450 460 470
470 480 490 500
pF1KE0 AQCPFGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS
. :::::: ::::::::: :.. ::::::::.:. ::::
CCDS66 CHTPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS
480 490 500 510
>>CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 (422 aa)
initn: 2216 init1: 2216 opt: 2216 Z-score: 2712.9 bits: 511.3 E(32554): 8.6e-145
Smith-Waterman score: 2216; 75.1% identity (92.7% similar) in 422 aa overlap (80-501:1-422)
50 60 70 80 90 100
pF1KE0 CQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATMESM
:::::::::: :::::.:::: .::::::.
CCDS45 MDASERGRLLDKLADLVERDRAVLATMESL
10 20 30
110 120 130 140 150 160
pF1KE0 NGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVCGQIIPW
:::: . .:. :: : :::.:: :::::::.: :::.::..::.:::::::::::::::
CCDS45 NGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQIIPW
40 50 60 70 80 90
170 180 190 200 210 220
pF1KE0 NFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYGPTA
::::.:. :::.::: ::::::.::::::::.::....:::::::::::.::.:::::::
CCDS45 NFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGPTA
100 110 120 130 140 150
230 240 250 260 270 280
pF1KE0 GAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDNAVE
::::.::. :::.::::::::::::.::::.::::::::::::::: :..:::::: :::
CCDS45 GAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAVE
160 170 180 190 200 210
290 300 310 320 330 340
pF1KE0 FAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQIDKE
::.:::..::::: :.::::::::::.:::::::::::. ..:.:. : . :::::::.
CCDS45 QAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQIDKK
220 230 240 250 260 270
350 360 370 380 390 400
pF1KE0 QYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGPVQQIM
::.:::.::.:: ::::::::: : ::.:..:::::::::.:::::::::::::.:.
CCDS45 QYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEIL
280 290 300 310 320 330
410 420 430 440 450 460
pF1KE0 KFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQCPFGGF
.::..:.::.::::. .:: :.:::.::.::.:.:::.::::::.:::....:: :::::
CCDS45 RFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFGGF
340 350 360 370 380 390
470 480 490 500
pF1KE0 KMSGNGRELGEYGFHEYTEVKTVTVKISQKNS
::::::::.::.:..::.::::::::: ::::
CCDS45 KMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
400 410 420
>>CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 (470 aa)
initn: 2077 init1: 1911 opt: 1911 Z-score: 2338.7 bits: 442.2 E(32554): 6.1e-124
Smith-Waterman score: 1995; 60.3% identity (78.4% similar) in 501 aa overlap (1-501:17-470)
10 20 30 40
pF1KE0 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPA
.:...: .:. . .. ..:::::::::.:: : ::. ::.
CCDS55 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPS
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE0 TEEELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLA
: : .::: ::::
CCDS55 TGEVICQVAEGDK-----------------------------------------------
70
110 120 130 140 150 160
pF1KE0 TMESMNGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVCG
..:....:: : .:: :: .: ::: :::::: .:.::::::.::.::::::.::::
CCDS55 ALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCG
80 90 100 110 120 130
170 180 190 200 210 220
pF1KE0 QIIPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPG
:::::::::.: ::.::::. ::.::.: :::::::::.::.:::::::::::::::::
CCDS55 QIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPG
140 150 160 170 180 190
230 240 250 260 270 280
pF1KE0 YGPTAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADL
.::::::::.:: :.::::::::::.:..:. :::.::::::::::::::: :...:::.
CCDS55 FGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADM
200 210 220 230 240 250
290 300 310 320 330 340
pF1KE0 DNAVEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGP
: ::: :: ..:..::::: :.:: ::.:.::::::.::: :::. ..:::. . :::
CCDS55 DWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGP
260 270 280 290 300 310
350 360 370 380 390 400
pF1KE0 QIDKEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGP
:.:. :. ::: :..::.::::: :::: ...:::.:::::..: : : :::::::::
CCDS55 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP
320 330 340 350 360 370
410 420 430 440 450 460
pF1KE0 VQQIMKFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQC
:.::.:::....:. ::::. :::.:.:::::.::: .:.:::::::::::: : .::
CCDS55 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQS
380 390 400 410 420 430
470 480 490 500
pF1KE0 PFGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS
::::.::::.::::::::.. ::::::::::. ::::
CCDS55 PFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
440 450 460 470
>>CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 (801 aa)
initn: 1306 init1: 948 opt: 1555 Z-score: 1899.0 bits: 361.6 E(32554): 1.9e-99
Smith-Waterman score: 1555; 50.6% identity (76.8% similar) in 478 aa overlap (22-493:322-798)
10 20 30 40 50
pF1KE0 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPATEEELCQ
..::..:. :. ..: ..::. .::
CCDS58 RKLRGDDEEGECSIDYVEMAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQ
300 310 320 330 340 350
60 70 80 90 100 110
pF1KE0 VEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATMESMNG
: .. :::::: ::..::. : : ..: .::::.:.::::.:. . :::.:....
CCDS58 VSLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQEELATIEALDA
360 370 380 390 400 410
120 130 140 150 160
pF1KE0 GKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPID----GNFFTYTRHEPIGVCGQII
: .:. : . .. :.:.:: ::: ::::: ::::. . .: ::.::.:::: ::
CCDS58 GAVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIII
420 430 440 450 460 470
170 180 190 200 210 220
pF1KE0 PWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYGP
:::.::.:: :: . :. :::::.:::. ::::::. : : .::.: ::::..:: :
CCDS58 PWNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLPGSGS
480 490 500 510 520 530
230 240 250 260 270 280
pF1KE0 TAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDNA
.: .:.: :. :..::::::::: : .. . ::.:.:.:::::::: :..:: ::..:
CCDS58 LVGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKA
540 550 560 570 580 590
290 300 310 320 330 340
pF1KE0 VEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQID
:... .::...:. ::::.:.:::.::.:::::: ::...:. .:::: . .:::
CCDS58 VQMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNH
600 610 620 630 640 650
350 360 370 380 390 400
pF1KE0 KEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGPVQQ
. . :... . : :::: : :::. :.: .::::..: :.: ::::: ::::.
CCDS58 HAHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTDVEDHMFIAKEESFGPVMI
660 670 680 690 700 710
410 420 430 440 450 460
pF1KE0 IMKFKS--LDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQCP
: .: . :: :..::: : .::..::::.::.::. .:. ::::::.:: :. ... :
CCDS58 ISRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTDVAAP
720 730 740 750 760 770
470 480 490 500
pF1KE0 FGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS
:::::.:: :..::: ...:: .:::::
CCDS58 FGGFKQSGFGKDLGEAALNEYLRVKTVTFEY
780 790 800
>>CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 (902 aa)
initn: 1306 init1: 948 opt: 1555 Z-score: 1898.1 bits: 361.6 E(32554): 2.1e-99
Smith-Waterman score: 1555; 50.6% identity (76.8% similar) in 478 aa overlap (22-493:423-899)
10 20 30 40 50
pF1KE0 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPATEEELCQ
..::..:. :. ..: ..::. .::
CCDS30 RKLRGDDEEGECSIDYVEMAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQ
400 410 420 430 440 450
60 70 80 90 100 110
pF1KE0 VEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATMESMNG
: .. :::::: ::..::. : : ..: .::::.:.::::.:. . :::.:....
CCDS30 VSLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQEELATIEALDA
460 470 480 490 500 510
120 130 140 150 160
pF1KE0 GKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPID----GNFFTYTRHEPIGVCGQII
: .:. : . .. :.:.:: ::: ::::: ::::. . .: ::.::.:::: ::
CCDS30 GAVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIII
520 530 540 550 560 570
170 180 190 200 210 220
pF1KE0 PWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYGP
:::.::.:: :: . :. :::::.:::. ::::::. : : .::.: ::::..:: :
CCDS30 PWNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLPGSGS
580 590 600 610 620 630
230 240 250 260 270 280
pF1KE0 TAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDNA
.: .:.: :. :..::::::::: : .. . ::.:.:.:::::::: :..:: ::..:
CCDS30 LVGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKA
640 650 660 670 680 690
290 300 310 320 330 340
pF1KE0 VEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQID
:... .::...:. ::::.:.:::.::.:::::: ::...:. .:::: . .:::
CCDS30 VQMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNH
700 710 720 730 740 750
350 360 370 380 390 400
pF1KE0 KEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGPVQQ
. . :... . : :::: : :::. :.: .::::..: :.: ::::: ::::.
CCDS30 HAHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTDVEDHMFIAKEESFGPVMI
760 770 780 790 800 810
410 420 430 440 450 460
pF1KE0 IMKFKS--LDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQCP
: .: . :: :..::: : .::..::::.::.::. .:. ::::::.:: :. ... :
CCDS30 ISRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTDVAAP
820 830 840 850 860 870
470 480 490 500
pF1KE0 FGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS
:::::.:: :..::: ...:: .:::::
CCDS30 FGGFKQSGFGKDLGEAALNEYLRVKTVTFEY
880 890 900
501 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 23:29:03 2016 done: Sun Nov 6 23:29:04 2016
Total Scan time: 3.150 Total Display time: 0.110
Function used was FASTA [36.3.4 Apr, 2011]