FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2363, 517 aa
1>>>pF1KE2363 517 - 517 aa - 517 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.7588+/-0.000987; mu= 15.2416+/- 0.059
mean_var=64.6465+/-12.870, 0's: 0 Z-trim(104.4): 40 B-trim: 53 in 1/48
Lambda= 0.159515
statistics sampled from 7832 (7872) to 7832 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.613), E-opt: 0.2 (0.242), width: 16
Scan time: 2.180
The best scores are: opt bits E(32554)
CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 ( 517) 3451 803.3 0
CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 ( 517) 2560 598.3 7e-171
CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 518) 2349 549.7 2.9e-156
CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 497) 2307 540.0 2.3e-153
CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 ( 501) 2245 525.8 4.5e-149
CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 512) 2190 513.1 3e-145
CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 422) 2058 482.7 3.5e-136
CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 ( 470) 2048 480.4 1.9e-135
CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 ( 923) 1543 364.3 3.4e-100
CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 801) 1533 362.0 1.5e-99
CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 902) 1533 362.0 1.6e-99
CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 912) 1533 362.0 1.7e-99
CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 405) 1307 309.9 3.6e-84
CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 ( 518) 1236 293.6 3.7e-79
CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 480) 1180 280.7 2.6e-75
CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 487) 1117 266.2 6.1e-71
CCDS4555.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 535) 910 218.5 1.5e-56
CCDS9826.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 535) 753 182.4 1.1e-45
CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 539) 750 181.7 1.8e-45
CCDS55057.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 437) 726 176.2 6.8e-44
CCDS61501.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 522) 643 157.1 4.5e-38
CCDS5172.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 433) 611 149.7 6.2e-36
CCDS4556.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 548) 580 142.6 1.1e-33
CCDS12766.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 802) 511 126.8 9.3e-29
CCDS188.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 563) 489 121.7 2.2e-27
CCDS53272.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 503) 485 120.7 3.8e-27
CCDS11210.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 485) 472 117.7 3e-26
CCDS32589.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 508) 472 117.7 3.1e-26
CCDS11212.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 453) 391 99.1 1.1e-20
CCDS82090.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 380) 354 90.6 3.5e-18
CCDS81273.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 512) 343 88.1 2.7e-17
CCDS31622.1 ALDH3B2 gene_id:222|Hs108|chr11 ( 385) 331 85.3 1.4e-16
CCDS73335.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 468) 327 84.4 3.2e-16
CCDS73336.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 431) 303 78.8 1.4e-14
CCDS46141.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 751) 273 72.0 2.7e-12
>>CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 (517 aa)
initn: 3451 init1: 3451 opt: 3451 Z-score: 4289.5 bits: 803.3 E(32554): 0
Smith-Waterman score: 3451; 99.6% identity (99.8% similar) in 517 aa overlap (1-517:1-517)
10 20 30 40 50 60
pF1KE2 MLRFLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 MLRFLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNPT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 TGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVERDRVYLA
:::::::::::::::::::::::::::::::::::::::::::::: :::::::::::::
CCDS66 TGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNRLADLVERDRVYLA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 SLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVGVCG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 SLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVGVCG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 QIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIITG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 QIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIITG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 YGPTAGAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADADM
::::::::::::.:::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 YGPTAGAAIAQHVDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADADM
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 EHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 EHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQGP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 QVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 QVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFGP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 VQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVTCHT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 VQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVTCHT
430 440 450 460 470 480
490 500 510
pF1KE2 PFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS
:::::::::::::::::::::::::::::::::::::
CCDS66 PFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS
490 500 510
>>CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 (517 aa)
initn: 2556 init1: 2556 opt: 2560 Z-score: 3181.3 bits: 598.3 E(32554): 7e-171
Smith-Waterman score: 2560; 73.4% identity (89.0% similar) in 518 aa overlap (3-517:7-517)
10 20 30 40 50
pF1KE2 MLRFLAPRLLSLQGRTARYSSAAA---LPSPILNPDIPYNQLFINNEWQDAVSKKT
:: .::: :: : :::: .:.: .:.. ::.::::::.::::.::
CCDS91 MLRAAARF-GPRL----GR--RLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKT
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 FPTVNPTTGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVE
::::::.::::: .:::::. :::.:::::: ::.:::::::::::.:::::: ::::.:
CCDS91 FPTVNPSTGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIE
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 RDRVYLASLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRH
:::.:::.:::::::::. :: .::: :.: ::.::::::.::::::.::. : .:::
CCDS91 RDRTYLAALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRH
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 EPVGVCGQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPG
::::::::::::::::.::.:::.:::::::.:::::::::::.:::.:.::::::::::
CCDS91 EPVGVCGQIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPG
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 VVNIITGYGPTAGAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSI
::::. :.:::::::::.: ::::::::::::.:..:: :::.:::::::::::::::.:
CCDS91 VVNIVPGFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNI
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 VLADADMEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFE
...::::. :::: : :::::.::::::::::::.:.::.::.::.: .::.: :::::.
CCDS91 IMSDADMDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFD
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 LDTQQGPQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIA
:.::::::. ::...::::. :..::::::::: ..::.::.::::: ::: : ::
CCDS91 SKTEQGPQVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIA
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE2 KEEIFGPVQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTY
::::::::. ..::: ::::: ::::. :::::::::.::::: :..::::::::::: :
CCDS91 KEEIFGPVMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCY
420 430 440 450 460 470
480 490 500 510
pF1KE2 NIVTCHTPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS
.. ..::::.: ::.:::::: ::.:::::::::.:::::::
CCDS91 DVFGAQSPFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
480 490 500 510
>>CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 (518 aa)
initn: 2347 init1: 2347 opt: 2349 Z-score: 2918.9 bits: 549.7 E(32554): 2.9e-156
Smith-Waterman score: 2349; 66.5% identity (88.4% similar) in 501 aa overlap (17-517:18-518)
10 20 30 40 50
pF1KE2 MLRFLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNP
: ..: :::: : .: :...:::::::.. : ..::. ::
CCDS10 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 TTGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVERDRVYL
.::: . .: :.:.::.:.::.::: :: ::: :::::::::::::. :::::::::. :
CCDS10 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 ASLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVGVC
:..:.:..:::: ... .::. :::..::.:::::: :: :::.::..: ::::::.:::
CCDS10 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE2 GQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIIT
::::::::::.: .::.:::: :::::.: ::::::::::...:::::::::::.::.
CCDS10 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILP
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE2 GYGPTAGAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADAD
:::::::::::.:. .::.:::::::::.:::.::: :::::::::::::::.:..::::
CCDS10 GYGPTAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE2 MEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQG
...:::: :...:::.:::: :::: :::::::.::..:.::.::.: ::.::. :.::
CCDS10 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE2 PQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFG
::.::.:....: :: : ::::: :::. .:..::::.::::..: ::::::::::::
CCDS10 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE2 PVQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVTCH
::: ...:: ..::.:::::. .::.::::: :..::. ..:.::::::.: :: .. .
CCDS10 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ
430 440 450 460 470 480
480 490 500 510
pF1KE2 TPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS
.:::::: ::::::.:: ::. :.::::::.:.:::::
CCDS10 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
490 500 510
>>CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 (497 aa)
initn: 2307 init1: 2307 opt: 2307 Z-score: 2866.9 bits: 540.0 E(32554): 2.3e-153
Smith-Waterman score: 2307; 66.8% identity (88.7% similar) in 488 aa overlap (30-517:10-497)
10 20 30 40 50 60
pF1KE2 MLRFLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNPT
:. : . .:::::::.. : ..::. ::.
CCDS55 MKNQCETVWLKSPIKLKLIFINNEWQNSESGRVFPVYNPA
10 20 30 40
70 80 90 100 110 120
pF1KE2 TGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVERDRVYLA
::: . .: :.:.::.:.::.::: :: ::: :::::::::::::. :::::::::. ::
CCDS55 TGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLA
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE2 SLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVGVCG
..:.:..:::: ... .::. :::..::.:::::: :: :::.::..: ::::::.::::
CCDS55 TMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCG
110 120 130 140 150 160
190 200 210 220 230 240
pF1KE2 QIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIITG
:::::::::.: .::.:::: :::::.: ::::::::::...:::::::::::.::. :
CCDS55 QIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPG
170 180 190 200 210 220
250 260 270 280 290 300
pF1KE2 YGPTAGAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADADM
::::::::::.:. .::.:::::::::.:::.::: :::::::::::::::.:..::::.
CCDS55 YGPTAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADL
230 240 250 260 270 280
310 320 330 340 350 360
pF1KE2 EHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQGP
..:::: :...:::.:::: :::: :::::::.::..:.::.::.: ::.::. :.:::
CCDS55 DYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGP
290 300 310 320 330 340
370 380 390 400 410 420
pF1KE2 QVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFGP
:.::.:....: :: : ::::: :::. .:..::::.::::..: :::::::::::::
CCDS55 QIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGP
350 360 370 380 390 400
430 440 450 460 470 480
pF1KE2 VQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVTCHT
:: ...:: ..::.:::::. .::.::::: :..::. ..:.::::::.: :: .. ..
CCDS55 VQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQS
410 420 430 440 450 460
490 500 510
pF1KE2 PFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS
:::::: ::::::.:: ::. :.::::::.:.:::::
CCDS55 PFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
470 480 490
>>CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 (501 aa)
initn: 2242 init1: 2242 opt: 2245 Z-score: 2789.8 bits: 525.8 E(32554): 4.5e-149
Smith-Waterman score: 2245; 65.0% identity (87.2% similar) in 500 aa overlap (21-517:2-501)
10 20 30 40 50
pF1KE2 MLRFLAPRLLSLQGRTARYSSAAALPS-PILNPD--IPYNQLFINNEWQDAVSKKTFPTV
:... :. :.: : : :...::::::.:.:: : ::.
CCDS66 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVF
10 20 30 40
60 70 80 90 100 110
pF1KE2 NPTTGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVERDRV
::.: : . .: :::. :::.::::::.::..::::: :::::::::: ::::.::::.
CCDS66 NPATEEELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRL
50 60 70 80 90 100
120 130 140 150 160 170
pF1KE2 YLASLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVG
::..:....:: ....: :: ::. :: :::::: .:.:::.::. : .:::::.:
CCDS66 LLATMESMNGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIG
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE2 VCGQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNI
:::::::::::::: ::..:::. :::::.: ::::::.::..::::::::::::::::
CCDS66 VCGQIIPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNI
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE2 ITGYGPTAGAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLAD
. ::::::::::..:::.::::::::::::.::..::: ::::::::::::::: :::::
CCDS66 VPGYGPTAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLAD
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE2 ADMEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQ
::...::: :...:...:::: :.:: :::::::.::..:.::.::. .:::. .
CCDS66 ADLDNAVEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVT
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE2 QGPQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEI
::::.::::....: :. :.:::::: ::: .:..:.:..::::..: :.::::::::
CCDS66 QGPQIDKEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEI
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE2 FGPVQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVT
::::: ..:::....:..::::: :::.:.:::.:.:::. ...:::::::::: :..:.
CCDS66 FGPVQQIMKFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVS
410 420 430 440 450 460
480 490 500 510
pF1KE2 CHTPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS
. :::::: ::::::::: :.. ::::::::.:. ::::
CCDS66 AQCPFGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS
470 480 490 500
>>CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 (512 aa)
initn: 2190 init1: 2190 opt: 2190 Z-score: 2721.2 bits: 513.1 E(32554): 3e-145
Smith-Waterman score: 2190; 64.3% identity (86.0% similar) in 493 aa overlap (24-516:19-511)
10 20 30 40 50 60
pF1KE2 MLRFLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNPT
::: :: : .. ....::::::... : : : : ::.
CCDS10 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPS
10 20 30 40 50
70 80 90 100 110 120
pF1KE2 TGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVERDRVYLA
: : : .: :::. :::.::.::. ::. ::::::.:: :::::. :::::::::. ::
CCDS10 TREQICEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLA
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE2 SLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVGVCG
.:::.:.:::: ... .::. :.. ::::::::: .::::: : . :::::::.::::
CCDS10 ALETMDTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTDDNVVCFTRHEPIGVCG
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE2 QIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIITG
: ::::::.: ::::::: :::.:.: ::::::.::::.:::::::::::::::. :
CCDS10 AITPWNFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPG
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE2 YGPTAGAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADADM
.:::.::::..: ...:.:::::::::.:...::. :::::::::::::.: :: ::::.
CCDS10 FGPTVGAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADL
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE2 EHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQGP
. ::: :...:::.:::: :.::.::::..:.::..:.:: ::.: ::.::.. :.:::
CCDS10 DLAVECAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGP
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE2 QVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFGP
:.:..::...: :. :.:::::: ::: . ..:.:::::::. : :.:::::::::::
CCDS10 QIDQKQFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGP
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE2 VQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVTCHT
:::..:::.::::..:::.: :::.:::::..::::. ...::..::::.: :: . ..
CCDS10 VQPILKFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQA
420 430 440 450 460 470
490 500 510
pF1KE2 PFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS
:::::: ::::::::: .: ::::::::::. .::
CCDS10 PFGGFKMSGNGRELGEYALAEYTEVKTVTIKLGDKNP
480 490 500 510
>>CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 (422 aa)
initn: 2058 init1: 2058 opt: 2058 Z-score: 2558.4 bits: 482.7 E(32554): 3.5e-136
Smith-Waterman score: 2058; 68.7% identity (90.3% similar) in 422 aa overlap (96-517:1-422)
70 80 90 100 110 120
pF1KE2 GHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVERDRVYLASLETL
::::::::::. :::::::::. ::..:.:
CCDS45 MDASERGRLLDKLADLVERDRAVLATMESL
10 20 30
130 140 150 160 170 180
pF1KE2 DNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVGVCGQIIPW
..:::: ... .::. :::..::.:::::: :: :::.::..: ::::::.:::::::::
CCDS45 NGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQIIPW
40 50 60 70 80 90
190 200 210 220 230 240
pF1KE2 NFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIITGYGPTA
::::.: .::.:::: :::::.: ::::::::::...:::::::::::.::. ::::::
CCDS45 NFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGPTA
100 110 120 130 140 150
250 260 270 280 290 300
pF1KE2 GAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADADMEHAVE
:::::.:. .::.:::::::::.:::.::: :::::::::::::::.:..::::...:::
CCDS45 GAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAVE
160 170 180 190 200 210
310 320 330 340 350 360
pF1KE2 QCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQGPQVDKE
: :...:::.:::: :::: :::::::.::..:.::.::.: ::.::. :.::::.::.
CCDS45 QAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQIDKK
220 230 240 250 260 270
370 380 390 400 410 420
pF1KE2 QFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFGPVQPLF
:....: :: : ::::: :::. .:..::::.::::..: ::::::::::::::: ..
CCDS45 QYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEIL
280 290 300 310 320 330
430 440 450 460 470 480
pF1KE2 KFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVTCHTPFGGF
.:: ..::.:::::. .::.::::: :..::. ..:.::::::.: :: .. ..:::::
CCDS45 RFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFGGF
340 350 360 370 380 390
490 500 510
pF1KE2 KESGNGRELGEDGLKAYTEVKTVTIKVPQKNS
: ::::::.:: ::. :.::::::.:.:::::
CCDS45 KMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
400 410 420
>>CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 (470 aa)
initn: 2048 init1: 2048 opt: 2048 Z-score: 2545.2 bits: 480.4 E(32554): 1.9e-135
Smith-Waterman score: 2200; 66.0% identity (80.5% similar) in 518 aa overlap (3-517:7-470)
10 20 30 40 50
pF1KE2 MLRFLAPRLLSLQGRTARYSSAAA---LPSPILNPDIPYNQLFINNEWQDAVSKKT
:: .::: :: : :::: .:.: .:.. ::.::::::.::::.::
CCDS55 MLRAAARF-GPRL----GR--RLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKT
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 FPTVNPTTGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVE
::::::.::::: .:::::.:
CCDS55 FPTVNPSTGEVICQVAEGDKA---------------------------------------
60 70
120 130 140 150 160 170
pF1KE2 RDRVYLASLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRH
:::::::::. :: .::: :.: ::.::::::.::::::.::. : .:::
CCDS55 --------LETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRH
80 90 100 110 120
180 190 200 210 220 230
pF1KE2 EPVGVCGQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPG
::::::::::::::::.::.:::.:::::::.:::::::::::.:::.:.::::::::::
CCDS55 EPVGVCGQIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPG
130 140 150 160 170 180
240 250 260 270 280 290
pF1KE2 VVNIITGYGPTAGAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSI
::::. :.:::::::::.: ::::::::::::.:..:: :::.:::::::::::::::.:
CCDS55 VVNIVPGFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNI
190 200 210 220 230 240
300 310 320 330 340 350
pF1KE2 VLADADMEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFE
...::::. :::: : :::::.::::::::::::.:.::.::.::.: .::.: :::::.
CCDS55 IMSDADMDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFD
250 260 270 280 290 300
360 370 380 390 400 410
pF1KE2 LDTQQGPQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIA
:.::::::. ::...::::. :..::::::::: ..::.::.::::: ::: : ::
CCDS55 SKTEQGPQVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIA
310 320 330 340 350 360
420 430 440 450 460 470
pF1KE2 KEEIFGPVQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTY
::::::::. ..::: ::::: ::::. :::::::::.::::: :..::::::::::: :
CCDS55 KEEIFGPVMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCY
370 380 390 400 410 420
480 490 500 510
pF1KE2 NIVTCHTPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS
.. ..::::.: ::.:::::: ::.:::::::::.:::::::
CCDS55 DVFGAQSPFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
430 440 450 460 470
>>CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 (923 aa)
initn: 1521 init1: 891 opt: 1543 Z-score: 1912.3 bits: 364.3 E(32554): 3.4e-100
Smith-Waterman score: 1543; 49.0% identity (77.5% similar) in 484 aa overlap (34-511:441-922)
10 20 30 40 50 60
pF1KE2 FLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNPTTGE
.:: : :::... :: . ::. :.::: :
CCDS31 KVVRKLRGEDQEVELVVDYISKEVNEIMVKMPY-QCFINGQFTDADDGKTYDTINPTDGS
420 430 440 450 460
70 80 90 100 110 120
pF1KE2 VIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVERDRVYLASLE
.: .:. .. ::::.:: ::..::. : : ::.: :::::. ::::.:... ::..:
CCDS31 TICKVSYASLADVDKAVAAAKDAFENGE-WGRMNARERGRLMYRLADLLEENQEELATIE
470 480 490 500 510 520
130 140 150 160 170
pF1KE2 TLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMD----GQHFCFTRHEPVGVC
.::.: . . . ....:::::: :: .:.:::.. .... ::..::.:::
CCDS31 ALDSGAVYTLALKTHIGMSVQTFRYFAGWCDKIQGSTIPINQARPNRNLTFTKKEPLGVC
530 540 550 560 570 580
180 190 200 210 220 230
pF1KE2 GQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIIT
. :::::.::.: .:: : ::.:::.:.: :. :::.:: .: : .:::: ::.:::
CCDS31 AIIIPWNYPLMMLAWKSAACLAAGNTLVLKPAQVTPLTALKFAELSVKAGFPKGVINIIP
590 600 610 620 630 640
240 250 260 270 280 290
pF1KE2 GYGPTAGAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADAD
: : :: ...: :. :..::::: .:. :.:. . ::::.:.:::::::: :.. : .
CCDS31 GSGGIAGQRLSEHPDIRKLGFTGSTPIGKQIMKSCAVSNLKKVSLELGGKSPLIIFNDCE
650 660 670 680 690 700
300 310 320 330 340 350
pF1KE2 MEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQG
...::.. :.::: :. : :..: ::::::..::. :.::. :. :.:.:.. .:..:
CCDS31 LDKAVRMGMGAVFFNKGENCIAAGRLFVEESIHDEFVTRVVEEIKKMKIGDPLDRSTDHG
710 720 730 740 750 760
360 370 380 390 400 410
pF1KE2 PQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFG
:: : ..:..: : . : :::: :. ::.. . :::..:::: :.: : .:::: ::
CCDS31 PQNHKAHLEKLLQYCETGVKEGATLVYGGRQVQRPGFFMEPTVFTDVEDYMYLAKEESFG
770 780 790 800 810 820
420 430 440 450 460 470
pF1KE2 PVQPLFKFKK--IEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVT
:.. . ::.. :. :..:::.:.::::..:::::..:::: .. :.::::..:::: .
CCDS31 PIMVISKFQNGDIDGVLQRANSTEYGLASGVFTRDINKAMYVSEKLEAGTVFINTYNKTD
830 840 850 860 870 880
480 490 500 510
pF1KE2 CHTPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS
.:::: :.:: :..:::..:. : ..::::..
CCDS31 VAAPFGGVKQSGFGKDLGEEALNEYLKTKTVTLEY
890 900 910 920
>>CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 (801 aa)
initn: 1525 init1: 911 opt: 1533 Z-score: 1900.9 bits: 362.0 E(32554): 1.5e-99
Smith-Waterman score: 1533; 49.6% identity (77.1% similar) in 484 aa overlap (34-511:319-800)
10 20 30 40 50 60
pF1KE2 FLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNPTTGE
.:. ::::..:. :: . :: :.::: :
CCDS58 LLVRKLRGDDEEGECSIDYVEMAVNKRTVRMPH-QLFIGGEFVDAEGAKTSETINPTDGS
290 300 310 320 330 340
70 80 90 100 110 120
pF1KE2 VIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVERDRVYLASLE
:: .:. .. .:::.:: ::..::. : : ...: .::::. ::::.:. . ::..:
CCDS58 VICQVSLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQEELATIE
350 360 370 380 390 400
130 140 150 160 170
pF1KE2 TLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMD----GQHFCFTRHEPVGVC
.:: : . . . :...:::::: :: .:.:::.. .... .::.::::::
CCDS58 ALDAGAVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVC
410 420 430 440 450 460
180 190 200 210 220 230
pF1KE2 GQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIIT
: :::::.::.: .:: : ::.:::::.: :. :::.:: .: : .::.: ::::..
CCDS58 GIIIPWNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLP
470 480 490 500 510 520
240 250 260 270 280 290
pF1KE2 GYGPTAGAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADAD
: : .: ...: :: :..::::::::. :.:. . ::.:.:.:::::::: :..:: :
CCDS58 GSGSLVGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCD
530 540 550 560 570 580
300 310 320 330 340 350
pF1KE2 MEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQG
...::.. ..::: :. : :..: :::.::..::..:.::.... :::::.. ::..:
CCDS58 LNKAVQMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHG
590 600 610 620 630 640
360 370 380 390 400 410
pF1KE2 PQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFG
:: . .. ... : : : :::: :.:::.. . :::..:::: :.: : ::::: ::
CCDS58 PQNHHAHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTDVEDHMFIAKEESFG
650 660 670 680 690 700
420 430 440 450 460 470
pF1KE2 PVQPLFKFKK--IEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVT
::. . .: .. :. ::: :..:::..:::::..::.: .. ::::::.::::: .
CCDS58 PVMIISRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTD
710 720 730 740 750 760
480 490 500 510
pF1KE2 CHTPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS
.::::::.:: :..::: .:. : .:::::..
CCDS58 VAAPFGGFKQSGFGKDLGEAALNEYLRVKTVTFEY
770 780 790 800
517 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 02:48:57 2016 done: Mon Nov 7 02:48:58 2016
Total Scan time: 2.180 Total Display time: 0.090
Function used was FASTA [36.3.4 Apr, 2011]