FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6415, 480 aa
1>>>pF1KE6415 480 - 480 aa - 480 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.5980+/-0.000992; mu= 15.9996+/- 0.059
mean_var=64.4450+/-13.131, 0's: 0 Z-trim(103.2): 41 B-trim: 0 in 0/51
Lambda= 0.159764
statistics sampled from 7253 (7292) to 7253 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.594), E-opt: 0.2 (0.224), width: 16
Scan time: 1.840
The best scores are: opt bits E(32554)
CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 480) 3185 743.3 1.3e-214
CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 422) 1652 389.9 2.8e-108
CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 497) 1652 389.9 3.2e-108
CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 518) 1652 389.9 3.4e-108
CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 ( 501) 1294 307.4 2.3e-83
CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 405) 1271 302.1 7.4e-82
CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 512) 1271 302.1 9.1e-82
CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 ( 470) 1201 286.0 6e-77
CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 ( 517) 1201 286.0 6.6e-77
CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 ( 517) 1180 281.1 1.9e-75
CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 801) 870 209.8 9e-54
CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 902) 870 209.8 1e-53
CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 912) 870 209.8 1e-53
CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 ( 923) 829 200.3 7.1e-51
CCDS55057.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 437) 821 198.4 1.3e-50
CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 ( 518) 683 166.6 5.8e-41
CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 487) 628 153.9 3.6e-37
CCDS4555.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 535) 542 134.1 3.6e-31
CCDS4556.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 548) 542 134.1 3.7e-31
CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 539) 472 118.0 2.6e-26
CCDS82090.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 380) 376 95.8 8.7e-20
CCDS11212.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 453) 376 95.8 1e-19
CCDS5172.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 433) 369 94.2 3e-19
CCDS11210.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 485) 361 92.4 1.2e-18
CCDS32589.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 508) 361 92.4 1.2e-18
CCDS9826.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 535) 323 83.6 5.6e-16
CCDS12766.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 802) 310 80.7 6.5e-15
CCDS53272.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 503) 265 70.2 5.6e-12
CCDS188.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 563) 265 70.3 6.2e-12
CCDS46141.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 751) 266 70.5 6.9e-12
>>CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 (480 aa)
initn: 3185 init1: 3185 opt: 3185 Z-score: 3966.2 bits: 743.3 E(32554): 1.3e-214
Smith-Waterman score: 3185; 100.0% identity (100.0% similar) in 480 aa overlap (1-480:1-480)
10 20 30 40 50 60
pF1KE6 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEVGKLIQEAAGRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEVGKLIQEAAGRS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE6 NLKRVTLELGGKSPNIIFADADLDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 NLKRVTLELGGKSPNIIFADADLDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE6 RSVERAKRRVVGSPFDPTTEQGPQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RSVERAKRRVVGSPFDPTTEQGPQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFF
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE6 IEPTVFSNVTDDMRIAKEEIFGPVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 IEPTVFSNVTDDMRIAKEEIFGPVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKAL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE6 TVSSAMQAGTVWINCYNALNAQSPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 TVSSAMQAGTVWINCYNALNAQSPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
430 440 450 460 470 480
>>CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 (422 aa)
initn: 1652 init1: 1652 opt: 1652 Z-score: 2057.4 bits: 389.9 E(32554): 2.8e-108
Smith-Waterman score: 2466; 91.0% identity (91.0% similar) in 422 aa overlap (97-480:1-422)
70 80 90 100 110 120
pF1KE6 CEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATMESL
::::::::::::::::::::::::::::::
CCDS45 MDASERGRLLDKLADLVERDRAVLATMESL
10 20 30
130 140 150 160 170 180
pF1KE6 NGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQIIPW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 NGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQIIPW
40 50 60 70 80 90
190 200 210 220
pF1KE6 NFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKE------------------
::::::::::::::::::::::::::::::::::::::::::
CCDS45 NFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGPTA
100 110 120 130 140 150
230 240 250 260
pF1KE6 --------------------VGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAVE
::::::::::::::::::::::::::::::::::::::::
CCDS45 GAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAVE
160 170 180 190 200 210
270 280 290 300 310 320
pF1KE6 QAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQIDKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 QAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQIDKK
220 230 240 250 260 270
330 340 350 360 370 380
pF1KE6 QYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 QYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEIL
280 290 300 310 320 330
390 400 410 420 430 440
pF1KE6 RFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFGGF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 RFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFGGF
340 350 360 370 380 390
450 460 470 480
pF1KE6 KMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
::::::::::::::::::::::::::::::::
CCDS45 KMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
400 410 420
>>CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 (497 aa)
initn: 1652 init1: 1652 opt: 1652 Z-score: 2056.3 bits: 389.9 E(32554): 3.2e-108
Smith-Waterman score: 2856; 91.5% identity (91.5% similar) in 484 aa overlap (35-480:14-497)
10 20 30 40 50 60
pF1KE6 KIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNPATGE
:: :::::::::::::::::::::::::
CCDS55 MKNQCETVWLKSPIKLKLIFINNEWQNSESGRVFPVYNPATGE
10 20 30 40
70 80 90 100 110 120
pF1KE6 QVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATME
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 QVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATME
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE6 SLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 SLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQII
110 120 130 140 150 160
190 200 210 220
pF1KE6 PWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKE----------------
::::::::::::::::::::::::::::::::::::::::::::
CCDS55 PWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGP
170 180 190 200 210 220
230 240 250 260
pF1KE6 ----------------------VGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYA
::::::::::::::::::::::::::::::::::::::
CCDS55 TAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYA
230 240 250 260 270 280
270 280 290 300 310 320
pF1KE6 VEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQID
290 300 310 320 330 340
330 340 350 360 370 380
pF1KE6 KKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 KKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQE
350 360 370 380 390 400
390 400 410 420 430 440
pF1KE6 ILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFG
410 420 430 440 450 460
450 460 470 480
pF1KE6 GFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
::::::::::::::::::::::::::::::::::
CCDS55 GFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
470 480 490
>>CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 (518 aa)
initn: 1652 init1: 1652 opt: 1652 Z-score: 2056.0 bits: 389.9 E(32554): 3.4e-108
Smith-Waterman score: 3066; 92.6% identity (92.6% similar) in 512 aa overlap (7-480:7-518)
10 20 30 40 50 60
pF1KE6 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC
130 140 150 160 170 180
190 200 210 220
pF1KE6 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKE------------
::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILP
190 200 210 220 230 240
230 240 250 260
pF1KE6 --------------------------VGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD
::::::::::::::::::::::::::::::::::
CCDS10 GYGPTAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD
250 260 270 280 290 300
270 280 290 300 310 320
pF1KE6 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG
310 320 330 340 350 360
330 340 350 360 370 380
pF1KE6 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG
370 380 390 400 410 420
390 400 410 420 430 440
pF1KE6 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ
430 440 450 460 470 480
450 460 470 480
pF1KE6 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
::::::::::::::::::::::::::::::::::::::
CCDS10 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
490 500 510
>>CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 (501 aa)
initn: 1294 init1: 1294 opt: 1294 Z-score: 1610.3 bits: 307.4 E(32554): 2.3e-83
Smith-Waterman score: 2212; 66.7% identity (84.0% similar) in 493 aa overlap (26-480:9-501)
10 20 30 40 50 60
pF1KE6 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP
:: .:.:.::::::::::..: ::. :::.::
CCDS66 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNP
10 20 30 40
70 80 90 100 110 120
pF1KE6 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL
:: :..:.:.:.:: :.::::.::: ::..:: :: :::::::::: :::::.:::: .:
CCDS66 ATEEELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLL
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE6 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC
:::::.:::: . .:. :: : :::.:: :::::::.: :::.::..::.:::::::::
CCDS66 ATMESMNGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVC
110 120 130 140 150 160
190 200 210 220
pF1KE6 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKE------------
::::::::::.:. :::.::: ::::::.::::::::.::....::::
CCDS66 GQIIPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVP
170 180 190 200 210 220
230 240 250 260
pF1KE6 --------------------------VGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD
:::::.::::.::::::::::::::: :..::::
CCDS66 GYGPTAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADAD
230 240 250 260 270 280
270 280 290 300 310 320
pF1KE6 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG
:: ::: ::.:::..::::: :.::::::::::.:::::::::::. ..:.:. : . ::
CCDS66 LDNAVEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQG
290 300 310 320 330 340
330 340 350 360 370 380
pF1KE6 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG
:::::.::.:::.::.:: ::::::::: : ::.:..:::::::::.::::::::::
CCDS66 PQIDKEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFG
350 360 370 380 390 400
390 400 410 420 430 440
pF1KE6 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ
:::.:..::..:.::.::::. .:: :.:::.::.::.:.:::.::::::.:::....::
CCDS66 PVQQIMKFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQ
410 420 430 440 450 460
450 460 470 480
pF1KE6 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
:::::::::::::.::.:..::.::::::::: ::::
CCDS66 CPFGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS
470 480 490 500
>>CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 (405 aa)
initn: 1694 init1: 1271 opt: 1271 Z-score: 1583.1 bits: 302.1 E(32554): 7.4e-82
Smith-Waterman score: 1584; 57.7% identity (74.7% similar) in 454 aa overlap (26-479:20-404)
10 20 30 40 50 60
pF1KE6 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP
:: : :::.:.:::::::::..:.::. : . ::
CCDS76 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNP
10 20 30 40 50
70 80 90 100 110 120
pF1KE6 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL
.: ::.:::.:.:: :.::::.::..::. :: :::.:: ::::: .::::::::::.:
CCDS76 STREQICEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATL
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE6 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC
: ::. : ::
CCDS76 A-----------------------------AGF----------------------PPGVV
120
190 200 210 220 230 240
pF1KE6 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEVGKLIQEAAGRS
. :.: : . : . : . : .. . :. :::::..:::.::
CCDS76 N-IVPGFGPTVGAAISSHPQI---NKIA------------FTGS--TEVGKLVKEAASRS
130 140 150 160
250 260 270 280 290 300
pF1KE6 NLKRVTLELGGKSPNIIFADADLDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVR
::::::::::::.: :. :::::: ::: :::::::::::::::.::.::::..: ::::
CCDS76 NLKRVTLELGGKNPCIVCADADLDLAVECAHQGVFFNQGQCCTAASRVFVEEQVYSEFVR
170 180 190 200 210 220
310 320 330 340 350 360
pF1KE6 RSVERAKRRVVGSPFDPTTEQGPQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFF
:::: ::.: ::.::: ::::::::.::..::::::.:: :::::::::... ::.:
CCDS76 RSVEYAKKRPVGDPFDVKTEQGPQIDQKQFDKILELIESGKKEGAKLECGGSAMEDKGLF
230 240 250 260 270 280
370 380 390 400 410 420
pF1KE6 IEPTVFSNVTDDMRIAKEEIFGPVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKAL
:.:::::.:::.::::::::::::: ::.::...:::.:::..:.::.:::::....:::
CCDS76 IKPTVFSEVTDNMRIAKEEIFGPVQPILKFKSIEEVIKRANSTDYGLTAAVFTKNLDKAL
290 300 310 320 330 340
430 440 450 460 470 480
pF1KE6 TVSSAMQAGTVWINCYNALNAQSPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
..::...::::::::::: ::.:::::::::::::.::..: ::.::::::.:. .::
CCDS76 KLASALESGTVWINCYNALYAQAPFGGFKMSGNGRELGEYALAEYTEVKTVTIKLGDKNP
350 360 370 380 390 400
>>CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 (512 aa)
initn: 1271 init1: 1271 opt: 1271 Z-score: 1581.5 bits: 302.1 E(32554): 9.1e-82
Smith-Waterman score: 2195; 65.9% identity (84.1% similar) in 492 aa overlap (26-479:20-511)
10 20 30 40 50 60
pF1KE6 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP
:: : :::.:.:::::::::..:.::. : . ::
CCDS10 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNP
10 20 30 40 50
70 80 90 100 110 120
pF1KE6 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL
.: ::.:::.:.:: :.::::.::..::. :: :::.:: ::::: .::::::::::.:
CCDS10 STREQICEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATL
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE6 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC
:..:... :::::.::..::.: :.:.::.:::::::.: :::.: . ::::::::::
CCDS10 AALETMDTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTDDNVVCFTRHEPIGVC
120 130 140 150 160 170
190 200 210 220
pF1KE6 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKE------------
: : ::::::::..::.:::::::::.:.::::::::.:::.:.::::
CCDS10 GAITPWNFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVP
180 190 200 210 220 230
230 240 250 260
pF1KE6 --------------------------VGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD
::::..:::.::::::::::::::.: :. ::::
CCDS10 GFGPTVGAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADAD
240 250 260 270 280 290
270 280 290 300 310 320
pF1KE6 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG
:: ::: :::::::::::::::.::.::::..: :::::::: ::.: ::.::: ::::
CCDS10 LDLAVECAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQG
300 310 320 330 340 350
330 340 350 360 370 380
pF1KE6 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG
::::.::..::::::.:: :::::::::... ::.::.:::::.:::.::::::::::
CCDS10 PQIDQKQFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFG
360 370 380 390 400 410
390 400 410 420 430 440
pF1KE6 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ
::: ::.::...:::.:::..:.::.:::::....::: ..::...::::::::::: ::
CCDS10 PVQPILKFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQ
420 430 440 450 460 470
450 460 470 480
pF1KE6 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
.:::::::::::::.::..: ::.::::::.:. .::
CCDS10 APFGGFKMSGNGRELGEYALAEYTEVKTVTIKLGDKNP
480 490 500 510
>>CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 (470 aa)
initn: 1347 init1: 1201 opt: 1201 Z-score: 1494.9 bits: 286.0 E(32554): 6e-77
Smith-Waterman score: 1728; 54.2% identity (73.1% similar) in 498 aa overlap (21-480:20-470)
10 20 30 40 50 60
pF1KE6 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP
:. . .:.:. . :. ..:::::::... : ..::. ::
CCDS55 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNP
10 20 30 40 50
70 80 90 100 110 120
pF1KE6 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL
.::: .:.: :.:::
CCDS55 STGEVICQVAEGDKA---------------------------------------------
60 70
130 140 150 160 170 180
pF1KE6 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC
.:.:..:::.. .. :::. :.: .::::::::: :: :::.:::.:..:::::.:::
CCDS55 --LETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVC
80 90 100 110 120 130
190 200 210 220
pF1KE6 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKE------------
:::::::::::: :::..::: ::.::.: ::::::.:::.. ::::
CCDS55 GQIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVP
140 150 160 170 180 190
230 240 250 260
pF1KE6 --------------------------VGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD
.:..:: ::: ::::::::::::::::::..:::
CCDS55 GFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDAD
200 210 220 230 240 250
270 280 290 300 310 320
pF1KE6 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG
.:.:::::: ..:::::::: :::: ::.:.::.:::.::: ::: ::::.::: ::::
CCDS55 MDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQG
260 270 280 290 300 310
330 340 350 360 370 380
pF1KE6 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG
::.:. :..::: :..: ::::: ::: . .:.::.::::..: : : ::::::::
CCDS55 PQVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFG
320 330 340 350 360 370
390 400 410 420 430 440
pF1KE6 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ
::..::.:::..::. ::::: .::.:::::.:..:: .:.:.::::::.:::....::
CCDS55 PVMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQ
380 390 400 410 420 430
450 460 470 480
pF1KE6 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
:::::.::::.:::.::.::. :.::::::::.:::::
CCDS55 SPFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
440 450 460 470
>>CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 (517 aa)
initn: 1201 init1: 1201 opt: 1201 Z-score: 1494.2 bits: 286.0 E(32554): 6.6e-77
Smith-Waterman score: 2062; 61.0% identity (81.7% similar) in 498 aa overlap (21-480:20-517)
10 20 30 40 50 60
pF1KE6 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP
:. . .:.:. . :. ..:::::::... : ..::. ::
CCDS91 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNP
10 20 30 40 50
70 80 90 100 110 120
pF1KE6 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL
.::: .:.: :.:: :.::::.::: ::.::: :::::::.:::::..::::.::::. :
CCDS91 STGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYL
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE6 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC
:..:.:..:::.. .. :::. :.: .::::::::: :: :::.:::.:..:::::.:::
CCDS91 AALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVC
120 130 140 150 160 170
190 200 210 220
pF1KE6 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKE------------
:::::::::::: :::..::: ::.::.: ::::::.:::.. ::::
CCDS91 GQIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVP
180 190 200 210 220 230
230 240 250 260
pF1KE6 --------------------------VGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD
.:..:: ::: ::::::::::::::::::..:::
CCDS91 GFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDAD
240 250 260 270 280 290
270 280 290 300 310 320
pF1KE6 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG
.:.:::::: ..:::::::: :::: ::.:.::.:::.::: ::: ::::.::: ::::
CCDS91 MDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQG
300 310 320 330 340 350
330 340 350 360 370 380
pF1KE6 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG
::.:. :..::: :..: ::::: ::: . .:.::.::::..: : : ::::::::
CCDS91 PQVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFG
360 370 380 390 400 410
390 400 410 420 430 440
pF1KE6 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ
::..::.:::..::. ::::: .::.:::::.:..:: .:.:.::::::.:::....::
CCDS91 PVMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQ
420 430 440 450 460 470
450 460 470 480
pF1KE6 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
:::::.::::.:::.::.::. :.::::::::.:::::
CCDS91 SPFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
480 490 500 510
>>CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 (517 aa)
initn: 1180 init1: 1180 opt: 1180 Z-score: 1468.1 bits: 281.1 E(32554): 1.9e-75
Smith-Waterman score: 2051; 60.5% identity (81.4% similar) in 501 aa overlap (18-480:17-517)
10 20 30 40 50 60
pF1KE6 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP
: ..: :::: : .: :...:::::::.. : ..::. ::
CCDS66 MLRFLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNP
10 20 30 40 50
70 80 90 100 110 120
pF1KE6 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL
.::: . .: :.:.::.:.::.::: :: ::: :::::::::::::..:::::::::. :
CCDS66 TTGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNRLADLVERDRVYL
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE6 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC
:..:.:..:::: ... .::. :::..::.:::::: :: :::.::..: ::::::.:::
CCDS66 ASLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVGVC
120 130 140 150 160 170
190 200 210 220
pF1KE6 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKE------------
::::::::::.: .::.:::: :::::.: ::::::::::...::::
CCDS66 GQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIIT
180 190 200 210 220 230
230 240 250 260
pF1KE6 --------------------------VGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD
::.:::.::: :::::::::::::::.:..::::
CCDS66 GYGPTAGAAIAQHVDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADAD
240 250 260 270 280 290
270 280 290 300 310 320
pF1KE6 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG
...:::: :...:::.:::: :::: :::::::.::..:.::.::.: ::.::. :.::
CCDS66 MEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQG
300 310 320 330 340 350
330 340 350 360 370 380
pF1KE6 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG
::.::.:....: :: : ::::: :::. .:..::::.::::..: ::::::::::::
CCDS66 PQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFG
360 370 380 390 400 410
390 400 410 420 430 440
pF1KE6 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ
::: ...:: ..::.:::::. .::.::::: :..::. ..:.::::::.: :: .. .
CCDS66 PVQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVTCH
420 430 440 450 460 470
450 460 470 480
pF1KE6 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
.:::::: ::::::.:: ::. :.::::::.:.:::::
CCDS66 TPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS
480 490 500 510
480 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 13:03:37 2016 done: Tue Nov 8 13:03:37 2016
Total Scan time: 1.840 Total Display time: 0.050
Function used was FASTA [36.3.4 Apr, 2011]