FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5485, 517 aa
1>>>pF1KB5485 517 - 517 aa - 517 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.7304+/-0.000956; mu= 15.1575+/- 0.057
mean_var=60.4308+/-12.006, 0's: 0 Z-trim(104.6): 38 B-trim: 154 in 1/48
Lambda= 0.164985
statistics sampled from 7955 (7993) to 7955 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.61), E-opt: 0.2 (0.246), width: 16
Scan time: 2.910
The best scores are: opt bits E(32554)
CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 ( 517) 3456 831.4 0
CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 ( 470) 2652 640.0 1.7e-183
CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 ( 517) 2569 620.2 1.7e-177
CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 518) 2371 573.1 2.6e-163
CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 ( 501) 2352 568.6 5.8e-162
CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 497) 2345 566.9 1.8e-161
CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 512) 2254 545.3 6.2e-155
CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 422) 2083 504.5 9.3e-143
CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 ( 923) 1525 371.8 1.9e-102
CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 801) 1521 370.8 3.2e-102
CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 902) 1521 370.8 3.5e-102
CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 912) 1521 370.8 3.6e-102
CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 405) 1347 329.4 4.9e-90
CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 ( 518) 1262 309.1 7.6e-84
CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 480) 1201 294.6 1.7e-79
CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 487) 1135 278.9 9e-75
CCDS4555.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 535) 906 224.4 2.5e-58
CCDS55057.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 437) 741 185.1 1.4e-46
CCDS9826.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 535) 716 179.2 1e-44
CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 539) 706 176.8 5.4e-44
CCDS61501.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 522) 624 157.3 3.9e-38
CCDS4556.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 548) 602 152.1 1.6e-36
CCDS11212.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 453) 555 140.8 3e-33
CCDS82090.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 380) 504 128.7 1.2e-29
CCDS12766.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 802) 495 126.6 1e-28
CCDS53272.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 503) 432 111.6 2.2e-24
CCDS188.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 563) 432 111.6 2.4e-24
CCDS5172.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 433) 391 101.8 1.6e-21
CCDS31622.1 ALDH3B2 gene_id:222|Hs108|chr11 ( 385) 372 97.3 3.4e-20
CCDS73336.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 431) 368 96.3 7.3e-20
CCDS73335.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 468) 368 96.3 7.8e-20
CCDS11210.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 485) 360 94.4 3e-19
CCDS32589.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 508) 360 94.4 3.2e-19
CCDS81273.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 512) 331 87.5 3.8e-17
CCDS46141.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 751) 264 71.6 3.5e-12
>>CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 (517 aa)
initn: 3456 init1: 3456 opt: 3456 Z-score: 4441.1 bits: 831.4 E(32554): 0
Smith-Waterman score: 3456; 100.0% identity (100.0% similar) in 517 aa overlap (1-517:1-517)
10 20 30 40 50 60
pF1KB5 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 TGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 TGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 ALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 ALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 QIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 QIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 FGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 FGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADM
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 DWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 DWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB5 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQS
430 440 450 460 470 480
490 500 510
pF1KB5 PFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
:::::::::::::::::::::::::::::::::::::
CCDS91 PFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
490 500 510
>>CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 (470 aa)
initn: 3134 init1: 2652 opt: 2652 Z-score: 3407.6 bits: 640.0 E(32554): 1.7e-183
Smith-Waterman score: 3044; 90.9% identity (90.9% similar) in 517 aa overlap (1-517:1-470)
10 20 30 40 50 60
pF1KB5 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 TGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLA
:::::::::::::
CCDS55 TGEVICQVAEGDK-----------------------------------------------
70
130 140 150 160 170 180
pF1KB5 ALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCG
80 90 100 110 120 130
190 200 210 220 230 240
pF1KB5 QIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 QIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPG
140 150 160 170 180 190
250 260 270 280 290 300
pF1KB5 FGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 FGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADM
200 210 220 230 240 250
310 320 330 340 350 360
pF1KB5 DWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 DWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGP
260 270 280 290 300 310
370 380 390 400 410 420
pF1KB5 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP
320 330 340 350 360 370
430 440 450 460 470 480
pF1KB5 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQS
380 390 400 410 420 430
490 500 510
pF1KB5 PFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
:::::::::::::::::::::::::::::::::::::
CCDS55 PFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
440 450 460 470
>>CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 (517 aa)
initn: 2565 init1: 2565 opt: 2569 Z-score: 3300.1 bits: 620.2 E(32554): 1.7e-177
Smith-Waterman score: 2569; 73.6% identity (89.2% similar) in 518 aa overlap (7-517:3-517)
10 20 30 40 50
pF1KB5 MLRAAARF-GPRL----GR--RLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKT
:: .::: :: : :::: .:.: .:.. ::.::::::.::::.::
CCDS66 MLRFLAPRLLSLQGRTARYSSAAA---LPSPILNPDIPYNQLFINNEWQDAVSKKT
10 20 30 40 50
60 70 80 90 100 110
pF1KB5 FPTVNPSTGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIE
::::::.::::: .:::::. :::.:::::: ::.:::::::::::.:::::::::::.:
CCDS66 FPTVNPTTGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNRLADLVE
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB5 RDRTYLAALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRH
:::.:::.:::::::::. :: .::: :.: ::.::::::.::::::.::. : .:::
CCDS66 RDRVYLASLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRH
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 EPVGVCGQIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPG
::::::::::::::::.::.:::.:::::::.:::::::::::.:::.:.::::::::::
CCDS66 EPVGVCGQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPG
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB5 VVNIVPGFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNI
::::. :.:::::::::.: ::::::::::::.:..:: :::.:::::::::::::::.:
CCDS66 VVNIITGYGPTAGAAIAQHVDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSI
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB5 IMSDADMDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFD
...::::. :::: : :::::.::::::::::::.:.::.::.::.: .::.: :::::.
CCDS66 VLADADMEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFE
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB5 SKTEQGPQVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIA
:.::::::. ::...::::. :..::::::::: ..::.::.::::: ::: : ::
CCDS66 LDTQQGPQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIA
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB5 KEEIFGPVMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCY
::::::::. ..::: ::::: ::::. :::::::::.::::: :..::::::::::: :
CCDS66 KEEIFGPVQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTY
420 430 440 450 460 470
480 490 500 510
pF1KB5 DVFGAQSPFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
.. ..::::.: ::.:::::: ::.:::::::::.:::::::
CCDS66 NIVTCHTPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS
480 490 500 510
>>CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 (518 aa)
initn: 2347 init1: 2347 opt: 2371 Z-score: 3045.4 bits: 573.1 E(32554): 2.6e-163
Smith-Waterman score: 2371; 67.3% identity (89.0% similar) in 498 aa overlap (20-517:21-518)
10 20 30 40 50
pF1KB5 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNP
:. . .:.:. . :. ..:::::::... : ..::. ::
CCDS10 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB5 STGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYL
.::: .:.: :.:: :.::::.::: ::.::: :::::::.:::::..::::.::::. :
CCDS10 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB5 AALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVC
:..:.:..:::.. .. :::. :.: .::::::::: :: :::.:::.:..:::::.:::
CCDS10 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB5 GQIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVP
:::::::::::: :::..::: ::.::.: ::::::.:::.. :::::::::::.::.:
CCDS10 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILP
190 200 210 220 230 240
240 250 260 270 280 290
pF1KB5 GFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDAD
:.::::::::::: .::.:::::::.:..:: ::: ::::::::::::::::::..:::
CCDS10 GYGPTAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD
250 260 270 280 290 300
300 310 320 330 340 350
pF1KB5 MDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQG
.:.:::::: ..:::::::: :::: ::.:.::.:::.::: ::: ::::.::: ::::
CCDS10 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG
310 320 330 340 350 360
360 370 380 390 400 410
pF1KB5 PQVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFG
::.:. :..::: :..: ::::: ::: . .:.::.::::..: : : ::::::::
CCDS10 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG
370 380 390 400 410 420
420 430 440 450 460 470
pF1KB5 PVMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQ
::..::.:::..::. ::::: .::.:::::.:..:: .:.:.::::::.:::....::
CCDS10 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ
430 440 450 460 470 480
480 490 500 510
pF1KB5 SPFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
:::::.::::.:::.::.::. :.::::::::.:::::
CCDS10 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
490 500 510
>>CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 (501 aa)
initn: 2344 init1: 2344 opt: 2352 Z-score: 3021.2 bits: 568.6 E(32554): 5.8e-162
Smith-Waterman score: 2352; 68.1% identity (86.8% similar) in 501 aa overlap (17-517:1-501)
10 20 30 40 50 60
pF1KB5 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPS
.:...: .:. . .. ..:::::::::.:: : ::. ::.
CCDS66 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPA
10 20 30 40
70 80 90 100 110 120
pF1KB5 TGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLA
: : .::: ::::::::::::::: :::.::::: ::::.::::: .::::::::: ::
CCDS66 TEEELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLA
50 60 70 80 90 100
130 140 150 160 170 180
pF1KB5 ALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCG
..:....:: : .:: :: .: ::: :::::: .:.::::::.::.::::::.::::
CCDS66 TMESMNGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVCG
110 120 130 140 150 160
190 200 210 220 230 240
pF1KB5 QIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPG
:::::::::.: ::.::::. ::.::.: :::::::::.::.:::::::::::::::::
CCDS66 QIIPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPG
170 180 190 200 210 220
250 260 270 280 290 300
pF1KB5 FGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADM
.::::::::.:: :.::::::::::.:..:. :::.::::::::::::::: :...:::.
CCDS66 YGPTAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADL
230 240 250 260 270 280
310 320 330 340 350 360
pF1KB5 DWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGP
: ::: :: ..:..::::: :.:: ::.:.::::::.::: :::. ..:::. . :::
CCDS66 DNAVEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGP
290 300 310 320 330 340
370 380 390 400 410 420
pF1KB5 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP
:.:. :. ::: :..::.::::: :::: ...:::.:::::..: : : :::::::::
CCDS66 QIDKEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGP
350 360 370 380 390 400
430 440 450 460 470 480
pF1KB5 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQS
:.::.:::....:. ::::. :::.:.:::::.::: .:.:::::::::::: : .::
CCDS66 VQQIMKFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQC
410 420 430 440 450 460
490 500 510
pF1KB5 PFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
::::.::::.::::::::.. ::::::::::. ::::
CCDS66 PFGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS
470 480 490 500
>>CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 (497 aa)
initn: 2345 init1: 2345 opt: 2345 Z-score: 3012.3 bits: 566.9 E(32554): 1.8e-161
Smith-Waterman score: 2345; 69.1% identity (89.8% similar) in 479 aa overlap (39-517:19-497)
10 20 30 40 50 60
pF1KB5 GPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPSTGEVICQV
:::::::... : ..::. ::.::: .:.:
CCDS55 MKNQCETVWLKSPIKLKLIFINNEWQNSESGRVFPVYNPATGEQVCEV
10 20 30 40
70 80 90 100 110 120
pF1KB5 AEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLAALETLDNG
:.:: :.::::.::: ::.::: :::::::.:::::..::::.::::. ::..:.:..:
CCDS55 QEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATMESLNGG
50 60 70 80 90 100
130 140 150 160 170 180
pF1KB5 KPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCGQIIPWNFP
::.. .. :::. :.: .::::::::: :: :::.:::.:..:::::.::::::::::::
CCDS55 KPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQIIPWNFP
110 120 130 140 150 160
190 200 210 220 230 240
pF1KB5 LLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPGFGPTAGAA
::: :::..::: ::.::.: ::::::.:::.. :::::::::::.::.::.:::::::
CCDS55 LLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGPTAGAA
170 180 190 200 210 220
250 260 270 280 290 300
pF1KB5 IASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADMDWAVEQAH
:::: .::.:::::::.:..:: ::: ::::::::::::::::::..:::.:.::::::
CCDS55 IASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAVEQAH
230 240 250 260 270 280
310 320 330 340 350 360
pF1KB5 FALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGPQVDETQFK
..:::::::: :::: ::.:.::.:::.::: ::: ::::.::: ::::::.:. :..
CCDS55 QGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQIDKKQYN
290 300 310 320 330 340
370 380 390 400 410 420
pF1KB5 KILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGPVMQILKFK
::: :..: ::::: ::: . .:.::.::::..: : : ::::::::::..::.::
CCDS55 KILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEILRFK
350 360 370 380 390 400
430 440 450 460 470 480
pF1KB5 TIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQSPFGGYKMS
:..::. ::::: .::.:::::.:..:: .:.:.::::::.:::....:::::::.:::
CCDS55 TMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFGGFKMS
410 420 430 440 450 460
490 500 510
pF1KB5 GSGRELGEYGLQAYTEVKTVTVKVPQKNS
:.:::.::.::. :.::::::::.:::::
CCDS55 GNGREMGEFGLREYSEVKTVTVKIPQKNS
470 480 490
>>CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 (512 aa)
initn: 2236 init1: 2236 opt: 2254 Z-score: 2895.0 bits: 545.3 E(32554): 6.2e-155
Smith-Waterman score: 2254; 66.1% identity (86.4% similar) in 493 aa overlap (24-516:19-511)
10 20 30 40 50 60
pF1KB5 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPS
:.: : .. :: ..::::::::.. : : : : :::
CCDS10 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPS
10 20 30 40 50
70 80 90 100 110 120
pF1KB5 TGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLA
: : ::.: :::: ::::::.::..::: ::::::.:: :::::..::::.::::. ::
CCDS10 TREQICEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLA
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB5 ALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCG
::::.:.:::.. ....::. .. :::.:::::: .::::: : . .:::::.::::
CCDS10 ALETMDTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTDDNVVCFTRHEPIGVCG
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB5 QIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPG
: :::::::: .:::.::: ::..:.: ::::::::::...:::::::::::::::::
CCDS10 AITPWNFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPG
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB5 FGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADM
::::.::::.:: ...:.:::::::.:.... ::. :::::::::::::.: :. .:::.
CCDS10 FGPTVGAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADL
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB5 DWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGP
: ::: :: ..:::::::: :.::.::.:..:.:::.::: ::.: ::.::: ::::::
CCDS10 DLAVECAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGP
300 310 320 330 340 350
370 380 390 400 410 420
pF1KB5 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP
:.:. :: ::: :..::.::::: :::. :.: ::.::::..: :.: :::::::::
CCDS10 QIDQKQFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGP
360 370 380 390 400 410
430 440 450 460 470 480
pF1KB5 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQS
:. :::::.::::. :::.. :::.::::::.:::: :..::..::::.:::... ::.
CCDS10 VQPILKFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQA
420 430 440 450 460 470
490 500 510
pF1KB5 PFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
::::.::::.:::::::.: ::::::::.:. .::
CCDS10 PFGGFKMSGNGRELGEYALAEYTEVKTVTIKLGDKNP
480 490 500 510
>>CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 (422 aa)
initn: 2083 init1: 2083 opt: 2083 Z-score: 2676.4 bits: 504.5 E(32554): 9.3e-143
Smith-Waterman score: 2083; 69.9% identity (90.3% similar) in 422 aa overlap (96-517:1-422)
70 80 90 100 110 120
pF1KB5 CQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLAALETL
::::.:::::..::::.::::. ::..:.:
CCDS45 MDASERGRLLDKLADLVERDRAVLATMESL
10 20 30
130 140 150 160 170 180
pF1KB5 DNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCGQIIPW
..:::.. .. :::. :.: .::::::::: :: :::.:::.:..:::::.:::::::::
CCDS45 NGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQIIPW
40 50 60 70 80 90
190 200 210 220 230 240
pF1KB5 NFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPGFGPTA
:::::: :::..::: ::.::.: ::::::.:::.. :::::::::::.::.::.::::
CCDS45 NFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGPTA
100 110 120 130 140 150
250 260 270 280 290 300
pF1KB5 GAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADMDWAVE
::::::: .::.:::::::.:..:: ::: ::::::::::::::::::..:::.:.:::
CCDS45 GAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAVE
160 170 180 190 200 210
310 320 330 340 350 360
pF1KB5 QAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGPQVDET
::: ..:::::::: :::: ::.:.::.:::.::: ::: ::::.::: ::::::.:.
CCDS45 QAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQIDKK
220 230 240 250 260 270
370 380 390 400 410 420
pF1KB5 QFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGPVMQIL
:..::: :..: ::::: ::: . .:.::.::::..: : : ::::::::::..::
CCDS45 QYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEIL
280 290 300 310 320 330
430 440 450 460 470 480
pF1KB5 KFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQSPFGGY
.:::..::. ::::: .::.:::::.:..:: .:.:.::::::.:::....:::::::.
CCDS45 RFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFGGF
340 350 360 370 380 390
490 500 510
pF1KB5 KMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
::::.:::.::.::. :.::::::::.:::::
CCDS45 KMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
400 410 420
>>CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 (923 aa)
initn: 1521 init1: 894 opt: 1525 Z-score: 1952.9 bits: 371.8 E(32554): 1.9e-102
Smith-Waterman score: 1525; 48.8% identity (76.9% similar) in 480 aa overlap (38-511:444-922)
10 20 30 40 50 60
pF1KB5 FGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPSTGEVICQ
: :::... :: . ::. :.::. : .::.
CCDS31 RKLRGEDQEVELVVDYISKEVNEIMVKMPYQCFINGQFTDADDGKTYDTINPTDGSTICK
420 430 440 450 460 470
70 80 90 100 110 120
pF1KB5 VAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLAALETLDN
:. .. :::::: ::. ::. : : ::.: .::::. :::::.:... ::..:.::.
CCDS31 VSYASLADVDKAVAAAKDAFENGE-WGRMNARERGRLMYRLADLLEENQEELATIEALDS
480 490 500 510 520 530
130 140 150 160 170 180
pF1KB5 GKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPID----GDFFSYTRHEPVGVCGQII
: :... . . : .. .::.::: :: .:.::::. . ...:..::.:::. ::
CCDS31 GAVYTLALKTHIGMSVQTFRYFAGWCDKIQGSTIPINQARPNRNLTFTKKEPLGVCAIII
540 550 560 570 580 590
190 200 210 220 230 240
pF1KB5 PWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPGFGP
:::.::.: ::: . ::.::..:.: :. :::::: :.: .:::: ::.::.:: :
CCDS31 PWNYPLMMLAWKSAACLAAGNTLVLKPAQVTPLTALKFAELSVKAGFPKGVINIIPGSGG
600 610 620 630 640 650
250 260 270 280 290 300
pF1KB5 TAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADMDWA
:: .. : :. :..::::: ::. :. . . ::::.:.:::::::: ::..: ..: :
CCDS31 IAGQRLSEHPDIRKLGFTGSTPIGKQIMKSCAVSNLKKVSLELGGKSPLIIFNDCELDKA
660 670 680 690 700 710
310 320 330 340 350 360
pF1KB5 VEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGPQVD
:... :.:::.:. : :..: ::.:.:.:::: : : . :. .:.:.: .:..:::
CCDS31 VRMGMGAVFFNKGENCIAAGRLFVEESIHDEFVTRVVEEIKKMKIGDPLDRSTDHGPQNH
720 730 740 750 760 770
370 380 390 400 410 420
pF1KB5 ETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGPVMQ
.....:.: : .:: .::: :. :: . :.:..:::: ::.: : .:::: :::.:
CCDS31 KAHLEKLLQYCETGVKEGATLVYGGRQVQRPGFFMEPTVFTDVEDYMYLAKEESFGPIMV
780 790 800 810 820 830
430 440 450 460 470 480
pF1KB5 ILKFKT--IEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQSP
: ::.. :. :. :::.. ::::..:::.:..:: :.:. :.::::..: :. . .:
CCDS31 ISKFQNGDIDGVLQRANSTEYGLASGVFTRDINKAMYVSEKLEAGTVFINTYNKTDVAAP
840 850 860 870 880 890
490 500 510
pF1KB5 FGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
::: :.:: :..::: .:. : ..::::..
CCDS31 FGGVKQSGFGKDLGEEALNEYLKTKTVTLEY
900 910 920
>>CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 (801 aa)
initn: 1521 init1: 899 opt: 1521 Z-score: 1948.8 bits: 370.8 E(32554): 3.2e-102
Smith-Waterman score: 1521; 48.5% identity (75.9% similar) in 489 aa overlap (27-509:311-798)
10 20 30 40 50
pF1KB5 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPT
: :.. . .:.::..:. :: . :: :
CCDS58 STFGDFIQLLVRKLRGDDEEGECSIDYVEMAVNKRTVRMPHQLFIGGEFVDAEGAKTSET
290 300 310 320 330 340
60 70 80 90 100 110
pF1KB5 VNPSTGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDR
.::. : :::::. .. :::::: ::. ::. : : ...: ::::. :::::.:. .
CCDS58 INPTDGSVICQVSLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQ
350 360 370 380 390
120 130 140 150 160 170
pF1KB5 TYLAALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPID----GDFFSYTR
::..:.:: : :... . . : .. .::.::: :: .:.::::. . .. ::
CCDS58 EELATIEALDAGAVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTR
400 410 420 430 440 450
180 190 200 210 220 230
pF1KB5 HEPVGVCGQIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPP
.::::::: :::::.::.: .:: . ::.::.::.: :. :::::: :.: .::.:
CCDS58 KEPVGVCGIIIPWNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPK
460 470 480 490 500 510
240 250 260 270 280 290
pF1KB5 GVVNIVPGFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPN
::::..:: : .: ...: :: :..::::::.:. :. . . ::.:.:.::::::::
CCDS58 GVVNVLPGSGSLVGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPL
520 530 540 550 560 570
300 310 320 330 340 350
pF1KB5 IIMSDADMDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPF
::..: :.. ::... ..:::.:. : :..: ::...:.::::.: : .... ::::.
CCDS58 IIFADCDLNKAVQMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPL
580 590 600 610 620 630
360 370 380 390 400 410
pF1KB5 DSKTEQGPQVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTI
: :..::: .... :.. : . : .::: :.:::. . :.:..:::: ::.: : :
CCDS58 DRDTDHGPQNHHAHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTDVEDHMFI
640 650 660 670 680 690
420 430 440 450 460 470
pF1KB5 AKEEIFGPVMQILKFKT--IEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWV
:::: ::::: : .: .. :..::: . .:::..:::.:..:: :.:. ::::::.:
CCDS58 AKEESFGPVMIISRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFV
700 710 720 730 740 750
480 490 500 510
pF1KB5 NCYDVFGAQSPFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
: :. . .::::.:.:: :..::: .:. : .:::::
CCDS58 NTYNKTDVAAPFGGFKQSGFGKDLGEAALNEYLRVKTVTFEY
760 770 780 790 800
517 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 17:27:18 2016 done: Thu Nov 3 17:27:18 2016
Total Scan time: 2.910 Total Display time: 0.110
Function used was FASTA [36.3.4 Apr, 2011]