FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6402, 535 aa
1>>>pF1KE6402 535 - 535 aa - 535 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.7216+/-0.00109; mu= 15.7326+/- 0.065
mean_var=64.3187+/-13.059, 0's: 0 Z-trim(103.0): 41 B-trim: 448 in 2/45
Lambda= 0.159921
statistics sampled from 7171 (7211) to 7171 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.583), E-opt: 0.2 (0.222), width: 16
Scan time: 2.560
The best scores are: opt bits E(32554)
CCDS9826.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 535) 3520 821.3 0
CCDS61501.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 522) 2791 653.1 2.2e-187
CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 ( 518) 800 193.8 4.2e-49
CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 487) 780 189.2 9.7e-48
CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 ( 501) 775 188.0 2.2e-47
CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 512) 768 186.4 6.9e-47
CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 ( 517) 763 185.2 1.5e-46
CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 518) 758 184.1 3.5e-46
CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 497) 752 182.7 8.7e-46
CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 ( 517) 716 174.4 2.8e-43
CCDS4555.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 535) 705 171.9 1.7e-42
CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 ( 923) 679 165.9 1.8e-40
CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 422) 649 158.9 1.1e-38
CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 801) 627 153.9 6.5e-37
CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 902) 627 153.9 7.2e-37
CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 912) 627 153.9 7.3e-37
CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 ( 470) 610 149.9 6e-36
CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 539) 558 138.0 2.8e-32
CCDS5172.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 433) 550 136.1 8.2e-32
CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 405) 439 110.5 3.9e-24
CCDS56380.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 475) 406 102.9 8.9e-22
CCDS53272.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 503) 342 88.1 2.6e-17
CCDS188.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 563) 342 88.1 2.9e-17
CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 480) 323 83.7 5.2e-16
CCDS4556.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 548) 287 75.4 1.9e-13
CCDS55057.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 437) 256 68.3 2.2e-11
CCDS81273.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 512) 248 66.4 9e-11
>>CCDS9826.1 ALDH6A1 gene_id:4329|Hs108|chr14 (535 aa)
initn: 3520 init1: 3520 opt: 3520 Z-score: 4386.4 bits: 821.3 E(32554): 0
Smith-Waterman score: 3520; 100.0% identity (100.0% similar) in 535 aa overlap (1-535:1-535)
10 20 30 40 50 60
pF1KE6 MAALLAAAAVRARILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 MAALLAAAAVRARILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIH
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 NPATNEVIGRVPQATKAEMDAAIASCKRAFPAWADTSVLSRQQVLLRYQQLIKENLKEIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 NPATNEVIGRVPQATKAEMDAAIASCKRAFPAWADTSVLSRQQVLLRYQQLIKENLKEIA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 KLITLEQGKTLADAEGDVFRGLQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLGVCA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 KLITLEQGKTLADAEGDVFRGLQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLGVCA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 GIAPFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNIIHG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 GIAPFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNIIHG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE6 QHEAVNFICDHPDIKAISFVGSNKAGEYIFERGSRHGKRVQANMGAKNHGVVMPDANKEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 QHEAVNFICDHPDIKAISFVGSNKAGEYIFERGSRHGKRVQANMGAKNHGVVMPDANKEN
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE6 TLNQLVGAAFGAAGQRCMALSTAVLVGEAKKWLPELVEHAKNLRVNAGDQPGADLGPLIT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 TLNQLVGAAFGAAGQRCMALSTAVLVGEAKKWLPELVEHAKNLRVNAGDQPGADLGPLIT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE6 PQAKERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIISNVKPNMTCYKEEIFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 PQAKERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIISNVKPNMTCYKEEIFG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE6 PVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVNVPIPVPLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 PVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVNVPIPVPLP
430 440 450 460 470 480
490 500 510 520 530
pF1KE6 MFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPTMGR
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 MFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPTMGR
490 500 510 520 530
>>CCDS61501.1 ALDH6A1 gene_id:4329|Hs108|chr14 (522 aa)
initn: 2787 init1: 2787 opt: 2791 Z-score: 3477.6 bits: 653.1 E(32554): 2.2e-187
Smith-Waterman score: 3406; 97.6% identity (97.6% similar) in 535 aa overlap (1-535:1-522)
10 20 30 40 50 60
pF1KE6 MAALLAAAAVRARILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 MAALLAAAAVRARILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIH
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 NPATNEVIGRVPQATKAEMDAAIASCKRAFPAWADTSVLSRQQVLLRYQQLIKENLKEIA
::::::::::::::::::::::::::::::::::::::::::: ::::
CCDS61 NPATNEVIGRVPQATKAEMDAAIASCKRAFPAWADTSVLSRQQ-------------KEIA
70 80 90 100
130 140 150 160 170 180
pF1KE6 KLITLEQGKTLADAEGDVFRGLQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLGVCA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 KLITLEQGKTLADAEGDVFRGLQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLGVCA
110 120 130 140 150 160
190 200 210 220 230 240
pF1KE6 GIAPFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNIIHG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 GIAPFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNIIHG
170 180 190 200 210 220
250 260 270 280 290 300
pF1KE6 QHEAVNFICDHPDIKAISFVGSNKAGEYIFERGSRHGKRVQANMGAKNHGVVMPDANKEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 QHEAVNFICDHPDIKAISFVGSNKAGEYIFERGSRHGKRVQANMGAKNHGVVMPDANKEN
230 240 250 260 270 280
310 320 330 340 350 360
pF1KE6 TLNQLVGAAFGAAGQRCMALSTAVLVGEAKKWLPELVEHAKNLRVNAGDQPGADLGPLIT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 TLNQLVGAAFGAAGQRCMALSTAVLVGEAKKWLPELVEHAKNLRVNAGDQPGADLGPLIT
290 300 310 320 330 340
370 380 390 400 410 420
pF1KE6 PQAKERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIISNVKPNMTCYKEEIFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 PQAKERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIISNVKPNMTCYKEEIFG
350 360 370 380 390 400
430 440 450 460 470 480
pF1KE6 PVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVNVPIPVPLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 PVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVNVPIPVPLP
410 420 430 440 450 460
490 500 510 520 530
pF1KE6 MFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPTMGR
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 MFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPTMGR
470 480 490 500 510 520
>>CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 (518 aa)
initn: 689 init1: 371 opt: 800 Z-score: 995.1 bits: 193.8 E(32554): 4.2e-49
Smith-Waterman score: 800; 30.5% identity (62.1% similar) in 515 aa overlap (10-512:3-507)
10 20 30 40 50
pF1KE6 MAALLAAAAVRARILQVSSKVKS-SPTWYSASSFSSSVPTVKL-FIGGKFVESKSDKWID
.:: . .: ..: :. .: : .. : . : . :: :: . . .
CCDS12 MFLRAGLAALSPLLRSLRPSPVAAMSTGTFVVSQPLNYRGGARVEPADASGTE
10 20 30 40 50
60 70 80 90 100 110
pF1KE6 -IHNPATNEVIGRVPQATKAEMDAAIASCKRAFPAWADTSVLSRQQVLLRYQQLIKENLK
.:::..::. . . :.. :. . : :: :.. : . : ..::. ..:.:
CCDS12 KAFEPATGRVIATFTCSGEKEVNLAVQNAKAAFKIWSQKSGMERCRILLEAARIIRERED
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE6 EIAKLITLEQGKTLADAEGDVFRGLQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLG
::: . ...::.. .:. :. . : .:. .... : :: . .. :. : :::
CCDS12 EIATMECINNGKSIFEARLDIDISWQCLEYYAGLAASMAGEHIQLPGGSFG-YTRREPLG
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE6 VCAGIAPFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNI
::.::. .:.: .: : :..:::....::: .: ...:::.. ...:.: : .:.
CCDS12 VCVGIGAWNYPFQIASWKSAPALACGNAMVFKPSPFTPVSALLLAEIYSEAGVPPGLFNV
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE6 IHGQHEAVNFICDHPDIKAISFVGSNKAGEYIFERGSRHGKRVQANMGAKNHGVVMPDAN
..: . .:.:.:::. .::.:: .: :.: ... : : ..:.:. ... : .
CCDS12 VQGGAATGQFLCQHPDVAKVSFTGSVPTGMKIMEMSAKGIKPVTLELGGKSPLIIFSDCD
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE6 KENTLNQLVGAAFGAAGQRCMALSTAVLVGEA--KKWLPELVEHAKNLRVNAGDQPGAD-
.:... . : : . :: : .: :.: . :. :.:.... :.. :: :
CCDS12 MNNAVKGALMANFLTQGQVCCN-GTRVFVQKEILDKFTEEVVKQTQ--RIKIGDPLLEDT
300 310 320 330 340
360 370 380 390 400 410
pF1KE6 -LGPLITPQAKERVCNLIDSGTKEGASILLDGRKIKVK---GYENGNFVGPTIISNVKPN
.::::. ::: ... . ..::..: : : : ..: .. : ...: . .
CCDS12 RMGPLINRPHLERVLGFVKVAKEQGAKVLCGG-DIYVPEDPKLKDGYYMRPCVLTNCRDD
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE6 MTCYKEEIFGPVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVG
::: ::::::::. .: .: :... .:.. .: ....:: . :.. . ...:
CCDS12 MTCVKEEIFGPVMSILSFDTEAEVLERANDTTFGLAAGVFTRDIQRAHRVVAELQAGTCF
410 420 430 440 450 460
480 490 500 510 520
pF1KE6 VNVPI--PVPLPMFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAV
.: :: :: : : ..: : : :. :..:.::::.
CCDS12 INNYNVSPVELP---FGGYKKSGFGREN--GRVTIEYYSQLKTVCVEMGDVESAF
470 480 490 500 510
530
pF1KE6 VMPTMGR
>>CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 (487 aa)
initn: 651 init1: 203 opt: 780 Z-score: 970.6 bits: 189.2 E(32554): 9.7e-48
Smith-Waterman score: 780; 31.3% identity (64.9% similar) in 479 aa overlap (43-513:13-484)
20 30 40 50 60 70
pF1KE6 RILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIHNPATNEVIGRVP
:: :::. .: .:: ..:.:.:: :::
CCDS51 MAGTNALLMLENFIDGKFLPCSS--YIDSYDPSTGEVYCRVP
10 20 30 40
80 90 100 110 120 130
pF1KE6 QATKAEMDAAIASCKRAFPAWADTSVLSRQQVLLRYQQLIKENLKEIAKLITLEQGKTLA
.. : :..::. . ..:::.:.. : :..:: . .:....:.:.:. . .::::::
CCDS51 NSGKDEIEAAVKAAREAFPSWSSRSPQERSRVLNQVADLLEQSLEEFAQAESKDQGKTLA
50 60 70 80 90 100
140 150 160 170 180 190
pF1KE6 DAEG-DVFRGLQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLGVCAGIAPFNFPAMI
:. :. :..: . : . .: :. : :.:: . :.:.:.: ..
CCDS51 LARTMDIPRSVQNFRFFASSSLHHTSECTQMDHLGCMHYTVRAPVGVAGLISPWNLPLYL
110 120 130 140 150 160
200 210 220 230 240 250
pF1KE6 PLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNIIHGQHEAVNF-ICD
: . ::. ::: . :::: . .. .: :::. .:.: :..::. : :. . .
CCDS51 LTWKIAPAMAAGNTVIAKPSELTSVTAWMLCKLLDKAGVPPGVVNIVFGTGPRVGEALVS
170 180 190 200 210 220
260 270 280 290 300 310
pF1KE6 HPDIKAISFVGSNKAGEYIFERGSRHGKRVQANMGAKNHGVVMPDANKENTLNQLVGAAF
::.. :::.::. ..: : . .. : :... ..:.:: .... ::: .. . : ..:
CCDS51 HPEVPLISFTGSQPTAERITQLSAPHCKKLSLELGGKNPAIIFEDANLDECIPATVRSSF
230 240 250 260 270 280
320 330 340 350 360
pF1KE6 GAAGQRCMALSTAVLVGEA--KKWLPELVEHAKNLRVNAGDQPGADLGPLITPQAKERVC
. :. :. : ..: .. ...: ..:: ... .:. ..: ...: ::. :.:
CCDS51 ANQGEICLCTSR-IFVQKSIYSEFLKRFVEATRKWKVGIPSDPLVSIGALISKAHLEKVR
290 300 310 320 330
370 380 390 400 410 420
pF1KE6 NLIDSGTKEGASIL----LDGRKIKVKGYENGNFVGPTIISNVKPNMTCYKEEIFGPVLV
. . . :::.: .: .. ... . : :. ::.:...: . :. :::::::
CCDS51 SYVKRALAEGAQIWCGEGVDKLSLPARN-QAGYFMLPTVITDIKDESCCMTEEIFGPVTC
340 350 360 370 380 390
430 440 450 460 470 480
pF1KE6 VLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVNVPIPVPLPMFSF
:. .. .:.:. .:: :: .......: . ... :. .. : : .: . : . :
CCDS51 VVPFDSEEEVIERANNVKYGLAATVWSSNVGRVHRVAKKLQSGLVWTNCWLIRELNL-PF
400 410 420 430 440 450
490 500 510 520 530
pF1KE6 TGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPTMGR
: .:: : . .:.. .:.:..::::
CCDS51 GGMKSSGIGREG--AKDSYDFFTEIKTITVKH
460 470 480
>>CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 (501 aa)
initn: 554 init1: 222 opt: 775 Z-score: 964.1 bits: 188.0 E(32554): 2.2e-47
Smith-Waterman score: 775; 30.4% identity (63.9% similar) in 493 aa overlap (37-521:18-501)
10 20 30 40 50 60
pF1KE6 AAAVRARILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIHNPATNE
. .:.::.... .: : : . . ::::.:
CCDS66 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPATEE
10 20 30 40
70 80 90 100 110 120
pF1KE6 VIGRVPQATKAEMDAAIASCKRAFPA---WADTSVLSRQQVLLRYQQLIKENLKEIAKLI
. .: .. : ..: :. . ..:: : .. : ..: . .::... .: .
CCDS66 ELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATME
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE6 TLEQGKTLADAEGDVFRG-LQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLGVCAGI
... :: ..: . . : ...... . .. ..:.:.: : .. :. . :.:::. :
CCDS66 SMNGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIP-IDGNFFTYTRHEPIGVCGQI
110 120 130 140 150 160
190 200 210 220 230 240
pF1KE6 APFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNIIHGQH
:.::: .. .: . :. :::: ..::.:..: ... .:.:....: : :..::. :
CCDS66 IPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYG
170 180 190 200 210 220
250 260 270 280 290 300
pF1KE6 EAVNF-ICDHPDIKAISFVGSNKAGEYIFER-GSRHGKRVQANMGAKNHGVVMPDANKEN
... : .: :: ..:.::...:. : : :. . ::: ..:.:. .:. ::. .:
CCDS66 PTAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDN
230 240 250 260 270 280
310 320 330 340 350
pF1KE6 TLNQLVGAAFGAAGQRCMALSTAVLVGEA--KKWLPELVEHAKNLRVNAGDQPGADLGPL
... ..: :: :.: : ..: :. ... . ::.::. .. ::. ::
CCDS66 AVEFAHHGVFYHQGQCCIAASR-IFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQ
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE6 ITPQAKERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIISNVKPNMTCYKEEI
: . ... .::.:: ::::.. : ::: :: ::..::: .: ::::
CCDS66 IDKEQYDKILDLIESGKKEGAKLECGGGPWGNKGY----FVQPTVFSNVTDEMRIAKEEI
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE6 FGPVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVNVPIPVP
:::: ... ..::..:. .::. :: ....:: . : . ...: : :: :
CCDS66 FGPVQQIMKFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNC-YGVV
410 420 430 440 450 460
480 490 500 510 520 530
pF1KE6 LPMFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPTMGR
. : : . : :. :. :.. ::..::.: . .....
CCDS66 SAQCPFGGFKMS--GNGRELGEYGFHEYTEVKTVTVKISQKNS
470 480 490 500
>>CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 (512 aa)
initn: 654 init1: 215 opt: 768 Z-score: 955.2 bits: 186.4 E(32554): 6.9e-47
Smith-Waterman score: 768; 31.8% identity (63.9% similar) in 485 aa overlap (37-513:29-504)
10 20 30 40 50 60
pF1KE6 AAAVRARILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIHNPATNE
: .:.::.... :::: : . ::.: :
CCDS10 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPSTRE
10 20 30 40 50
70 80 90 100 110 120
pF1KE6 VIGRVPQATKAEMDAAIASCKRAFP---AWADTSVLSRQQVLLRYQQLIKENLKEIAKLI
: .: .. : ..: :. . . :: : ..::: ..: . .:.... .: :
CCDS10 QICEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLAALE
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE6 TLEQGKTLADAEGDVFRG-LQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLGVCAGI
:.. :: . : ..: ...... . .. ..:.:.:. .. .. . :.:::..:
CCDS10 TMDTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPT-DDNVVCFTRHEPIGVCGAI
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE6 APFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNIIHGQH
.:.::: .. .: . :. ::::...::.:..: ... :..:....: : :..::. :
CCDS10 TPWNFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPGFG
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE6 EAVNF-ICDHPDIKAISFVGSNKAGEYIFERGSRHG-KRVQANMGAKNHGVVMPDANKEN
.:. : .::.:. :.:.::...:. . : .:: . ::: ..:.:: .: ::. .
CCDS10 PTVGAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADLDL
240 250 260 270 280 290
310 320 330 340 350
pF1KE6 TLNQLVGAAFGAAGQRCMALSTAVLVGEA--KKWLPELVEHAKNLRVNAGDQPGADLGPL
... ..: :: : : : :.: : .... . ::.::. :. . .. ::
CCDS10 AVECAHQGVFFNQGQCCTAASR-VFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGPQ
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE6 ITPQAKERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIISNVKPNMTCYKEEI
: . ... .::.:: ::::.. : .. :: :. ::..:.: :: ::::
CCDS10 IDQKQFDKILELIESGKKEGAKLECGGSAMEDKGL----FIKPTVFSEVTDNMRIAKEEI
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE6 FGPVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVNVPIPVP
:::: .:. ....:.:. .:.. :: .:.:: : : : : .. : : .: .
CCDS10 FGPVQPILKFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNAL-
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE6 LPMFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPTMGR
. : : . : :. :. .. ::..::.:
CCDS10 YAQAPFGGFKMS--GNGRELGEYALAEYTEVKTVTIKLGDKNP
480 490 500 510
>>CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 (517 aa)
initn: 637 init1: 205 opt: 763 Z-score: 948.9 bits: 185.2 E(32554): 1.5e-46
Smith-Waterman score: 763; 29.5% identity (63.5% similar) in 526 aa overlap (4-521:1-517)
10 20 30 40 50 60
pF1KE6 MAALLAAAAVRARILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIH
.: : : :: . :: . . .. ..: .:::.... .. : : .
CCDS66 MLRFLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTV
10 20 30 40 50
70 80 90 100 110
pF1KE6 NPATNEVIGRVPQATKAEMDAAIASCKRAF---PAWADTSVLSRQQVLLRYQQLIKENLK
::.:.::::.: .. .:..: :. . ..:: : .. : ..: : .:....
CCDS66 NPTTGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNRLADLVERDRV
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE6 EIAKLITLEQGKTLADAEG-DVFRGLQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPL
.:.: ::..:: . .. . :. . ..: .. . .. :.:.: . . .. . :.
CCDS66 YLASLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIP-MDGQHFCFTRHEPV
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE6 GVCAGIAPFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLN
:::. : :.::: .. : . :.. ::: .:: .:..: ... ::.:....: : :..:
CCDS66 GVCGQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVN
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE6 IIHGQHEAVNF-ICDHPDIKAISFVGSNKAGEYIFER-GSRHGKRVQANMGAKNHGVVMP
:: : ... : .: :. ..:.::...:. : . :. . ::: ..:.:. ..:.
CCDS66 IITGYGPTAGAAIAQHVDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLA
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE6 DANKENTLNQLVGAAFGAAGQRCMALSTAVLVGEA--KKWLPELVEHAKNLRVNAGDQPG
::. :....: : : :: : : : . .: :. ...: . ::.::. .:. .
CCDS66 DADMEHAVEQCHEALFFNMGQCCCAGSRT-FVEESIYNEFLERTVEKAKQRKVGNPFELD
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE6 ADLGPLITPQAKERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIISNVKPNMT
.. :: . . ::: . :. : ::::..: :... .:. :. ::....:. .:
CCDS66 TQQGPQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGF----FIKPTVFGGVQDDMR
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE6 CYKEEIFGPVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVN
:::::::: ... . ..:... .::. :: ..:.:: . : ... ...: : ::
CCDS66 IAKEEIFGPVQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVN
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE6 VPIPVPLPMFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPT
. . : : . : :. :..:.. ::..::.: . ....
CCDS66 T-YNIVTCHTPFGGFKES--GNGRELGEDGLKAYTEVKTVTIKVPQKNS
480 490 500 510
pF1KE6 MGR
>>CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 (518 aa)
initn: 616 init1: 203 opt: 758 Z-score: 942.7 bits: 184.1 E(32554): 3.5e-46
Smith-Waterman score: 766; 28.9% identity (63.4% similar) in 522 aa overlap (15-521:6-518)
10 20 30 40 50
pF1KE6 MAALLAAAAVRARILQVSSKVKSSPTWYSASSFSSSVPT-------VKLFIGGKFVESKS
... ..::..:. :: :: .:.::.... .:.:
CCDS10 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSES
10 20 30 40 50
60 70 80 90 100 110
pF1KE6 DKWIDIHNPATNEVIGRVPQATKAEMDAAIASCKRAFP---AWADTSVLSRQQVLLRYQQ
. . ..::::.: . .: .: ::..: :. . . :: .: .. : ..: . .
CCDS10 GRVFPVYNPATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLAD
60 70 80 90 100 110
120 130 140 150 160
pF1KE6 LIKENLKEIAKLITLEQGKTLADAEGDVFRG-LQVVEHACSVTSLMMGETMPSITKDMDL
:.... .: . .:. :: . .: ..: ... .. . .. . : :.: . :.
CCDS10 LVERDRAVLATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIP-VDGDYFT
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE6 YSYRLPLGVCAGIAPFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSG
.. . :.:::. : :.::: .. : . :. :::: ..::.:..: ... .. :....:
CCDS10 FTRHEPIGVCGQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAG
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE6 APDGTLNIIHGQHEAVNF-ICDHPDIKAISFVGSNKAGEYIFERGSRHG-KRVQANMGAK
: :..::. : ... : .: : :.:.::...:. : : ..: . ::: ..:.:
CCDS10 FPPGVINILPGYGPTAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGK
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE6 NHGVVMPDANKENTLNQLVGAAFGAAGQRCMALSTAVLVGEA--KKWLPELVEHAKNLRV
. .... ::. . ...: ..: :: : : : ..: :. .... . ::.:: :
CCDS10 SPNIIFADADLDYAVEQAHQGVFFNQGQCCTAGSR-IFVEESIYEEFVRRSVERAKRRVV
300 310 320 330 340
350 360 370 380 390 400
pF1KE6 NAGDQPGADLGPLITPQAKERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIIS
.. .: .. :: : . ... .::.::. :::.. :. . ::. :. ::..:
CCDS10 GSPFDPTTEQGPQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGF----FIEPTVFS
350 360 370 380 390 400
410 420 430 440 450 460
pF1KE6 NVKPNMTCYKEEIFGPVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVD
:: .: :::::::: .:. .:.::.:. .::. .: .:.::.. : . ..
CCDS10 NVTDDMRIAKEEIFGPVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQ
410 420 430 440 450 460
470 480 490 500 510 520
pF1KE6 VGQVGVNVPIPVPLPMFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSS
.: : .: . . : : . : :. .:. :.. :...::.: . ....
CCDS10 AGTVWINCYNALN-AQSPFGGFKMS--GNGREMGEFGLREYSEVKTVTVKIPQKNS
470 480 490 500 510
530
pF1KE6 PAVVMPTMGR
>>CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 (497 aa)
initn: 609 init1: 203 opt: 752 Z-score: 935.5 bits: 182.7 E(32554): 8.7e-46
Smith-Waterman score: 752; 28.8% identity (64.2% similar) in 497 aa overlap (33-521:10-497)
10 20 30 40 50 60
pF1KE6 ALLAAAAVRARILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIHNP
..: . .::.... .:.: . . ..::
CCDS55 MKNQCETVWLKSPIKLKLIFINNEWQNSESGRVFPVYNP
10 20 30
70 80 90 100 110
pF1KE6 ATNEVIGRVPQATKAEMDAAIASCKRAFP---AWADTSVLSRQQVLLRYQQLIKENLKEI
::.: . .: .: ::..: :. . . :: .: .. : ..: . .:.... .
CCDS55 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL
40 50 60 70 80 90
120 130 140 150 160 170
pF1KE6 AKLITLEQGKTLADAEGDVFRG-LQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLGV
: . .:. :: . .: ..: ... .. . .. . : :.: . :. .. . :.::
CCDS55 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIP-VDGDYFTFTRHEPIGV
100 110 120 130 140 150
180 190 200 210 220 230
pF1KE6 CAGIAPFNFPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNII
:. : :.::: .. : . :. :::: ..::.:..: ... .. :....: : :..::.
CCDS55 CGQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINIL
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE6 HGQHEAVNF-ICDHPDIKAISFVGSNKAGEYIFERGSRHG-KRVQANMGAKNHGVVMPDA
: ... : .: : :.:.::...:. : : ..: . ::: ..:.:. .... ::
CCDS55 PGYGPTAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADA
220 230 240 250 260 270
300 310 320 330 340 350
pF1KE6 NKENTLNQLVGAAFGAAGQRCMALSTAVLVGEA--KKWLPELVEHAKNLRVNAGDQPGAD
. . ...: ..: :: : : .. ..: :. .... . ::.:: :.. .: ..
CCDS55 DLDYAVEQAHQGVFFNQGQCCTA-GSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTE
280 290 300 310 320 330
360 370 380 390 400 410
pF1KE6 LGPLITPQAKERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIISNVKPNMTCY
:: : . ... .::.::. :::.. :. . ::. :. ::..::: .:
CCDS55 QGPQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGF----FIEPTVFSNVTDDMRIA
340 350 360 370 380 390
420 430 440 450 460 470
pF1KE6 KEEIFGPVLVVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVNVP
:::::::: .:. .:.::.:. .::. .: .:.::.. : . ...: : .:
CCDS55 KEEIFGPVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCY
400 410 420 430 440 450
480 490 500 510 520 530
pF1KE6 IPVPLPMFSFTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPTMG
. . : : . : :. .:. :.. :...::.: . ....
CCDS55 NALN-AQSPFGGFKMS--GNGREMGEFGLREYSEVKTVTVKIPQKNS
460 470 480 490
pF1KE6 R
>>CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 (517 aa)
initn: 544 init1: 203 opt: 716 Z-score: 890.3 bits: 174.4 E(32554): 2.8e-43
Smith-Waterman score: 716; 30.1% identity (61.3% similar) in 488 aa overlap (41-521:38-517)
20 30 40 50 60 70
pF1KE6 RARILQVSSKVKSSPTWYSASSFSSSVPTVKLFIGGKFVESKSDKWIDIHNPATNEVIGR
..::.... .. : : . ::.:.::: .
CCDS91 FGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPSTGEVICQ
10 20 30 40 50 60
80 90 100 110 120
pF1KE6 VPQATKAEMDAAIASCKRAFP---AWADTSVLSRQQVLLRYQQLIKENLKEIAKLITLEQ
: .. : ..: :. . . :: : .. : ..: : .::... .: : ::..
CCDS91 VAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLAALETLDN
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 GKT-LADAEGDVFRGLQVVEHACSVTSLMMGETMPSITKDMDLYSYRLPLGVCAGIAPFN
:: . . :. :. ... . .. . :.:.: : :. :. . :.:::. : :.:
CCDS91 GKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIP-IDGDFFSYTRHEPVGVCGQIIPWN
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 FPAMIPLWMFPMAMVCGNTFLMKPSERVPGATMLLAKLLQDSGAPDGTLNIIHG-QHEAV
:: .. : . :.. ::. .:: .:..: ... .:.:....: : :..::. : :
CCDS91 FPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPGFGPTAG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE6 NFICDHPDIKAISFVGSNKAGEYI-FERGSRHGKRVQANMGAKNHGVVMPDANKENTLNQ
: .: :. ..:.::.. :. : :: . ::: ..:.:. ...: ::. . ...:
CCDS91 AAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADMDWAVEQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE6 LVGAAFGAAGQRCMALS-TAVLVGEAKKWLPELVEHAKNLRVNAGDQPGADLGPLITPQA
: : :: : : : : : ... . : .::. :. . .. :: .
CCDS91 AHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGPQVDETQ
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE6 KERVCNLIDSGTKEGASILLDGRKIKVKGYENGNFVGPTIISNVKPNMTCYKEEIFGPVL
... . :..: .:::..: : .:: :. ::....:. .:: ::::::::.
CCDS91 FKKILGYINTGKQEGAKLLCGGGIAADRGY----FIQPTVFGDVQDGMTIAKEEIFGPVM
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE6 VVLETETLDEAIQIVNNNPYGNGTAIFTTNGATARKYAHLVDVGQVGVNVPIPVPLPMFS
.:. .:..:.. .::. :: ..:.:: . : .. ...: : :: : .
CCDS91 QILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNC-YDVFGAQSP
430 440 450 460 470 480
490 500 510 520 530
pF1KE6 FTGSRSSFRGDTNFYGKQGIQFYTQLKTITSQWKEEDATLSSPAVVMPTMGR
: : . : :. :. :.: ::..::.: . ....
CCDS91 FGGYKMS--GSGRELGEYGLQAYTEVKTVTVKVPQKNS
490 500 510
535 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 12:55:34 2016 done: Tue Nov 8 12:55:34 2016
Total Scan time: 2.560 Total Display time: 0.090
Function used was FASTA [36.3.4 Apr, 2011]