FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4181, 902 aa
1>>>pF1KB4181 902 - 902 aa - 902 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.7966+/-0.0011; mu= 17.8765+/- 0.065
mean_var=66.9929+/-13.403, 0's: 0 Z-trim(101.7): 46 B-trim: 0 in 0/51
Lambda= 0.156697
statistics sampled from 6585 (6627) to 6585 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.558), E-opt: 0.2 (0.204), width: 16
Scan time: 3.680
The best scores are: opt bits E(32554)
CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 902) 5987 1363.3 0
CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 912) 5987 1363.3 0
CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 ( 923) 4673 1066.2 0
CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 801) 4501 1027.3 0
CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 518) 1585 368.0 2.5e-101
CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 497) 1583 367.6 3.2e-101
CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 ( 501) 1553 360.8 3.6e-99
CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 ( 517) 1552 360.6 4.3e-99
CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 512) 1517 352.7 1e-96
CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 ( 517) 1512 351.5 2.3e-96
CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 422) 1452 338.0 2.3e-92
CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 ( 470) 1271 297.0 5.2e-80
CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 ( 518) 1140 267.4 4.7e-71
CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 487) 1071 251.8 2.2e-66
CCDS4555.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 535) 987 232.9 1.3e-60
CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 405) 969 228.8 1.6e-59
CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 480) 868 205.9 1.4e-52
CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 539) 706 169.3 1.7e-41
CCDS55057.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 437) 669 160.9 4.6e-39
CCDS5172.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 433) 640 154.4 4.2e-37
CCDS4556.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 548) 641 154.6 4.5e-37
CCDS9826.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 535) 625 151.0 5.4e-36
CCDS61501.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 522) 499 122.5 2e-27
CCDS11212.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 453) 440 109.2 1.8e-23
CCDS53272.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 503) 438 108.7 2.7e-23
CCDS188.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 563) 438 108.8 3e-23
CCDS82090.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 380) 410 102.4 1.7e-21
CCDS11210.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 485) 405 101.3 4.6e-21
CCDS32589.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 508) 405 101.3 4.8e-21
CCDS12766.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 802) 362 91.6 6.2e-18
CCDS56380.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 475) 344 87.5 6.4e-17
CCDS81273.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 512) 328 83.9 8.4e-16
CCDS73335.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 468) 324 83.0 1.5e-15
CCDS73336.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 431) 303 78.2 3.6e-14
CCDS31622.1 ALDH3B2 gene_id:222|Hs108|chr11 ( 385) 293 75.9 1.6e-13
CCDS46141.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 751) 271 71.0 9.1e-12
>>CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 (902 aa)
initn: 5987 init1: 5987 opt: 5987 Z-score: 7307.1 bits: 1363.3 E(32554): 0
Smith-Waterman score: 5987; 99.9% identity (99.9% similar) in 902 aa overlap (1-902:1-902)
10 20 30 40 50 60
pF1KB4 MKIAVIGQSLFGQEVYCHLRKEGHEVVGVFTVPDKDGKADPLGLEAEKDGVPVFKYSRWR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 MKIAVIGQSLFGQEVYCHLRKEGHEVVGVFTVPDKDGKADPLGLEAEKDGVPVFKYSRWR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 AKGQALPDVVAKYQALGAELNVLPFCSQFIPMEIISAPRHGSIIYHPSLLPRHRGASAIN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 AKGQALPDVVAKYQALGAELNVLPFCSQFIPMEIISAPRHGSIIYHPSLLPRHRGASAIN
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 WTLIHGDKKGGFSIFWADDGLDTGDLLLQKECEVLPDDTVSTLYNRFLFPEGIKGMVQAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 WTLIHGDKKGGFSIFWADDGLDTGDLLLQKECEVLPDDTVSTLYNRFLFPEGIKGMVQAV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 RLIAEGKAPRLPQPEEGATYEGIQKKETAKINWDQPAEAIHNWIRGNDKVPGAWTEACEQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 RLIAEGKAPRLPQPEEGATYEGIQKKETAKINWDQPAEAIHNWIRGNDKVPGAWTEACEQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 KLTFFNSTLNTSGLVPEGDALPIPGAHRPGVVTKAGLILFGNDDKMLLVKNIQLEDGKMI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 KLTFFNSTLNTSGLVPEGDALPIPGAHRPGVVTKAGLILFGNDDKMLLVKNIQLEDGKMI
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 LASNFFKGAASSVLELTEAELVTAEAVRSVWQRILPKVLEVEDSTDFFKSGAASVDVVRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 LASNFFKGAASSVLELTEAELVTAEAVRSVWQRILPKVLEVEDSTDFFKSGAASVDVVRL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 VEEVKELCDGLELENEDVYMASTFGDFIQLLVRKLRGDDEEGECSIDYVEMAVNKRTVRM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 VEEVKELCDGLELENEDVYMASTFGDFIQLLVRKLRGDDEEGECSIDYVEMAVNKRTVRM
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB4 PHQLFIGGEFVDAEGAKTSETINPTDGSVICQVSLAQVTDVDKAVAAAKDAFENGRWGKI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 PHQLFIGGEFVDAEGAKTSETINPTDGSVICQVSLAQVTDVDKAVAAAKDAFENGRWGKI
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB4 SARDRGRLMYRLADLMEQHQEELATIEALDAGAVYTLALKTHVGMSIQTFRYFAGWCDKI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 SARDRGRLMYRLADLMEQHQEELATIEALDAGAVYTLALKTHVGMSIQTFRYFAGWCDKI
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB4 QGSTIPINQARPNRNLTLTRKEPVGVCGIIIPWNYPLMMLSWKTAACLAAGNTVVIKPAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 QGSTIPINQARPNRNLTLTRKEPVGVCGIIIPWNYPLMMLSWKTAACLAAGNTVVIKPAQ
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB4 VTPLTALKFAELTLKAGIPKGVVNVLPGSGSLVGQRLSDHPDVRKIGFTGSTEVGKHIMK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 VTPLTALKFAELTLKAGIPKGVVNVLPGSGSLVGQRLSDHPDVRKIGFTGSTEVGKHIMK
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB4 SCAISNVKKVSLELGGKSPLIIFADCDLNKAVQMGMSSVFFNKGENCIAAGRLFVEDSIH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 SCAISNVKKVSLELGGKSPLIIFADCDLNKAVQMGMSSVFFNKGENCIAAGRLFVEDSIH
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB4 DEFVRRVVEEVRKMKVGNPLDRDTDHGPQNHHAHLVKLMEYCQHGVKEGATLVCGGNQVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 DEFVRRVVEEVRKMKVGNPLDRDTDHGPQNHHAHLVKLMEYCQHGVKEGATLVCGGNQVP
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB4 RPGFFFEPTVFTGVEDHMFIAKEESFGPVMIISRFADGDLDAVLSRANATEFGLASGVFT
:::::::::::: :::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 RPGFFFEPTVFTDVEDHMFIAKEESFGPVMIISRFADGDLDAVLSRANATEFGLASGVFT
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB4 RDINKALYVSDKLQAGTVFVNTYNKTDVAAPFGGFKQSGFGKDLGEAALNEYLRVKTVTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 RDINKALYVSDKLQAGTVFVNTYNKTDVAAPFGGFKQSGFGKDLGEAALNEYLRVKTVTF
850 860 870 880 890 900
pF1KB4 EY
::
CCDS30 EY
>>CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 (912 aa)
initn: 5987 init1: 5987 opt: 5987 Z-score: 7307.0 bits: 1363.3 E(32554): 0
Smith-Waterman score: 5987; 99.9% identity (99.9% similar) in 902 aa overlap (1-902:11-912)
10 20 30 40 50
pF1KB4 MKIAVIGQSLFGQEVYCHLRKEGHEVVGVFTVPDKDGKADPLGLEAEKDG
::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 MAGPSNPPATMKIAVIGQSLFGQEVYCHLRKEGHEVVGVFTVPDKDGKADPLGLEAEKDG
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB4 VPVFKYSRWRAKGQALPDVVAKYQALGAELNVLPFCSQFIPMEIISAPRHGSIIYHPSLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 VPVFKYSRWRAKGQALPDVVAKYQALGAELNVLPFCSQFIPMEIISAPRHGSIIYHPSLL
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB4 PRHRGASAINWTLIHGDKKGGFSIFWADDGLDTGDLLLQKECEVLPDDTVSTLYNRFLFP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 PRHRGASAINWTLIHGDKKGGFSIFWADDGLDTGDLLLQKECEVLPDDTVSTLYNRFLFP
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB4 EGIKGMVQAVRLIAEGKAPRLPQPEEGATYEGIQKKETAKINWDQPAEAIHNWIRGNDKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 EGIKGMVQAVRLIAEGKAPRLPQPEEGATYEGIQKKETAKINWDQPAEAIHNWIRGNDKV
190 200 210 220 230 240
240 250 260 270 280 290
pF1KB4 PGAWTEACEQKLTFFNSTLNTSGLVPEGDALPIPGAHRPGVVTKAGLILFGNDDKMLLVK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 PGAWTEACEQKLTFFNSTLNTSGLVPEGDALPIPGAHRPGVVTKAGLILFGNDDKMLLVK
250 260 270 280 290 300
300 310 320 330 340 350
pF1KB4 NIQLEDGKMILASNFFKGAASSVLELTEAELVTAEAVRSVWQRILPKVLEVEDSTDFFKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 NIQLEDGKMILASNFFKGAASSVLELTEAELVTAEAVRSVWQRILPKVLEVEDSTDFFKS
310 320 330 340 350 360
360 370 380 390 400 410
pF1KB4 GAASVDVVRLVEEVKELCDGLELENEDVYMASTFGDFIQLLVRKLRGDDEEGECSIDYVE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 GAASVDVVRLVEEVKELCDGLELENEDVYMASTFGDFIQLLVRKLRGDDEEGECSIDYVE
370 380 390 400 410 420
420 430 440 450 460 470
pF1KB4 MAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQVSLAQVTDVDKAVAAAKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 MAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQVSLAQVTDVDKAVAAAKD
430 440 450 460 470 480
480 490 500 510 520 530
pF1KB4 AFENGRWGKISARDRGRLMYRLADLMEQHQEELATIEALDAGAVYTLALKTHVGMSIQTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 AFENGRWGKISARDRGRLMYRLADLMEQHQEELATIEALDAGAVYTLALKTHVGMSIQTF
490 500 510 520 530 540
540 550 560 570 580 590
pF1KB4 RYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIIIPWNYPLMMLSWKTAACLAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 RYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIIIPWNYPLMMLSWKTAACLAA
550 560 570 580 590 600
600 610 620 630 640 650
pF1KB4 GNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLPGSGSLVGQRLSDHPDVRKIGFTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 GNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLPGSGSLVGQRLSDHPDVRKIGFTG
610 620 630 640 650 660
660 670 680 690 700 710
pF1KB4 STEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKAVQMGMSSVFFNKGENCIAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 STEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKAVQMGMSSVFFNKGENCIAA
670 680 690 700 710 720
720 730 740 750 760 770
pF1KB4 GRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNHHAHLVKLMEYCQHGVKEGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 GRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNHHAHLVKLMEYCQHGVKEGA
730 740 750 760 770 780
780 790 800 810 820 830
pF1KB4 TLVCGGNQVPRPGFFFEPTVFTGVEDHMFIAKEESFGPVMIISRFADGDLDAVLSRANAT
:::::::::::::::::::::: :::::::::::::::::::::::::::::::::::::
CCDS58 TLVCGGNQVPRPGFFFEPTVFTDVEDHMFIAKEESFGPVMIISRFADGDLDAVLSRANAT
790 800 810 820 830 840
840 850 860 870 880 890
pF1KB4 EFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTDVAAPFGGFKQSGFGKDLGEAALN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 EFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTDVAAPFGGFKQSGFGKDLGEAALN
850 860 870 880 890 900
900
pF1KB4 EYLRVKTVTFEY
::::::::::::
CCDS58 EYLRVKTVTFEY
910
>>CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 (923 aa)
initn: 3322 init1: 3322 opt: 4673 Z-score: 5701.5 bits: 1066.2 E(32554): 0
Smith-Waterman score: 4673; 74.1% identity (92.5% similar) in 902 aa overlap (1-902:23-923)
10 20 30
pF1KB4 MKIAVIGQSLFGQEVYCHLRKEGHEVVGVFTVPDKDGK
.:.:.::::::::::: :::::::.:::::::::::::
CCDS31 MLRRGSQALRRFSTGRVYFKNKLKLALIGQSLFGQEVYSHLRKEGHRVVGVFTVPDKDGK
10 20 30 40 50 60
40 50 60 70 80 90
pF1KB4 ADPLGLEAEKDGVPVFKYSRWRAKGQALPDVVAKYQALGAELNVLPFCSQFIPMEIISAP
::::.: :::::.:::: .::.::... .:. :...::::::::::.:::::.::..:
CCDS31 ADPLALAAEKDGTPVFKLPKWRVKGKTIKEVAEAYRSVGAELNVLPFCTQFIPMDIIDSP
70 80 90 100 110 120
100 110 120 130 140 150
pF1KB4 RHGSIIYHPSLLPRHRGASAINWTLIHGDKKGGFSIFWADDGLDTGDLLLQKECEVLPDD
.:::::::::.::::::::::::::: ::::.:::.:::::::::: .:::. :.: :.:
CCDS31 KHGSIIYHPSILPRHRGASAINWTLIMGDKKAGFSVFWADDGLDTGPILLQRSCDVEPND
130 140 150 160 170 180
160 170 180 190 200 210
pF1KB4 TVSTLYNRFLFPEGIKGMVQAVRLIAEGKAPRLPQPEEGATYEGIQKKETAKINWDQPAE
::..::::::::::::.::.::.:::.:::::.::::::::::::::::.:.:.::: ::
CCDS31 TVDALYNRFLFPEGIKAMVEAVQLIADGKAPRIPQPEEGATYEGIQKKENAEISWDQSAE
190 200 210 220 230 240
220 230 240 250 260 270
pF1KB4 AIHNWIRGNDKVPGAWTEACEQKLTFFNSTLNTSGLVPEGDALPIPGAHRPGVVTKAGLI
..::::::.::::::::: : .::..::: .:. :: :. : : ::..::.::: ::.
CCDS31 VLHNWIRGHDKVPGAWTEINGQMVTFYGSTLLNSS-VPPGEPLEIKGAKKPGLVTKNGLV
250 260 270 280 290
280 290 300 310 320 330
pF1KB4 LFGNDDKMLLVKNIQLEDGKMILASNFFKGAASSVLELTEAELVTAEAVRSVWQRILPKV
::::: : : :.:.:.:::::: ::..:. . .::.::: :. .::... .: :: .:
CCDS31 LFGNDGKALTVRNLQFEDGKMIPASQYFSTGETSVVELTAEEVKVAETIKVIWAGILSNV
300 310 320 330 340 350
340 350 360 370 380 390
pF1KB4 LEVEDSTDFFKSGAASVDVVRLVEEVKELCDGLELENEDVYMASTFGDFIQLLVRKLRGD
.:::::::::::.:.::.:::::... : ::.:.:::::::. : ::: .::::::.
CCDS31 PIIEDSTDFFKSGASSMDVARLVEEIRQKCGGLQLQNEDVYMATKFEGFIQKVVRKLRGE
360 370 380 390 400 410
400 410 420 430 440 450
pF1KB4 DEEGECSIDYVEMAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQVSLAQV
:.: : .::. ::. :.::.: ::.:.:.::. .:: .::::::::.::.:: :..
CCDS31 DQEVELVVDYISKEVNEIMVKMPYQCFINGQFTDADDGKTYDTINPTDGSTICKVSYASL
420 430 440 450 460 470
460 470 480 490 500 510
pF1KB4 TDVDKAVAAAKDAFENGRWGKISARDRGRLMYRLADLMEQHQEELATIEALDAGAVYTLA
.::::::::::::::::.::...::.:::::::::::.:..:::::::::::.:::::::
CCDS31 ADVDKAVAAAKDAFENGEWGRMNARERGRLMYRLADLLEENQEELATIEALDSGAVYTLA
480 490 500 510 520 530
520 530 540 550 560 570
pF1KB4 LKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIIIPWNYPLM
::::.:::.::::::::::::::::::::::::::::::.:.:::.:::.::::::::::
CCDS31 LKTHIGMSVQTFRYFAGWCDKIQGSTIPINQARPNRNLTFTKKEPLGVCAIIIPWNYPLM
540 550 560 570 580 590
580 590 600 610 620 630
pF1KB4 MLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLPGSGSLVGQRLS
::.::.:::::::::.:.::::::::::::::::..:::.::::.:..::::...:::::
CCDS31 MLAWKSAACLAAGNTLVLKPAQVTPLTALKFAELSVKAGFPKGVINIIPGSGGIAGQRLS
600 610 620 630 640 650
640 650 660 670 680 690
pF1KB4 DHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKAVQMGMSS
.:::.::.:::::: .::.::::::.::.:::::::::::::::: ::.:.:::.:::..
CCDS31 EHPDIRKLGFTGSTPIGKQIMKSCAVSNLKKVSLELGGKSPLIIFNDCELDKAVRMGMGA
660 670 680 690 700 710
700 710 720 730 740 750
pF1KB4 VFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNHHAHLVKL
::::::::::::::::::.::::::: :::::..:::.:.::::.::::::::.::: ::
CCDS31 VFFNKGENCIAAGRLFVEESIHDEFVTRVVEEIKKMKIGDPLDRSTDHGPQNHKAHLEKL
720 730 740 750 760 770
760 770 780 790 800 810
pF1KB4 MEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTGVEDHMFIAKEESFGPVMIISRFADG
..::. ::::::::: :: :: :::::.:::::: :::.:..::::::::.:.::.: .:
CCDS31 LQYCETGVKEGATLVYGGRQVQRPGFFMEPTVFTDVEDYMYLAKEESFGPIMVISKFQNG
780 790 800 810 820 830
820 830 840 850 860 870
pF1KB4 DLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTDVAAPFGGFKQS
:.:.::.:::.::.::::::::::::::.:::.::.:::::.:::::::::::::: :::
CCDS31 DIDGVLQRANSTEYGLASGVFTRDINKAMYVSEKLEAGTVFINTYNKTDVAAPFGGVKQS
840 850 860 870 880 890
880 890 900
pF1KB4 GFGKDLGEAALNEYLRVKTVTFEY
:::::::: ::::::..::::.::
CCDS31 GFGKDLGEEALNEYLKTKTVTLEY
900 910 920
>>CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 (801 aa)
initn: 4501 init1: 4501 opt: 4501 Z-score: 5492.4 bits: 1027.3 E(32554): 0
Smith-Waterman score: 5084; 88.7% identity (88.7% similar) in 902 aa overlap (1-902:1-801)
10 20 30 40 50 60
pF1KB4 MKIAVIGQSLFGQEVYCHLRKEGHEVVGVFTVPDKDGKADPLGLEAEKDGVPVFKYSRWR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 MKIAVIGQSLFGQEVYCHLRKEGHEVVGVFTVPDKDGKADPLGLEAEKDGVPVFKYSRWR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 AKGQALPDVVAKYQALGAELNVLPFCSQFIPMEIISAPRHGSIIYHPSLLPRHRGASAIN
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 AKGQALPDVVAKYQALGAELNVLPFCSQFIPMEIISAPRHGSIIYHPSLLPRHRGASAI-
70 80 90 100 110
130 140 150 160 170 180
pF1KB4 WTLIHGDKKGGFSIFWADDGLDTGDLLLQKECEVLPDDTVSTLYNRFLFPEGIKGMVQAV
CCDS58 ------------------------------------------------------------
190 200 210 220 230 240
pF1KB4 RLIAEGKAPRLPQPEEGATYEGIQKKETAKINWDQPAEAIHNWIRGNDKVPGAWTEACEQ
::::::::::::::::::::
CCDS58 ----------------------------------------HNWIRGNDKVPGAWTEACEQ
120 130
250 260 270 280 290 300
pF1KB4 KLTFFNSTLNTSGLVPEGDALPIPGAHRPGVVTKAGLILFGNDDKMLLVKNIQLEDGKMI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 KLTFFNSTLNTSGLVPEGDALPIPGAHRPGVVTKAGLILFGNDDKMLLVKNIQLEDGKMI
140 150 160 170 180 190
310 320 330 340 350 360
pF1KB4 LASNFFKGAASSVLELTEAELVTAEAVRSVWQRILPKVLEVEDSTDFFKSGAASVDVVRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 LASNFFKGAASSVLELTEAELVTAEAVRSVWQRILPKVLEVEDSTDFFKSGAASVDVVRL
200 210 220 230 240 250
370 380 390 400 410 420
pF1KB4 VEEVKELCDGLELENEDVYMASTFGDFIQLLVRKLRGDDEEGECSIDYVEMAVNKRTVRM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 VEEVKELCDGLELENEDVYMASTFGDFIQLLVRKLRGDDEEGECSIDYVEMAVNKRTVRM
260 270 280 290 300 310
430 440 450 460 470 480
pF1KB4 PHQLFIGGEFVDAEGAKTSETINPTDGSVICQVSLAQVTDVDKAVAAAKDAFENGRWGKI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 PHQLFIGGEFVDAEGAKTSETINPTDGSVICQVSLAQVTDVDKAVAAAKDAFENGRWGKI
320 330 340 350 360 370
490 500 510 520 530 540
pF1KB4 SARDRGRLMYRLADLMEQHQEELATIEALDAGAVYTLALKTHVGMSIQTFRYFAGWCDKI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 SARDRGRLMYRLADLMEQHQEELATIEALDAGAVYTLALKTHVGMSIQTFRYFAGWCDKI
380 390 400 410 420 430
550 560 570 580 590 600
pF1KB4 QGSTIPINQARPNRNLTLTRKEPVGVCGIIIPWNYPLMMLSWKTAACLAAGNTVVIKPAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 QGSTIPINQARPNRNLTLTRKEPVGVCGIIIPWNYPLMMLSWKTAACLAAGNTVVIKPAQ
440 450 460 470 480 490
610 620 630 640 650 660
pF1KB4 VTPLTALKFAELTLKAGIPKGVVNVLPGSGSLVGQRLSDHPDVRKIGFTGSTEVGKHIMK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 VTPLTALKFAELTLKAGIPKGVVNVLPGSGSLVGQRLSDHPDVRKIGFTGSTEVGKHIMK
500 510 520 530 540 550
670 680 690 700 710 720
pF1KB4 SCAISNVKKVSLELGGKSPLIIFADCDLNKAVQMGMSSVFFNKGENCIAAGRLFVEDSIH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 SCAISNVKKVSLELGGKSPLIIFADCDLNKAVQMGMSSVFFNKGENCIAAGRLFVEDSIH
560 570 580 590 600 610
730 740 750 760 770 780
pF1KB4 DEFVRRVVEEVRKMKVGNPLDRDTDHGPQNHHAHLVKLMEYCQHGVKEGATLVCGGNQVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 DEFVRRVVEEVRKMKVGNPLDRDTDHGPQNHHAHLVKLMEYCQHGVKEGATLVCGGNQVP
620 630 640 650 660 670
790 800 810 820 830 840
pF1KB4 RPGFFFEPTVFTGVEDHMFIAKEESFGPVMIISRFADGDLDAVLSRANATEFGLASGVFT
:::::::::::: :::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 RPGFFFEPTVFTDVEDHMFIAKEESFGPVMIISRFADGDLDAVLSRANATEFGLASGVFT
680 690 700 710 720 730
850 860 870 880 890 900
pF1KB4 RDINKALYVSDKLQAGTVFVNTYNKTDVAAPFGGFKQSGFGKDLGEAALNEYLRVKTVTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 RDINKALYVSDKLQAGTVFVNTYNKTDVAAPFGGFKQSGFGKDLGEAALNEYLRVKTVTF
740 750 760 770 780 790
pF1KB4 EY
::
CCDS58 EY
800
>>CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 (518 aa)
initn: 1304 init1: 973 opt: 1585 Z-score: 1932.8 bits: 368.0 E(32554): 2.5e-101
Smith-Waterman score: 1585; 51.0% identity (77.0% similar) in 478 aa overlap (423-899:39-510)
400 410 420 430 440 450
pF1KB4 RKLRGDDEEGECSIDYVEMAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQ
..::..:. ..:.... . ::. : .:.
CCDS10 PGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNPATGEQVCE
10 20 30 40 50 60
460 470 480 490 500 510
pF1KB4 VSLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQEELATIEALDA
:. :. .:.:::: ::. :: : : ...: .::::. .::::.:. . :::.:.:..
CCDS10 VQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATMESLNG
70 80 90 100 110 120
520 530 540 550 560 570
pF1KB4 GAVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIII
: . :. . . :.::::.::: :::.: :::.. . .:.::.::.:::: ::
CCDS10 GKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVD----GDYFTFTRHEPIGVCGQII
130 140 150 160 170 180
580 590 600 610 620 630
pF1KB4 PWNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLPGSGS
:::.::.:..:: : : :::::::::. :::.:: .. : .::.: ::.:.::: :
CCDS10 PWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGP
190 200 210 220 230 240
640 650 660 670 680 690
pF1KB4 LVGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKA
.: ...: . ::.::::::::: :... . ::.:.:.:::::::: ::::: ::. :
CCDS10 TAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYA
250 260 270 280 290 300
700 710 720 730 740 750
pF1KB4 VQMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNH
:... ..::::.:. : :..:.:::.::..::::: ::.... ::.:.: :..:::
CCDS10 VEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQID
310 320 330 340 350 360
760 770 780 790 800 810
pF1KB4 HAHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTGVEDHMFIAKEESFGPVMI
. . :..: : :: ::: : :::. . : :::.:::::..: : : ::::: ::::.
CCDS10 KKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQE
370 380 390 400 410 420
820 830 840 850 860 870
pF1KB4 ISRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTDVAAP
: :: .: :. ::: ..:::...::: :::::: ::. .:::::..: :: .. .:
CCDS10 ILRFK--TMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSP
430 440 450 460 470 480
880 890 900
pF1KB4 FGGFKQSGFGKDLGEAALNEYLRVKTVTFEY
:::::.:: :...:: .: :: .:::::
CCDS10 FGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
490 500 510
>>CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 (497 aa)
initn: 1302 init1: 973 opt: 1583 Z-score: 1930.6 bits: 367.6 E(32554): 3.2e-101
Smith-Waterman score: 1583; 51.2% identity (76.9% similar) in 477 aa overlap (424-899:19-489)
400 410 420 430 440 450
pF1KB4 KLRGDDEEGECSIDYVEMAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQV
.::..:. ..:.... . ::. : .:.:
CCDS55 MKNQCETVWLKSPIKLKLIFINNEWQNSESGRVFPVYNPATGEQVCEV
10 20 30 40
460 470 480 490 500 510
pF1KB4 SLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQEELATIEALDAG
. :. .:.:::: ::. :: : : ...: .::::. .::::.:. . :::.:.:..:
CCDS55 QEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATMESLNGG
50 60 70 80 90 100
520 530 540 550 560 570
pF1KB4 AVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIIIP
. :. . . :.::::.::: :::.: :::.. . .:.::.::.:::: :::
CCDS55 KPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVD----GDYFTFTRHEPIGVCGQIIP
110 120 130 140 150 160
580 590 600 610 620 630
pF1KB4 WNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLPGSGSL
::.::.:..:: : : :::::::::. :::.:: .. : .::.: ::.:.::: :
CCDS55 WNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGPT
170 180 190 200 210 220
640 650 660 670 680 690
pF1KB4 VGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKAV
.: ...: . ::.::::::::: :... . ::.:.:.:::::::: ::::: ::. ::
CCDS55 AGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAV
230 240 250 260 270 280
700 710 720 730 740 750
pF1KB4 QMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNHH
... ..::::.:. : :..:.:::.::..::::: ::.... ::.:.: :..::: .
CCDS55 EQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQIDK
290 300 310 320 330 340
760 770 780 790 800 810
pF1KB4 AHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTGVEDHMFIAKEESFGPVMII
. :..: : :: ::: : :::. . : :::.:::::..: : : ::::: ::::. :
CCDS55 KQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEI
350 360 370 380 390 400
820 830 840 850 860 870
pF1KB4 SRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTDVAAPF
:: .: :. ::: ..:::...::: :::::: ::. .:::::..: :: .. .::
CCDS55 LRFK--TMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPF
410 420 430 440 450 460
880 890 900
pF1KB4 GGFKQSGFGKDLGEAALNEYLRVKTVTFEY
::::.:: :...:: .: :: .:::::
CCDS55 GGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
470 480 490
>>CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 (501 aa)
initn: 1304 init1: 946 opt: 1553 Z-score: 1893.9 bits: 360.8 E(32554): 3.6e-99
Smith-Waterman score: 1553; 50.6% identity (76.8% similar) in 478 aa overlap (423-899:22-493)
400 410 420 430 440 450
pF1KB4 RKLRGDDEEGECSIDYVEMAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQ
..::..:. :. ..: ..::. .::
CCDS66 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPATEEELCQ
10 20 30 40 50
460 470 480 490 500 510
pF1KB4 VSLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQEELATIEALDA
: .. :::::: ::..::. : : ..: .::::.:.::::.:. . :::.:....
CCDS66 VEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATMESMNG
60 70 80 90 100 110
520 530 540 550 560 570
pF1KB4 GAVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIII
: .:. : . .. :.:.:: ::: ::::: ::::. . .: ::.::.:::: ::
CCDS66 GKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPID----GNFFTYTRHEPIGVCGQII
120 130 140 150 160
580 590 600 610 620 630
pF1KB4 PWNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLPGSGS
:::.::.:: :: . :. :::::.:::. ::::::. : : .::.: ::::..:: :
CCDS66 PWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYGP
170 180 190 200 210 220
640 650 660 670 680 690
pF1KB4 LVGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKA
.: .:.: :. :..::::::::: : .. . ::.:.:.:::::::: :..:: ::..:
CCDS66 TAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDNA
230 240 250 260 270 280
700 710 720 730 740 750
pF1KB4 VQMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNH
:... .::...:. ::::.:.:::.::.:::::: ::...:. .:::: . .:::
CCDS66 VEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQID
290 300 310 320 330 340
760 770 780 790 800 810
pF1KB4 HAHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTGVEDHMFIAKEESFGPVMI
. . :... . : :::: : :::. :.: .::::..: :.: ::::: ::::.
CCDS66 KEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGPVQQ
350 360 370 380 390 400
820 830 840 850 860 870
pF1KB4 ISRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTDVAAP
: .: .:: :..::: : .::..::::.::.::. .:. ::::::.:: :. ... :
CCDS66 IMKFK--SLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQCP
410 420 430 440 450 460
880 890 900
pF1KB4 FGGFKQSGFGKDLGEAALNEYLRVKTVTFEY
:::::.:: :..::: ...:: .:::::
CCDS66 FGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS
470 480 490 500
>>CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 (517 aa)
initn: 1544 init1: 920 opt: 1552 Z-score: 1892.5 bits: 360.6 E(32554): 4.3e-99
Smith-Waterman score: 1552; 50.0% identity (77.5% similar) in 484 aa overlap (420-901:34-511)
390 400 410 420 430 440
pF1KB4 LLVRKLRGDDEEGECSIDYVEMAVNKRTVRMPH-QLFIGGEFVDAEGAKTSETINPTDGS
.:. ::::..:. :: . :: :.::: :
CCDS66 FLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNPTTGE
10 20 30 40 50 60
450 460 470 480 490 500
pF1KB4 VICQVSLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQEELATIE
:: .:. .. .:::.:: ::..::. : : ...: .::::. :::::.:. . ::..:
CCDS66 VIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNRLADLVERDRVYLASLE
70 80 90 100 110 120
510 520 530 540 550 560
pF1KB4 ALDAGAVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVC
.:: : . . . :...:::::: :: .:.:::.. .... .::.::::::
CCDS66 TLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMD----GQHFCFTRHEPVGVC
130 140 150 160 170
570 580 590 600 610 620
pF1KB4 GIIIPWNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLP
: :::::.::.: .:: : ::.:::::.: :. :::.:: .: : .::.: ::::..
CCDS66 GQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIIT
180 190 200 210 220 230
630 640 650 660 670 680
pF1KB4 GSGSLVGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCD
: : .: ...: :: :..::::::::. :.:. . ::.:.:.:::::::: :..:: :
CCDS66 GYGPTAGAAIAQHVDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADAD
240 250 260 270 280 290
690 700 710 720 730 740
pF1KB4 LNKAVQMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHG
...::.. ..::: :. : :..: :::.::..::..:.::.... :::::.. ::..:
CCDS66 MEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQG
300 310 320 330 340 350
750 760 770 780 790 800
pF1KB4 PQNHHAHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTGVEDHMFIAKEESFG
:: . .. ... : : : :::: :.:::.. . :::..:::: ::.: : ::::: ::
CCDS66 PQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFG
360 370 380 390 400 410
810 820 830 840 850 860
pF1KB4 PVMIISRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTD
::. . .: .. :. ::: :..:::..:::::..::.: .. ::::::.::::: .
CCDS66 PVQPLFKFKK--IEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVT
420 430 440 450 460 470
870 880 890 900
pF1KB4 VAAPFGGFKQSGFGKDLGEAALNEYLRVKTVTFEY
.::::::.:: :..::: .:. : .:::::..
CCDS66 CHTPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS
480 490 500 510
>>CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 (512 aa)
initn: 1508 init1: 933 opt: 1517 Z-score: 1849.8 bits: 352.7 E(32554): 1e-96
Smith-Waterman score: 1517; 48.5% identity (76.0% similar) in 480 aa overlap (423-901:33-506)
400 410 420 430 440 450
pF1KB4 RKLRGDDEEGECSIDYVEMAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQ
..::..:. .....: : ::. ::.
CCDS10 TANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPSTREQICE
10 20 30 40 50 60
460 470 480 490 500 510
pF1KB4 VSLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQEELATIEALDA
: .. :::::: ::. ::. : : ...: .::::...::::.:. . ::..:..:.
CCDS10 VEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLAALETMDT
70 80 90 100 110 120
520 530 540 550 560 570
pF1KB4 GAVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIII
: . :. . :.:.:::::: :::::.::: . . . .::.::.:::: :
CCDS10 GKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTD----DNVVCFTRHEPIGVCGAIT
130 140 150 160 170
580 590 600 610 620 630
pF1KB4 PWNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLPGSGS
:::.::.:: :: : : :::.:.:::. :::::: .. : .::.: ::::..:: :
CCDS10 PWNFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPGFGP
180 190 200 210 220 230
640 650 660 670 680 690
pF1KB4 LVGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKA
:: .:.::.. ::.::::::::: . .. . ::.:.:.::::::.: :. :: ::. :
CCDS10 TVGAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADLDLA
240 250 260 270 280 290
700 710 720 730 740 750
pF1KB4 VQMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNH
:. . ..::::.:. : ::.:.:::.....::::: :: ..: ::.:.: :..:::
CCDS10 VECAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGPQID
300 310 320 330 340 350
760 770 780 790 800 810
pF1KB4 HAHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTGVEDHMFIAKEESFGPVMI
. .. :..: . : :::: : :::. . :.:..::::. : :.: ::::: ::::.
CCDS10 QKQFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGPVQP
360 370 380 390 400 410
820 830 840 850 860 870
pF1KB4 ISRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTDVAAP
: .: ... :..:::.:..::...:::....::: ... :..:::..: :: . ::
CCDS10 ILKFK--SIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQAP
420 430 440 450 460 470
880 890 900
pF1KB4 FGGFKQSGFGKDLGEAALNEYLRVKTVTFEY
:::::.:: :..::: :: :: .:::::..
CCDS10 FGGFKMSGNGRELGEYALAEYTEVKTVTIKLGDKNP
480 490 500 510
>>CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 (517 aa)
initn: 1512 init1: 890 opt: 1512 Z-score: 1843.6 bits: 351.5 E(32554): 2.3e-96
Smith-Waterman score: 1512; 48.3% identity (75.7% similar) in 489 aa overlap (412-899:27-509)
390 400 410 420 430 440
pF1KB4 STFGDFIQLLVRKLRGDDEEGECSIDYVEMAVNKRTVRMPHQLFIGGEFVDAEGAKTSET
: :.. . .:.::..:. :: . :: :
CCDS91 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPT
10 20 30 40 50
450 460 470 480 490 500
pF1KB4 INPTDGSVICQVSLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQ
.::. : :::::. .. :::::: ::. ::. : : ...: ::::. :::::.:. .
CCDS91 VNPSTGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDR
60 70 80 90 100 110
510 520 530 540 550 560
pF1KB4 EELATIEALDAGAVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTR
::..:.:: : :... . . : .. .::.::: :: .:.::::. . .. ::
CCDS91 TYLAALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPID----GDFFSYTR
120 130 140 150 160 170
570 580 590 600 610 620
pF1KB4 KEPVGVCGIIIPWNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPK
.::::::: :::::.::.: .:: . ::.::.::.: :. :::::: :.: .::.:
CCDS91 HEPVGVCGQIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPP
180 190 200 210 220 230
630 640 650 660 670 680
pF1KB4 GVVNVLPGSGSLVGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPL
::::..:: : .: ...: :: :..::::::.:. :. . . ::.:.:.::::::::
CCDS91 GVVNIVPGFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPN
240 250 260 270 280 290
690 700 710 720 730 740
pF1KB4 IIFADCDLNKAVQMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPL
::..: :.. ::... ..:::.:. : :..: ::...:.::::.: : .... ::::.
CCDS91 IIMSDADMDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPF
300 310 320 330 340 350
750 760 770 780 790 800
pF1KB4 DRDTDHGPQNHHAHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTGVEDHMFI
: :..::: .... :.. : . : .::: :.:::. . :.:..:::: :.: : :
CCDS91 DSKTEQGPQVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTI
360 370 380 390 400 410
810 820 830 840 850 860
pF1KB4 AKEESFGPVMIISRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFV
:::: ::::: : .: .. :..::: . .:::..:::.:..:: :.:. ::::::.:
CCDS91 AKEEIFGPVMQILKFK--TIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWV
420 430 440 450 460 470
870 880 890 900
pF1KB4 NTYNKTDVAAPFGGFKQSGFGKDLGEAALNEYLRVKTVTFEY
: :. . .::::.:.:: :..::: .:. : .:::::
CCDS91 NCYDVFGAQSPFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
480 490 500 510
902 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 04:39:36 2016 done: Mon Nov 7 04:39:37 2016
Total Scan time: 3.680 Total Display time: 0.260
Function used was FASTA [36.3.4 Apr, 2011]