FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4487, 508 aa
1>>>pF1KE4487 508 - 508 aa - 508 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.3716+/- 0.001; mu= 17.6167+/- 0.060
mean_var=68.9520+/-13.676, 0's: 0 Z-trim(104.0): 40 B-trim: 53 in 1/48
Lambda= 0.154455
statistics sampled from 7629 (7668) to 7629 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.602), E-opt: 0.2 (0.236), width: 16
Scan time: 2.540
The best scores are: opt bits E(32554)
CCDS32589.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 508) 3337 753.1 1.7e-217
CCDS11210.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 485) 3164 714.5 6.4e-206
CCDS11212.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 453) 2109 479.4 3.6e-135
CCDS82090.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 380) 1848 421.2 9.9e-118
CCDS73335.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 468) 1687 385.4 7.4e-107
CCDS73336.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 431) 1480 339.3 5.3e-93
CCDS31622.1 ALDH3B2 gene_id:222|Hs108|chr11 ( 385) 1357 311.8 8.6e-85
CCDS76443.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 351) 720 169.9 4.3e-42
CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 512) 536 129.0 1.3e-29
CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 ( 501) 521 125.6 1.3e-28
CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 422) 481 116.6 5.4e-26
CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 497) 481 116.7 6.1e-26
CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 518) 481 116.7 6.4e-26
CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 ( 517) 472 114.7 2.5e-25
CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 ( 923) 470 114.4 5.6e-25
CCDS4555.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 535) 460 112.0 1.7e-24
CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 405) 422 103.5 4.7e-22
CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 801) 414 101.9 2.8e-21
CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 902) 414 101.9 3.1e-21
CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 ( 518) 411 101.1 3.2e-21
CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 912) 414 101.9 3.2e-21
CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 480) 361 89.9 6.7e-18
CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 ( 470) 360 89.7 7.7e-18
CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 ( 517) 360 89.7 8.3e-18
CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 539) 342 85.7 1.4e-16
CCDS4556.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 548) 339 85.1 2.2e-16
>>CCDS32589.1 ALDH3A2 gene_id:224|Hs108|chr17 (508 aa)
initn: 3337 init1: 3337 opt: 3337 Z-score: 4018.4 bits: 753.1 E(32554): 1.7e-217
Smith-Waterman score: 3337; 100.0% identity (100.0% similar) in 508 aa overlap (1-508:1-508)
10 20 30 40 50 60
pF1KE4 MELEVRRVRQAFLSGRSRPLRFRLQQLEALRRMVQEREKDILTAIAADLCKSEFNVYSQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MELEVRRVRQAFLSGRSRPLRFRLQQLEALRRMVQEREKDILTAIAADLCKSEFNVYSQE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 VITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQPLGVVLIIGAWNYPFVLTIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 VITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQPLGVVLIIGAWNYPFVLTIQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 PLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLYIVINGGVEETTELLKQRFDH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 PLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLYIVINGGVEETTELLKQRFDH
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 IFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDCDLDIVCRRITWGKYMNCGQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 IFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDCDLDIVCRRITWGKYMNCGQT
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 CIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYERIINLRHFKRILSLLEGQKI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 CIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYERIINLRHFKRILSLLEGQKI
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 AFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINFINEREKPLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 AFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINFINEREKPLA
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 LYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFGGVGSSGMGAYHGKHSFDTFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 LYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFGGVGSSGMGAYHGKHSFDTFS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 HQRPCLLKSLKREGANKLRYPPNSQSKVDWGKFFLLKRFNKEKLGLLLLTFLGIVAAVLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 HQRPCLLKSLKREGANKLRYPPNSQSKVDWGKFFLLKRFNKEKLGLLLLTFLGIVAAVLV
430 440 450 460 470 480
490 500
pF1KE4 KKYQAVLRRKALLIFLVVHRLRWSSKQR
::::::::::::::::::::::::::::
CCDS32 KKYQAVLRRKALLIFLVVHRLRWSSKQR
490 500
>>CCDS11210.1 ALDH3A2 gene_id:224|Hs108|chr17 (485 aa)
initn: 3164 init1: 3164 opt: 3164 Z-score: 3810.4 bits: 714.5 E(32554): 6.4e-206
Smith-Waterman score: 3164; 100.0% identity (100.0% similar) in 481 aa overlap (1-481:1-481)
10 20 30 40 50 60
pF1KE4 MELEVRRVRQAFLSGRSRPLRFRLQQLEALRRMVQEREKDILTAIAADLCKSEFNVYSQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MELEVRRVRQAFLSGRSRPLRFRLQQLEALRRMVQEREKDILTAIAADLCKSEFNVYSQE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 VITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQPLGVVLIIGAWNYPFVLTIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQPLGVVLIIGAWNYPFVLTIQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 PLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLYIVINGGVEETTELLKQRFDH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLYIVINGGVEETTELLKQRFDH
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 IFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDCDLDIVCRRITWGKYMNCGQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 IFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDCDLDIVCRRITWGKYMNCGQT
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 CIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYERIINLRHFKRILSLLEGQKI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 CIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYERIINLRHFKRILSLLEGQKI
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 AFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINFINEREKPLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINFINEREKPLA
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 LYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFGGVGSSGMGAYHGKHSFDTFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFGGVGSSGMGAYHGKHSFDTFS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 HQRPCLLKSLKREGANKLRYPPNSQSKVDWGKFFLLKRFNKEKLGLLLLTFLGIVAAVLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 HQRPCLLKSLKREGANKLRYPPNSQSKVDWGKFFLLKRFNKEKLGLLLLTFLGIVAAVLV
430 440 450 460 470 480
490 500
pF1KE4 KKYQAVLRRKALLIFLVVHRLRWSSKQR
:
CCDS11 KAEYY
>>CCDS11212.1 ALDH3A1 gene_id:218|Hs108|chr17 (453 aa)
initn: 2088 init1: 2088 opt: 2109 Z-score: 2540.3 bits: 479.4 E(32554): 3.6e-135
Smith-Waterman score: 2109; 67.7% identity (90.9% similar) in 439 aa overlap (5-443:8-446)
10 20 30 40 50
pF1KE4 MELEVRRVRQAFLSGRSRPLRFRLQQLEALRRMVQEREKDILTAIAADLCKSEFNVY
:.:.: :: :::.:::.::.::::::.:..::.:.... :.:::: :.:.:.:
CCDS11 MSKISEAVKRARAAFSSGRTRPLQFRIQQLEALQRLIQEQEQELVGALAADLHKNEWNAY
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE4 SQEVITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQPLGVVLIIGAWNYPFVL
.::. :: ::..:...::::.. .::.:. :. :: ::. .::::::.::.::::: :
CCDS11 YEEVVYVLEEIEYMIQKLPEWAADEPVEKTPQTQQDELYIHSEPLGVVLVIGTWNYPFNL
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE4 TIQPLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLYIVINGGVEETTELLKQR
::::..:::::::.:..:::::::: :..:: ..:::::.::: :::::: :::::::.:
CCDS11 TIQPMVGAIAAGNSVVLKPSELSENMASLLATIIPQYLDKDLYPVINGGVPETTELLKER
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE4 FDHIFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDCDLDIVCRRITWGKYMNC
::::.:::.:.::::.: ::::::::::::::::::::.::.::::..::::.:::.::
CCDS11 FDHILYTGSTGVGKIIMTAAAKHLTPVTLELGGKSPCYVDKNCDLDVACRRIAWGKFMNS
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE4 GQTCIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYERIINLRHFKRILSLLEG
::::.:::::::. :.::::: :.:...::::::. :.: :: :::. :::.:...:.::
CCDS11 GQTCVAPDYILCDPSIQNQIVEKLKKSLKEFYGEDAKKSRDYGRIISARHFQRVMGLIEG
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE4 QKIAFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINFINEREK
::.:.:: : ::::::::.::::::.. :::::::::.:::: :....:::.:::.:::
CCDS11 QKVAYGGTGDAATRYIAPTILTDVDPQSPVMQEEIFGPVLPIVCVRSLEEAIQFINQREK
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE4 PLALYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFGGVGSSGMGAYHGKHSFD
:::::.:: : :.::.:: :::::::..::::.:.::.:.::::::.::::.::::.::.
CCDS11 PLALYMFSSNDKVIKKMIAETSSGGVAANDVIVHITLHSLPFGGVGNSGMGSYHGKKSFE
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE4 TFSHQRPCLLKSLKREGANKLRYPPNSQSKVDWGKFFLLKRFNKEKLGLLLLTFLGIVAA
::::.: ::.. : . . :.::::.
CCDS11 TFSHRRSCLVRPLMNDEGLKVRYPPSPAKMTQH
430 440 450
>>CCDS82090.1 ALDH3A1 gene_id:218|Hs108|chr17 (380 aa)
initn: 1837 init1: 1837 opt: 1848 Z-score: 2227.1 bits: 421.2 E(32554): 9.9e-118
Smith-Waterman score: 1848; 69.4% identity (91.2% similar) in 373 aa overlap (71-443:1-373)
50 60 70 80 90 100
pF1KE4 ILTAIAADLCKSEFNVYSQEVITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQ
:...::::.. .::.:. :. :: ::. .
CCDS82 MIQKLPEWAADEPVEKTPQTQQDELYIHSE
10 20 30
110 120 130 140 150 160
pF1KE4 PLGVVLIIGAWNYPFVLTIQPLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLY
::::::.::.::::: :::::..:::::::.:..:::::::: :..:: ..:::::.:::
CCDS82 PLGVVLVIGTWNYPFNLTIQPMVGAIAAGNSVVLKPSELSENMASLLATIIPQYLDKDLY
40 50 60 70 80 90
170 180 190 200 210 220
pF1KE4 IVINGGVEETTELLKQRFDHIFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDC
:::::: :::::::.:::::.:::.:.::::.: ::::::::::::::::::::.::.:
CCDS82 PVINGGVPETTELLKERFDHILYTGSTGVGKIIMTAAAKHLTPVTLELGGKSPCYVDKNC
100 110 120 130 140 150
230 240 250 260 270 280
pF1KE4 DLDIVCRRITWGKYMNCGQTCIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYE
:::..::::.:::.:: ::::.:::::::. :.::::: :.:...::::::. :.: ::
CCDS82 DLDVACRRIAWGKFMNSGQTCVAPDYILCDPSIQNQIVEKLKKSLKEFYGEDAKKSRDYG
160 170 180 190 200 210
290 300 310 320 330 340
pF1KE4 RIINLRHFKRILSLLEGQKIAFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIV
:::. :::.:...:.::::.:.:: : ::::::::.::::::.. :::::::::.::::
CCDS82 RIISARHFQRVMGLIEGQKVAYGGTGDAATRYIAPTILTDVDPQSPVMQEEIFGPVLPIV
220 230 240 250 260 270
350 360 370 380 390 400
pF1KE4 PVKNVDEAINFINEREKPLALYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFG
:....:::.:::.::::::::.:: : :.::.:: :::::::..::::.:.::.:.:::
CCDS82 CVRSLEEAIQFINQREKPLALYMFSSNDKVIKKMIAETSSGGVAANDVIVHITLHSLPFG
280 290 300 310 320 330
410 420 430 440 450 460
pF1KE4 GVGSSGMGAYHGKHSFDTFSHQRPCLLKSLKREGANKLRYPPNSQSKVDWGKFFLLKRFN
:::.::::.::::.::.::::.: ::.. : . . :.::::.
CCDS82 GVGNSGMGSYHGKKSFETFSHRRSCLVRPLMNDEGLKVRYPPSPAKMTQH
340 350 360 370 380
470 480 490 500
pF1KE4 KEKLGLLLLTFLGIVAAVLVKKYQAVLRRKALLIFLVVHRLRWSSKQR
>>CCDS73335.1 ALDH3B1 gene_id:221|Hs108|chr11 (468 aa)
initn: 1711 init1: 1686 opt: 1687 Z-score: 2031.9 bits: 385.4 E(32554): 7.4e-107
Smith-Waterman score: 1687; 55.2% identity (80.0% similar) in 444 aa overlap (5-448:8-451)
10 20 30 40 50
pF1KE4 MELEVRRVRQAFLSGRSRPLRFRLQQLEALRRMVQEREKDILTAIAADLCKSEFNVY
.::.:.:: .::.:: .:: ::..: :..:: .. . :.: :: :: :.
CCDS73 MDPLGDTLRRLREAFHAGRTRPAEFRAAQLQGLGRFLQENKQLLHDALAQDLHKSAFESE
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE4 SQEVITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQPLGVVLIIGAWNYPFVL
.:: ::. . :.:: :. . : ::. :.:: :.:. .:.:.::::. ::::. :
CCDS73 VSEVAISQGEVTLALRNLRAWMKDERVPKNLATQLDSAFIRKEPFGLVLIIAPWNYPLNL
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE4 TIQPLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLYIVINGGVEETTELLKQR
:. ::.::.:::: :..::::.:.:. ::::..::::.::. . :. :: .:: .::..:
CCDS73 TLVPLVGALAAGNCVVLKPSEISKNVEKILAEVLPQYVDQSCFAVVLGGPQETGQLLEHR
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE4 FDHIFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDCDLDIVCRRITWGKYMNC
::.::.::. :::::: ::::::::::::::::.:::.: .:: . : :..: .:.:
CCDS73 FDYIFFTGSPRVGKIVMTAAAKHLTPVTLELGGKNPCYVDDNCDPQTVANRVAWFRYFNA
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE4 GQTCIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYERIINLRHFKRILSLLEG
::::.::::.:: .:.... .. :. .:::.. . ::. :::: ..:.:. .::
CCDS73 GQTCVAPDYVLCSPEMQERLLPALQSTITRFYGDDPQSSPNLGRIINQKQFQRLRALLGC
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE4 QKIAFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINFINEREK
..:.::..::. ::::::::.::. :::::::::::::: :...::::.:::.:::
CCDS73 GRVAIGGQSDESDRYIAPTVLVDVQEMEPVMQEEIFGPILPIVNVQSLDEAIEFINRREK
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE4 PLALYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFGGVGSSGMGAYHGKHSFD
:::::.::.. ...::.. .::::: ::: .::.:: :.::::::.:::: :::: :::
CCDS73 PLALYAFSNSSQVVKRVLTQTSSGGFCGNDGFMHMTLASLPFGGVGASGMGRYHGKFSFD
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE4 TFSHQRPCLLKSLKREGANKLRYPPNSQSKVDWGKFFLLKRFNKEKLGLLLLTFLGIVAA
::::.: :::.: : : :::::.: ..
CCDS73 TFSHHRACLLRSPGMEKLNALRYPPQSPRRLRMLLVAMEAQGCSCTLL
430 440 450 460
480 490 500
pF1KE4 VLVKKYQAVLRRKALLIFLVVHRLRWSSKQR
>>CCDS73336.1 ALDH3B1 gene_id:221|Hs108|chr11 (431 aa)
initn: 1605 init1: 1479 opt: 1480 Z-score: 1783.1 bits: 339.3 E(32554): 5.3e-93
Smith-Waterman score: 1536; 52.3% identity (75.5% similar) in 444 aa overlap (5-448:8-414)
10 20 30 40 50
pF1KE4 MELEVRRVRQAFLSGRSRPLRFRLQQLEALRRMVQEREKDILTAIAADLCKSEFNVY
.::.:.:: .::.:: .:: ::..: :..:: .. . :.: :: :.
CCDS73 MDPLGDTLRRLREAFHAGRTRPAEFRAAQLQGLGRFLQENKQLLHDALAQDLHKA-----
10 20 30 40 50
60 70 80 90 100 110
pF1KE4 SQEVITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQPLGVVLIIGAWNYPFVL
:.:: :.:. .:.:.::::. ::::. :
CCDS73 --------------------------------TQLDSAFIRKEPFGLVLIIAPWNYPLNL
60 70 80
120 130 140 150 160 170
pF1KE4 TIQPLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLYIVINGGVEETTELLKQR
:. ::.::.:::: :..::::.:.:. ::::..::::.::. . :. :: .:: .::..:
CCDS73 TLVPLVGALAAGNCVVLKPSEISKNVEKILAEVLPQYVDQSCFAVVLGGPQETGQLLEHR
90 100 110 120 130 140
180 190 200 210 220 230
pF1KE4 FDHIFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDCDLDIVCRRITWGKYMNC
::.::.::. :::::: ::::::::::::::::.:::.: .:: . : :..: .:.:
CCDS73 FDYIFFTGSPRVGKIVMTAAAKHLTPVTLELGGKNPCYVDDNCDPQTVANRVAWFRYFNA
150 160 170 180 190 200
240 250 260 270 280 290
pF1KE4 GQTCIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYERIINLRHFKRILSLLEG
::::.::::.:: .:.... .. :. .:::.. . ::. :::: ..:.:. .::
CCDS73 GQTCVAPDYVLCSPEMQERLLPALQSTITRFYGDDPQSSPNLGRIINQKQFQRLRALLGC
210 220 230 240 250 260
300 310 320 330 340 350
pF1KE4 QKIAFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINFINEREK
..:.::..::. ::::::::.::. :::::::::::::: :...::::.:::.:::
CCDS73 GRVAIGGQSDESDRYIAPTVLVDVQEMEPVMQEEIFGPILPIVNVQSLDEAIEFINRREK
270 280 290 300 310 320
360 370 380 390 400 410
pF1KE4 PLALYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFGGVGSSGMGAYHGKHSFD
:::::.::.. ...::.. .::::: ::: .::.:: :.::::::.:::: :::: :::
CCDS73 PLALYAFSNSSQVVKRVLTQTSSGGFCGNDGFMHMTLASLPFGGVGASGMGRYHGKFSFD
330 340 350 360 370 380
420 430 440 450 460 470
pF1KE4 TFSHQRPCLLKSLKREGANKLRYPPNSQSKVDWGKFFLLKRFNKEKLGLLLLTFLGIVAA
::::.: :::.: : : :::::.: ..
CCDS73 TFSHHRACLLRSPGMEKLNALRYPPQSPRRLRMLLVAMEAQGCSCTLL
390 400 410 420 430
480 490 500
pF1KE4 VLVKKYQAVLRRKALLIFLVVHRLRWSSKQR
>>CCDS31622.1 ALDH3B2 gene_id:222|Hs108|chr11 (385 aa)
initn: 1347 init1: 1347 opt: 1357 Z-score: 1635.8 bits: 311.8 E(32554): 8.6e-85
Smith-Waterman score: 1357; 52.0% identity (80.2% similar) in 373 aa overlap (82-451:4-376)
60 70 80 90 100 110
pF1KE4 SEFNVYSQEVITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQPLGVVLIIGAW
.: . :.. :: ..: .:.:.::::. :
CCDS31 MKDEPRSTNLFMKLDSVFIWKEPFGLVLIIAPW
10 20 30
120 130 140 150 160 170
pF1KE4 NYPFVLTIQPLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLYIVINGGVEETT
:::. ::. :.::.:::. :..::::.:..: :.::..:::::::. . :. :: .::
CCDS31 NYPLNLTLVLLVGALAAGSCVVLKPSEISQGTEKVLAEVLPQYLDQSCFAVVLGGPQETG
40 50 60 70 80 90
180 190 200 210 220 230
pF1KE4 ELLKQRFDHIFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDCDLDIVCRRITW
.::....:.::.::. :::::: ::.:::::::::::::.:::.: .:: . : :..:
CCDS31 QLLEHKLDYIFFTGSPRVGKIVMTAATKHLTPVTLELGGKNPCYVDDNCDPQTVANRVAW
100 110 120 130 140 150
240 250 260 270 280 290
pF1KE4 GKYMNCGQTCIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYERIINLRHFKRI
:.: ::::.::::.:: .:.... .. :. .:::.. . ::. .::: ..:.:.
CCDS31 FCYFNAGQTCVAPDYVLCSPEMQERLLPALQSTITRFYGDDPQSSPNLGHIINQKQFQRL
160 170 180 190 200 210
300 310 320 330 340 350
pF1KE4 LSLLEGQKIAFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINF
.:: ...:.::...:. ::::::::.::. :::::::::::::: :..:::::.:
CCDS31 RALLGCSRVAIGGQSNESDRYIAPTVLVDVQETEPVMQEEIFGPILPIVNVQSVDEAIKF
220 230 240 250 260 270
360 370 380 390 400 410
pF1KE4 INEREKPLALYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFGGVGSSGMGAYH
::..:::::::.::.. .....:...::::. ::. . ...: : :::::: :::: ::
CCDS31 INRQEKPLALYAFSNSSQVVNQMLERTSSGSFGGNEGFTYISLLSVPFGGVGHSGMGRYH
280 290 300 310 320 330
420 430 440 450 460
pF1KE4 GKHSFDTFSHQRPCLLKSLKREGANKLRYPPNS---QSKVDWGKFFLLKRFNKEKLGLLL
:: .::::::.: ::: : ....::: . :. . ::
CCDS31 GKFTFDTFSHHRTCLLAPSGLEKLKEIHYPPYTDWNQQLLRWGMGSQSCTLL
340 350 360 370 380
470 480 490 500
pF1KE4 LTFLGIVAAVLVKKYQAVLRRKALLIFLVVHRLRWSSKQR
>>CCDS76443.1 ALDH3B1 gene_id:221|Hs108|chr11 (351 aa)
initn: 1231 init1: 714 opt: 720 Z-score: 869.2 bits: 169.9 E(32554): 4.3e-42
Smith-Waterman score: 976; 41.2% identity (59.0% similar) in 444 aa overlap (5-448:8-334)
10 20 30 40 50
pF1KE4 MELEVRRVRQAFLSGRSRPLRFRLQQLEALRRMVQEREKDILTAIAADLCKSEFNVY
.::.:.:: .::.:: .:: ::..: :..:: .. . :.: :: :: :.
CCDS76 MDPLGDTLRRLREAFHAGRTRPAEFRAAQLQGLGRFLQENKQLLHDALAQDLHKSAFESE
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE4 SQEVITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEAYIQPQPLGVVLIIGAWNYPFVL
.:: ::. . :.:: :. . : ::. :.:: :.:. .:.:.::::. ::::. :
CCDS76 VSEVAISQGEVTLALRNLRAWMKDERVPKNLATQLDSAFIRKEPFGLVLIIAPWNYPLNL
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE4 TIQPLIGAIAAGNAVIIKPSELSENTAKILAKLLPQYLDQDLYIVINGGVEETTELLKQR
:. ::.::.:::: :..::::.:.:. ::::..::::.::.
CCDS76 TLVPLVGALAAGNCVVLKPSEISKNVEKILAEVLPQYVDQS-------------------
130 140 150 160
180 190 200 210 220 230
pF1KE4 FDHIFYTGNTAVGKIVMEAAAKHLTPVTLELGGKSPCYIDKDCDLDIVCRRITWGKYMNC
CCDS76 ------------------------------------------------------------
240 250 260 270 280 290
pF1KE4 GQTCIAPDYILCEASLQNQIVWKIKETVKEFYGENIKESPDYERIINLRHFKRILSLLEG
::. :::: ..:.:. .::
CCDS76 --------------------------------------SPNLGRIINQKQFQRLRALLGC
170 180
300 310 320 330 340 350
pF1KE4 QKIAFGGETDEATRYIAPTVLTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINFINEREK
..:.::..::. ::::::::.::. :::::::::::::: :...::::.:::.:::
CCDS76 GRVAIGGQSDESDRYIAPTVLVDVQEMEPVMQEEIFGPILPIVNVQSLDEAIEFINRREK
190 200 210 220 230 240
360 370 380 390 400 410
pF1KE4 PLALYVFSHNHKLIKRMIDETSSGGVTGNDVIMHFTLNSFPFGGVGSSGMGAYHGKHSFD
:::::.::.. ...::.. .::::: ::: .::.:: :.::::::.:::: :::: :::
CCDS76 PLALYAFSNSSQVVKRVLTQTSSGGFCGNDGFMHMTLASLPFGGVGASGMGRYHGKFSFD
250 260 270 280 290 300
420 430 440 450 460 470
pF1KE4 TFSHQRPCLLKSLKREGANKLRYPPNSQSKVDWGKFFLLKRFNKEKLGLLLLTFLGIVAA
::::.: :::.: : : :::::.: ..
CCDS76 TFSHHRACLLRSPGMEKLNALRYPPQSPRRLRMLLVAMEAQGCSCTLL
310 320 330 340 350
480 490 500
pF1KE4 VLVKKYQAVLRRKALLIFLVVHRLRWSSKQR
>>CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 (512 aa)
initn: 468 init1: 150 opt: 536 Z-score: 645.2 bits: 129.0 E(32554): 1.3e-29
Smith-Waterman score: 536; 28.2% identity (57.2% similar) in 432 aa overlap (16-428:84-506)
10 20 30 40
pF1KE4 MELEVRRVRQAFLSGRSRPLRFRLQQLEALRRMVQ-----EREKD
:. : : ::. : : . : ::..
CCDS10 PSTREQICEVEEGDKPDVDKAVEAAQVAFQRGSPWR-RLDALSRGRLLHQLADLVERDRA
60 70 80 90 100 110
50 60 70 80 90
pF1KE4 ILTAIAA-DLCKSEFNVYSQEVITVLGEIDFMLENLPEWVTAKPVKKNVLTMLDEA--YI
:.:. . : : .... : . : : :. . : : .. ... :.. .
CCDS10 TLAALETMDTGKPFLHAF---FIDLEGCIR-TLRYFAGW--ADKIQGKTIPTDDNVVCFT
120 130 140 150 160
100 110 120 130 140 150
pF1KE4 QPQPLGVVLIIGAWNYPFVLTIQPLIGAIAAGNAVIIKPSELSENTAKILAKLLPQY-LD
. .:.:: : ::.:... . : :. ::....::.: . :: :..:. . .
CCDS10 RHEPIGVCGAITPWNFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFP
170 180 190 200 210 220
160 170 180 190 200 210
pF1KE4 QDLYIVING-GVEETTELLKQ-RFDHIFYTGNTAVGKIVMEAAAK-HLTPVTLELGGKSP
. .. : : . . .. ....: .::.: :::.: :::.. .: ::::::::.:
CCDS10 PGVVNIVPGFGPTVGAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNP
230 240 250 260 270 280
220 230 240 250 260 270
pF1KE4 CYIDKDCDLDIVCRRITWGKYMNCGQTCIAPDYILCEASLQNQIVWKIKETVKEF-YGEN
: . : :::.. . : ..: :: : : . .. : .. ...: . : .:. :.
CCDS10 CIVCADADLDLAVECAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDP
290 300 310 320 330 340
280 290 300 310 320
pF1KE4 IKESPDYERIINLRHFKRILSLLE-----GQKIAFGGET-DEATRYIAPTVLTDVDPKTK
. . . :. ..: .:: :.: : :. :: . .. .: :::...: . .
CCDS10 FDVKTEQGPQIDQKQFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMR
350 360 370 380 390 400
330 340 350 360 370 380
pF1KE4 VMQEEIFGPILPIVPVKNVDEAINFINEREKPLALYVFSHNHKLIKRMIDETSSGGVTGN
. .::::::. ::. :...:.:. : . :. ::..: .. . :: : :
CCDS10 IAKEEIFGPVQPILKFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWIN
410 420 430 440 450 460
390 400 410 420 430 440
pF1KE4 DVIMHFTLNSFPFGGVGSSGMGAYHGKHSFDTFSHQRPCLLKSLKREGANKLRYPPNSQS
.. . :::: :: : :.... ... . .:
CCDS10 --CYNALYAQAPFGGFKMSGNGRELGEYALAEYTEVKTVTIKLGDKNP
470 480 490 500 510
450 460 470 480 490 500
pF1KE4 KVDWGKFFLLKRFNKEKLGLLLLTFLGIVAAVLVKKYQAVLRRKALLIFLVVHRLRWSSK
>>CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 (501 aa)
initn: 443 init1: 172 opt: 521 Z-score: 627.3 bits: 125.6 E(32554): 1.3e-28
Smith-Waterman score: 521; 28.2% identity (56.7% similar) in 443 aa overlap (5-428:64-495)
10 20 30
pF1KE4 MELEVRRVRQAFLSG---RSRPLRFRLQQLEALR
:. .:::: : :. : . : :
CCDS66 SGKKFPVFNPATEEELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLA
40 50 60 70 80 90
40 50 60 70 80
pF1KE4 RMVQEREKDILTAIAA-DLCKSEFNVYSQEVITVLGEIDFMLENLPEWVTAK--PVKKNV
.. ::.. .:... . . : :.: ... . . . . . . .. :. :
CCDS66 DLI-ERDRLLLATMESMNGGKLYSNAYLNDLAGCIKTLRYC-AGWADKIQGRTIPIDGNF
100 110 120 130 140 150
90 100 110 120 130 140
pF1KE4 LTMLDEAYIQPQPLGVVLIIGAWNYPFVLTIQPLIGAIAAGNAVIIKPSELSENTAKILA
.: : . .:.:: : ::.:.:. : . :.. ::.:..::.: . :: .:
CCDS66 FT-----YTRHEPIGVCGQIIPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVA
160 170 180 190 200
150 160 170 180 190 200
pF1KE4 KLLPQY-LDQDLYIVINGGVEETTELLKQRFD--HIFYTGNTAVGKIVMEAAAK-HLTPV
.:. . . . .. : . .....: .. .::.: :::.. :::.: .: :
CCDS66 SLIKEAGFPPGVVNIVPGYGPTAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRV
210 220 230 240 250 260
210 220 230 240 250 260
pF1KE4 TLELGGKSPCYIDKDCDLDIVCRRITWGKYMNCGQTCIAPDYILCEASLQNQIVWKIKET
:::::::::: . : ::: . . : ... :: ::: . :. : :. ...: . :
CCDS66 TLELGGKSPCIVLADADLDNAVEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVER
270 280 290 300 310 320
270 280 290 300 310
pF1KE4 VKEFY-GENIKESPDYERIINLRHFKRILSLLE-----GQKIAFGGET-DEATRYIAPTV
.:.. :. . . :. ... .::.:.: : :. :: . .. :::
CCDS66 AKKYILGNPLTPGVTQGPQIDKEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTV
330 340 350 360 370 380
320 330 340 350 360 370
pF1KE4 LTDVDPKTKVMQEEIFGPILPIVPVKNVDEAINFINEREKPLALYVFSHNHKLIKRMIDE
...: . .. .::::::. :. :..:..:. :. :. ::. : : . :
CCDS66 FSNVTDEMRIAKEEIFGPVQQIMKFKSLDDVIKRANNTFYGLSAGVFT---KDIDKAIT-
390 400 410 420 430 440
380 390 400 410 420 430
pF1KE4 TSSGGVTGNDVIMHFTLNS--FPFGGVGSSGMGAYHGKHSFDTFSHQRPCLLKSLKREGA
::. .:. . . . : :::: :: : :...: ... . .:
CCDS66 ISSALQAGTVWVNCYGVVSAQCPFGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS
450 460 470 480 490 500
440 450 460 470 480 490
pF1KE4 NKLRYPPNSQSKVDWGKFFLLKRFNKEKLGLLLLTFLGIVAAVLVKKYQAVLRRKALLIF
508 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 00:49:03 2016 done: Sun Nov 6 00:49:03 2016
Total Scan time: 2.540 Total Display time: 0.080
Function used was FASTA [36.3.4 Apr, 2011]