FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3033, 563 aa
1>>>pF1KB3033 563 - 563 aa - 563 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.7850+/-0.000879; mu= 15.9158+/- 0.053
mean_var=71.1598+/-14.091, 0's: 0 Z-trim(105.9): 36 B-trim: 0 in 0/52
Lambda= 0.152040
statistics sampled from 8631 (8666) to 8631 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.639), E-opt: 0.2 (0.266), width: 16
Scan time: 3.190
The best scores are: opt bits E(32554)
CCDS188.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 563) 3786 839.9 0
CCDS53272.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 503) 3388 752.6 2.5e-217
CCDS81273.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 512) 2647 590.1 2.2e-168
CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 ( 501) 496 118.3 2.3e-26
CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 ( 923) 498 118.8 2.9e-26
CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 ( 517) 494 117.8 3.2e-26
CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 ( 518) 491 117.2 5.1e-26
CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 512) 490 117.0 5.8e-26
CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 487) 489 116.7 6.5e-26
CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 497) 476 113.9 4.8e-25
CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 518) 476 113.9 5e-25
CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 801) 438 105.6 2.3e-22
CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 902) 438 105.6 2.6e-22
CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 912) 438 105.6 2.6e-22
CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 539) 434 104.7 3e-22
CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 422) 431 104.0 3.9e-22
CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 ( 517) 432 104.2 4e-22
CCDS4555.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 535) 393 95.7 1.5e-19
CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 405) 374 91.5 2.2e-18
CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 ( 470) 374 91.5 2.5e-18
CCDS55057.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 437) 353 86.9 5.6e-17
CCDS9826.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 535) 342 84.5 3.6e-16
CCDS61501.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 522) 318 79.2 1.4e-14
CCDS4556.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 548) 299 75.1 2.5e-13
CCDS5172.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 433) 286 72.2 1.5e-12
CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 480) 265 67.6 4e-11
>>CCDS188.1 ALDH4A1 gene_id:8659|Hs108|chr1 (563 aa)
initn: 3786 init1: 3786 opt: 3786 Z-score: 4486.1 bits: 839.9 E(32554): 0
Smith-Waterman score: 3786; 100.0% identity (100.0% similar) in 563 aa overlap (1-563:1-563)
10 20 30 40 50 60
pF1KB3 MLLPAPALRRALLSRPWTGAGLRWKHTSSLKVANEPVLAFTQGSPERDALQKALKDLKGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 MLLPAPALRRALLSRPWTGAGLRWKHTSSLKVANEPVLAFTQGSPERDALQKALKDLKGR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 MEAIPCVVGDEEVWTSDVQYQVSPFNHGHKVAKFCYADKSLLNKAIEAALAARKEWDLKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 MEAIPCVVGDEEVWTSDVQYQVSPFNHGHKVAKFCYADKSLLNKAIEAALAARKEWDLKP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 IADRAQIFLKAADMLSGPRRAEILAKTMVGQGKTVIQAEIDAAAELIDFFRFNAKYAVEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 IADRAQIFLKAADMLSGPRRAEILAKTMVGQGKTVIQAEIDAAAELIDFFRFNAKYAVEL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 EGQQPISVPPSTNSTVYRGLEGFVAAISPFNFTAIGGNLAGAPALMGNVVLWKPSDTAML
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 EGQQPISVPPSTNSTVYRGLEGFVAAISPFNFTAIGGNLAGAPALMGNVVLWKPSDTAML
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 ASYAVYRILREAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKHLWKQVAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 ASYAVYRILREAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKHLWKQVAQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 NLDRFHTFPRLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSRLYVPHSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 NLDRFHTFPRLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSRLYVPHSL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB3 WPQIKGRLLEEHSRIKVGDPAEDFGTFFSAVIDAKSFARIKKWLEHARSSPSLTILAGGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 WPQIKGRLLEEHSRIKVGDPAEDFGTFFSAVIDAKSFARIKKWLEHARSSPSLTILAGGK
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB3 CDDSVGYFVEPCIVESKDPQEPIMKEEIFGPVLSVYVYPDDKYKETLQLVDSTTSYGLTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 CDDSVGYFVEPCIVESKDPQEPIMKEEIFGPVLSVYVYPDDKYKETLQLVDSTTSYGLTG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB3 AVFSQDKDVVQEATKVLRNAAGNFYINDKSTGSIVGQQPFGGARASGTNDKPGGPHYILR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 AVFSQDKDVVQEATKVLRNAAGNFYINDKSTGSIVGQQPFGGARASGTNDKPGGPHYILR
490 500 510 520 530 540
550 560
pF1KB3 WTSPQVIKETHKPLGDWSYAYMQ
:::::::::::::::::::::::
CCDS18 WTSPQVIKETHKPLGDWSYAYMQ
550 560
>>CCDS53272.1 ALDH4A1 gene_id:8659|Hs108|chr1 (503 aa)
initn: 3388 init1: 3388 opt: 3388 Z-score: 4015.1 bits: 752.6 E(32554): 2.5e-217
Smith-Waterman score: 3388; 100.0% identity (100.0% similar) in 503 aa overlap (61-563:1-503)
40 50 60 70 80 90
pF1KB3 KVANEPVLAFTQGSPERDALQKALKDLKGRMEAIPCVVGDEEVWTSDVQYQVSPFNHGHK
::::::::::::::::::::::::::::::
CCDS53 MEAIPCVVGDEEVWTSDVQYQVSPFNHGHK
10 20 30
100 110 120 130 140 150
pF1KB3 VAKFCYADKSLLNKAIEAALAARKEWDLKPIADRAQIFLKAADMLSGPRRAEILAKTMVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 VAKFCYADKSLLNKAIEAALAARKEWDLKPIADRAQIFLKAADMLSGPRRAEILAKTMVG
40 50 60 70 80 90
160 170 180 190 200 210
pF1KB3 QGKTVIQAEIDAAAELIDFFRFNAKYAVELEGQQPISVPPSTNSTVYRGLEGFVAAISPF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QGKTVIQAEIDAAAELIDFFRFNAKYAVELEGQQPISVPPSTNSTVYRGLEGFVAAISPF
100 110 120 130 140 150
220 230 240 250 260 270
pF1KB3 NFTAIGGNLAGAPALMGNVVLWKPSDTAMLASYAVYRILREAGLPPNIIQFVPADGPLFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 NFTAIGGNLAGAPALMGNVVLWKPSDTAMLASYAVYRILREAGLPPNIIQFVPADGPLFG
160 170 180 190 200 210
280 290 300 310 320 330
pF1KB3 DTVTSSEHLCGINFTGSVPTFKHLWKQVAQNLDRFHTFPRLAGECGGKNFHFVHRSADVE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 DTVTSSEHLCGINFTGSVPTFKHLWKQVAQNLDRFHTFPRLAGECGGKNFHFVHRSADVE
220 230 240 250 260 270
340 350 360 370 380 390
pF1KB3 SVVSGTLRSAFEYGGQKCSACSRLYVPHSLWPQIKGRLLEEHSRIKVGDPAEDFGTFFSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SVVSGTLRSAFEYGGQKCSACSRLYVPHSLWPQIKGRLLEEHSRIKVGDPAEDFGTFFSA
280 290 300 310 320 330
400 410 420 430 440 450
pF1KB3 VIDAKSFARIKKWLEHARSSPSLTILAGGKCDDSVGYFVEPCIVESKDPQEPIMKEEIFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 VIDAKSFARIKKWLEHARSSPSLTILAGGKCDDSVGYFVEPCIVESKDPQEPIMKEEIFG
340 350 360 370 380 390
460 470 480 490 500 510
pF1KB3 PVLSVYVYPDDKYKETLQLVDSTTSYGLTGAVFSQDKDVVQEATKVLRNAAGNFYINDKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PVLSVYVYPDDKYKETLQLVDSTTSYGLTGAVFSQDKDVVQEATKVLRNAAGNFYINDKS
400 410 420 430 440 450
520 530 540 550 560
pF1KB3 TGSIVGQQPFGGARASGTNDKPGGPHYILRWTSPQVIKETHKPLGDWSYAYMQ
:::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 TGSIVGQQPFGGARASGTNDKPGGPHYILRWTSPQVIKETHKPLGDWSYAYMQ
460 470 480 490 500
>>CCDS81273.1 ALDH4A1 gene_id:8659|Hs108|chr1 (512 aa)
initn: 2647 init1: 2647 opt: 2647 Z-score: 3136.6 bits: 590.1 E(32554): 2.2e-168
Smith-Waterman score: 3323; 90.9% identity (90.9% similar) in 563 aa overlap (1-563:1-512)
10 20 30 40 50 60
pF1KB3 MLLPAPALRRALLSRPWTGAGLRWKHTSSLKVANEPVLAFTQGSPERDALQKALKDLKGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 MLLPAPALRRALLSRPWTGAGLRWKHTSSLKVANEPVLAFTQGSPERDALQKALKDLKGR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 MEAIPCVVGDEEVWTSDVQYQVSPFNHGHKVAKFCYADKSLLNKAIEAALAARKEWDLKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 MEAIPCVVGDEEVWTSDVQYQVSPFNHGHKVAKFCYADKSLLNKAIEAALAARKEWDLKP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 IADRAQIFLKAADMLSGPRRAEILAKTMVGQGKTVIQAEIDAAAELIDFFRFNAKYAVEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 IADRAQIFLKAADMLSGPRRAEILAKTMVGQGKTVIQAEIDAAAELIDFFRFNAKYAVEL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 EGQQPISVPPSTNSTVYRGLEGFVAAISPFNFTAIGGNLAGAPALMGNVVLWKPSDTAML
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 EGQQPISVPPSTNSTVYRGLEGFVAAISPFNFTAIGGNLAGAPALMGNVVLWKPSDTAML
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 ASYAVYRILREAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKHLWKQVAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 ASYAVYRILREAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKHLWKQVAQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 NLDRFHTFPRLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSRLYVPHSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 NLDRFHTFPRLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSRLYVPHSL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB3 WPQIKGRLLEEHSRIKVGDPAEDFGTFFSAVIDAKSFARIKKWLEHARSSPSLTILAGGK
:::::::::::::::::::::::::::::::::::
CCDS81 WPQIKGRLLEEHSRIKVGDPAEDFGTFFSAVIDAK-------------------------
370 380 390
430 440 450 460 470 480
pF1KB3 CDDSVGYFVEPCIVESKDPQEPIMKEEIFGPVLSVYVYPDDKYKETLQLVDSTTSYGLTG
::::::::::::::::::::::::::::::::::
CCDS81 --------------------------EIFGPVLSVYVYPDDKYKETLQLVDSTTSYGLTG
400 410 420
490 500 510 520 530 540
pF1KB3 AVFSQDKDVVQEATKVLRNAAGNFYINDKSTGSIVGQQPFGGARASGTNDKPGGPHYILR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 AVFSQDKDVVQEATKVLRNAAGNFYINDKSTGSIVGQQPFGGARASGTNDKPGGPHYILR
430 440 450 460 470 480
550 560
pF1KB3 WTSPQVIKETHKPLGDWSYAYMQ
:::::::::::::::::::::::
CCDS81 WTSPQVIKETHKPLGDWSYAYMQ
490 500 510
>>CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 (501 aa)
initn: 365 init1: 157 opt: 496 Z-score: 586.8 bits: 118.3 E(32554): 2.3e-26
Smith-Waterman score: 588; 27.8% identity (58.1% similar) in 518 aa overlap (41-547:3-492)
20 30 40 50 60 70
pF1KB3 ALLSRPWTGAGLRWKHTSSLKVANEPVLAFTQGSPERDALQKALKDLKGRMEAIPCVVGD
..:.:. .: : ::: .. : ...
CCDS66 MSSSGTPDLPVL---LTDLKIQYTKI--FINN
10 20
80 90 100 110 120
pF1KB3 EEVWTSDVQYQVSPFNHGHKVAKFCYA---DKSLLNKAIEAALAARK---EWDLKPIADR
: : ..:. . : . ..: . :: ..::..:: : . : ..:
CCDS66 E--WHDSVSGKKFPVFNPATEEELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASER
30 40 50 60 70 80
130 140 150 160 170 180
pF1KB3 AQIFLKAADMLSGPRRAEILAKTMVGQGKTVIQAEIDAAAELIDFFRFNAKYAVELEGQQ
.... : ::.. : ..: : :: .: .. : : .:. : .: ...:.
CCDS66 GRLLYKLADLIERDRLLLATMESMNG-GKLYSNAYLNDLAGCIKTLRYCAGWADKIQGR-
90 100 110 120 130 140
190 200 210 220 230 240
pF1KB3 PISVPPSTNSTVYRGLE--GFVAAISPFNFTAIGGNLAGAPALM-GNVVLWKPSDTAMLA
..: . : .: : : . : :.:: . .::: ::.:. ::.. . :.
CCDS66 --TIPIDGNFFTYTRHEPIGVCGQIIPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLT
150 160 170 180 190 200
250 260 270 280 290 300
pF1KB3 SYAVYRILREAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKHLWKQVAQN
. : ...:::.::.....::. :: : ...: . . ::::. . : : :..: .
CCDS66 ALHVASLIKEAGFPPGVVNIVPGYGPTAGAAISSHMDIDKVAFTGSTEVGK-LIKEAAGK
210 220 230 240 250 260
310 320 330 340 350 360
pF1KB3 LDRFHTFPRLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSRLYVPHSLW
. . :.. : :::. .: .::....: . ...: . :: : : ::..: .:..
CCDS66 SN----LKRVTLELGGKSPCIVLADADLDNAVEFAHHGVFYHQGQCCIAASRIFVEESIY
270 280 290 300 310
370 380 390 400 410 420
pF1KB3 PQIKGRLLEEHSRIKVGDPAEDFGTFFSAVIDAKSFARIKKWLEHARSSPSLTILAGGKC
.. : .:. .. .:.: :. . :: ... .: .: ... . .::
CCDS66 DEFVRRSVERAKKYILGNPLTP-GVTQGPQIDKEQYDKILDLIESGKKEGAKLECGGGPW
320 330 340 350 360 370
430 440 450 460 470
pF1KB3 DDSVGYFVEPCIVESKDPQEPIMKEEIFGPVLSVYVYP--DDKYKETLQLVDSTTSYGLT
.. ::::.: . . . : :::::::: ... . :: :.. ..: :::.
CCDS66 GNK-GYFVQPTVFSNVTDEMRIAKEEIFGPVQQIMKFKSLDDVIKRA-----NNTFYGLS
380 390 400 410 420
480 490 500 510 520 530
pF1KB3 GAVFSQDKDVVQEATKVLRNAAGNFYINDKSTGSIVGQQPFGGARASGTNDKPGGPHYIL
..::..: : . ...:. ::. ..: : . .: :::: . :: : . : . .
CCDS66 AGVFTKDIDKAITISSALQ--AGTVWVN--CYGVVSAQCPFGGFKMSG-NGRELGEYGFH
430 440 450 460 470 480
540 550 560
pF1KB3 RWTSPQVIKETHKPLGDWSYAYMQ
..: ...
CCDS66 EYTEVKTVTVKISQKNS
490 500
>>CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 (923 aa)
initn: 395 init1: 130 opt: 498 Z-score: 585.0 bits: 118.8 E(32554): 2.9e-26
Smith-Waterman score: 498; 24.3% identity (58.4% similar) in 493 aa overlap (48-527:428-900)
20 30 40 50 60 70
pF1KB3 TGAGLRWKHTSSLKVANEPVLAFTQGSPERDALQKALKDLKGRMEAIPCVVGDEEVWTSD
: ..: .... .: : .. . . ..:
CCDS31 DVYMATKFEGFIQKVVRKLRGEDQEVELVVDYISKEVNEIMVKMP-YQCFINGQFTDADD
400 410 420 430 440 450
80 90 100 110 120 130
pF1KB3 VQ-YQ-VSPFNHGHKVAKFCYADKSLLNKAIEAALAARK--EWDLKPIADRAQIFLKAAD
. :. ..: . : . : ::. . ..::. :: : . :: .:.... . ::
CCDS31 GKTYDTINPTD-GSTICKVSYASLADVDKAVAAAKDAFENGEWGRMNARERGRLMYRLAD
460 470 480 490 500 510
140 150 160 170 180 190
pF1KB3 MLSGPRRAEILAKTMVGQGKTVIQAEIDAAAELIDFFRFNAKYAVELEGQQ-PIS-VPPS
.: . :. . . .: . : . .. ::. : . ...:. ::. . :.
CCDS31 LLE-ENQEELATIEALDSGAVYTLALKTHIGMSVQTFRYFAGWCDKIQGSTIPINQARPN
520 530 540 550 560 570
200 210 220 230 240
pF1KB3 TNSTVYRGLE-GFVAAISPFNFTAIGGNLAGAPALM-GNVVLWKPSDTAMLASYAVYRIL
: : . : : : :.:. . .: : ::... ::.... :.. ..
CCDS31 RNLTFTKKEPLGVCAIIIPWNYPLMMLAWKSAACLAAGNTLVLKPAQVTPLTALKFAELS
580 590 600 610 620 630
250 260 270 280 290 300
pF1KB3 REAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKHLWKQVAQNLDRFHTFP
.::.: ..:...:..: . :. .. . ..::::.: :.. :. : . ..
CCDS31 VKAGFPKGVINIIPGSGGIAGQRLSEHPDIRKLGFTGSTPIGKQIMKSCAVS-----NLK
640 650 660 670 680
310 320 330 340 350 360
pF1KB3 RLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSRLYVPHSLWPQIKGRLL
... : :::. .. . .....: . ..: :..: : .::.: .:. .. :..
CCDS31 KVSLELGGKSPLIIFNDCELDKAVRMGMGAVFFNKGENCIAAGRLFVEESIHDEFVTRVV
690 700 710 720 730 740
370 380 390 400 410 420
pF1KB3 EEHSRIKVGDPAE---DFGTFFSAVIDAKSFARIKKWLEHARSS--PSLTILAGGKCDDS
:: ...:.::: . : : . :...: :.. ... . :.. ::. .
CCDS31 EEIKKMKIGDPLDRSTDHG-------PQNHKAHLEKLLQYCETGVKEGATLVYGGRQVQR
750 760 770 780 790 800
430 440 450 460 470 480
pF1KB3 VGYFVEPCIVESKDPQEPIMKEEIFGPVLSVYVYPDDKYKETLQLVDSTTSYGLTGAVFS
:.:.:: . . . . ::: :::.. . . . .:: ..:: :::...::.
CCDS31 PGFFMEPTVFTDVEDYMYLAKEESFGPIMVISKFQNGDIDGVLQRANSTE-YGLASGVFT
810 820 830 840 850 860
490 500 510 520 530 540
pF1KB3 QDKDVVQEATKVLRNAAGNFYINDKSTGSIVGQQPFGGARASGTNDKPGGPHYILRWTSP
.: . .. ... :. ::. .:: . .... ::::.. ::
CCDS31 RDINKAMYVSEKLE--AGTVFINTYNKTDVAA--PFGGVKQSGFGKDLGEEALNEYLKTK
870 880 890 900 910
550 560
pF1KB3 QVIKETHKPLGDWSYAYMQ
CCDS31 TVTLEY
920
>>CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 (517 aa)
initn: 382 init1: 125 opt: 494 Z-score: 584.2 bits: 117.8 E(32554): 3.2e-26
Smith-Waterman score: 527; 25.6% identity (57.3% similar) in 511 aa overlap (36-533:7-495)
10 20 30 40 50 60
pF1KB3 PALRRALLSRPWTGAGLRWKHTSSLKVANEPVLAFTQGSPERDALQKALKD--LKGRMEA
: : :: : . :: . :. .
CCDS66 MLRFLAPRLLSLQGRTARYSSAAALPSPILNPDIPY
10 20 30
70 80 90 100 110
pF1KB3 IPCVVGDEEVWTSDVQYQVSPFNH---GHKVAKFCYADKSLLNKAIEAALAARK---EWD
...: : . :. .. : . :. ... .:.. ...:..:: : . :
CCDS66 NQLFINNE--WQDAVSKKTFPTVNPTTGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWR
40 50 60 70 80 90
120 130 140 150 160 170
pF1KB3 LKPIADRAQIFLKAADMLSGPRRAEILAKTMVGQGKTVIQAEIDAAAELIDFFRFNAKYA
..:.... . ::.. : . . . . .:: .. :.: .:. : .:
CCDS66 RMDASERGRLLNRLADLVERDR-VYLASLETLDNGKPFQESYALDLDEVIKVYRYFAGWA
100 110 120 130 140 150
180 190 200 210 220 230
pF1KB3 VELEGQQPISVPPSTNSTVYRGLE--GFVAAISPFNFTAIGGNLAGAPALM-GNVVLWKP
. .:. ..: . . . : : . : :.:: . . :::: ::.:. :
CCDS66 DKWHGK---TIPMDGQHFCFTRHEPVGVCGQIIPWNFPLVMQGWKLAPALATGNTVVMKV
160 170 180 190 200 210
240 250 260 270 280 290
pF1KB3 SDTAMLASYAVYRILREAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKHL
.. . :.. . ...:::.::...... . :: : .... . . ::::. . ::
CCDS66 AEQTPLSALYLASLIKEAGFPPGVVNIITGYGPTAGAAIAQHVDVDKVAFTGSTEV-GHL
220 230 240 250 260
300 310 320 330 340 350
pF1KB3 WKQVAQNLDRFHTFPRLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSRL
...: . . . :.. : :::. .: .::.: .: .. : :: : : ::
CCDS66 IQKAAGDSN----LKRVTLELGGKSPSIVLADADMEHAVEQCHEALFFNMGQCCCAGSRT
270 280 290 300 310 320
360 370 380 390 400 410
pF1KB3 YVPHSLWPQIKGRLLEEHSRIKVGDPAEDFGTFFSAVIDAKSFARIKKWLEHARSSPSLT
.: .:.. .. : .:. .. :::.: : . : . .: ..: :. ... ... .
CCDS66 FVEESIYNEFLERTVEKAKQRKVGNPFE-LDTQQGPQVDKEQFERVLGYIQLGQKEGA-K
330 340 350 360 370 380
420 430 440 450 460 470
pF1KB3 ILAGGKCDDSVGYFVEPCIVESKDPQEPIMKEEIFGPVLSVYVYPDDKYKETLQLVD--S
.: ::. :.:..: . . . . : :::::::: .. :.:. ..:. .
CCDS66 LLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFGPVQPLF-----KFKKIEEVVERAN
390 400 410 420 430
480 490 500 510 520 530
pF1KB3 TTSYGLTGAVFSQDKDVVQEATKVLRNAAGNFYINDKSTGSIVGQQPFGGARASGTNDKP
.: :::..:::..: : .. :..:. ::. ..: . . .. . :::: . ::.. .
CCDS66 NTRYGLAAAVFTRDLDKAMYFTQALQ--AGTVWVN--TYNIVTCHTPFGGFKESGNGREL
440 450 460 470 480 490
540 550 560
pF1KB3 GGPHYILRWTSPQVIKETHKPLGDWSYAYMQ
:
CCDS66 GEDGLKAYTEVKTVTIKVPQKNS
500 510
>>CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 (518 aa)
initn: 389 init1: 133 opt: 491 Z-score: 580.6 bits: 117.2 E(32554): 5.1e-26
Smith-Waterman score: 566; 28.2% identity (62.4% similar) in 458 aa overlap (88-533:61-494)
60 70 80 90 100 110
pF1KB3 KGRMEAIPCVVGDEEVWTSDVQYQVSPFNHGHKVAKF-CYADKSLLNKAIEAALAARKEW
:. .: : : ..: . : :.. : :: : :
CCDS12 VVSQPLNYRGGARVEPADASGTEKAFEPATGRVIATFTCSGEKEV-NLAVQNAKAAFKIW
40 50 60 70 80
120 130 140 150 160 170
pF1KB3 DLKPIADRAQIFLKAADMLSGPRRAEILAKTMVGQGKTVIQA--EIDAAAELIDFFRFNA
. : .: .:.:.:: .. :. :: . ...::....: .:: . . .... :
CCDS12 SQKSGMERCRILLEAARIIR-EREDEIATMECINNGKSIFEARLDIDISWQCLEYY---A
90 100 110 120 130 140
180 190 200 210 220 230
pF1KB3 KYAVELEGQQPISVPPSTNSTVYRGLEGFVAAISPFNFTAIGGNLAGAPALM-GNVVLWK
:. . :.. :..: .. . . : : ..:. .:. .. .:::: ::....:
CCDS12 GLAASMAGEH-IQLPGGSFGYTRREPLGVCVGIGAWNYPFQIASWKSAPALACGNAMVFK
150 160 170 180 190 200
240 250 260 270 280 290
pF1KB3 PSDTAMLASYAVYRILREAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKH
:: . ... . .: :::.::.... : . : :. . . . ..::::::: .
CCDS12 PSPFTPVSALLLAEIYSEAGVPPGLFNVVQG-GAATGQFLCQHPDVAKVSFTGSVPTGMK
210 220 230 240 250 260
300 310 320 330 340 350
pF1KB3 LWKQVAQNLDRFHTFPRLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSR
. .. :... : .. : :::. .. . :....:.:.: . : :: : .:
CCDS12 IMEMSAKGIK-----P-VTLELGGKSPLIIFSDCDMNNAVKGALMANFLTQGQVCCNGTR
270 280 290 300 310
360 370 380 390 400 410
pF1KB3 LYVPHSLWPQIKGRLLEEHSRIKVGDPA-EDFGTFFSAVIDAKSFARIKKWLEHARSSPS
..: . . .. ..... .:::.::: :: : .. .:. . :. ... :. . .
CCDS12 VFVQKEILDKFTEEVVKQTQRIKIGDPLLED--TRMGPLINRPHLERVLGFVKVAKEQGA
320 330 340 350 360 370
420 430 440 450 460
pF1KB3 LTILAGGKC----DDSV--GYFVEPCIVESKDPQEPIMKEEIFGPVLSVYVYPDDKYKET
.: :: : .. ::...::.. . . .::::::::.:. . : :.
CCDS12 -KVLCGGDIYVPEDPKLKDGYYMRPCVLTNCRDDMTCVKEEIFGPVMSILSF--DTEAEV
380 390 400 410 420 430
470 480 490 500 510 520
pF1KB3 LQLVDSTTSYGLTGAVFSQDKDVVQEATKVLRN-AAGNFYINDKSTGSIVGQQPFGGARA
:. ...:: .::...::..: .:.: .:. . ::. .::. ... . . :::: .
CCDS12 LERANDTT-FGLAAGVFTRD---IQRAHRVVAELQAGTCFINNYNVSPV--ELPFGGYKK
440 450 460 470 480
530 540 550 560
pF1KB3 SGTNDKPGGPHYILRWTSPQVIKETHKPLGDWSYAYMQ
:: . . :
CCDS12 SGFGRENGRVTIEYYSQLKTVCVEMGDVESAF
490 500 510
>>CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 (512 aa)
initn: 495 init1: 155 opt: 490 Z-score: 579.5 bits: 117.0 E(32554): 5.8e-26
Smith-Waterman score: 594; 27.8% identity (58.6% similar) in 529 aa overlap (39-556:7-509)
10 20 30 40 50 60
pF1KB3 RRALLSRPWTGAGLRWKHTSSLKVANEPVLAFTQGSPERD--ALQKALKDLKGRMEAIPC
: .:.:.: :: . ...:. .. :
CCDS10 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKI--
10 20 30
70 80 90 100 110 120
pF1KB3 VVGDEEVW---TSDVQYQVSPFNHGHKVAKFCYADKSLLNKAIEAALAARKE---WDLKP
...: : : .. . . ... . .:: ..::.::: .: .. :
CCDS10 FINNE--WHESKSGKKFATCNPSTREQICEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLD
40 50 60 70 80 90
130 140 150 160 170 180
pF1KB3 IADRAQIFLKAADMLSGPRRAEILAKTMVGQGKTVIQAEIDAAAELIDFFRFNAKYAVEL
.:.... . ::.. : : . : . :: ..: . : .:. : .: ..
CCDS10 ALSRGRLLHQLADLVERDR-ATLAALETMDTGKPFLHAFFIDLEGCIRTLRYFAGWADKI
100 110 120 130 140 150
190 200 210 220 230
pF1KB3 EGQQPISVPPSTNSTVYRGLE--GFVAAISPFNFTAIGGNLAGAPALM-GNVVLWKPSDT
.:. ..: . : . . : : .::.:.:: . :::: ::... ::..
CCDS10 QGK---TIPTDDNVVCFTRHEPIGVCGAITPWNFPLLMLVWKLAPALCCGNTMVLKPAEQ
160 170 180 190 200
240 250 260 270 280 290
pF1KB3 AMLASYAVYRILREAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKHLWKQ
. :.. . ...:::.::.....::. :: : ...: .. : ::::. . : : :.
CCDS10 TPLTALYLGSLIKEAGFPPGVVNIVPGFGPTVGAAISSHPQINKIAFTGSTEVGK-LVKE
210 220 230 240 250 260
300 310 320 330 340 350
pF1KB3 VAQNLDRFHTFPRLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSRLYVP
.:. .. :.. : :::: .: .::.. .: . ...: :: :.: ::..:
CCDS10 AASR----SNLKRVTLELGGKNPCIVCADADLDLAVECAHQGVFFNQGQCCTAASRVFVE
270 280 290 300 310 320
360 370 380 390 400 410
pF1KB3 HSLWPQIKGRLLEEHSRIKVGDPAEDFGTFFSAVIDAKSFARIKKWLEHARSSPSLTILA
.... .. : .: .. :::: : : . :: :.: .: . .: ... . .
CCDS10 EQVYSEFVRRSVEYAKKRPVGDPF-DVKTEQGPQIDQKQFDKILELIESGKKEGA-KLEC
330 340 350 360 370 380
420 430 440 450 460 470
pF1KB3 GGKCDDSVGYFVEPCIVESKDPQEPIMKEEIFGPVLSVYVYPDDKYKETLQLVDSTTSYG
::. .. : :..: . . : :::::::: . . . .:... ..:: .::
CCDS10 GGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGPVQPILKFKS--IEEVIKRANST-DYG
390 400 410 420 430
480 490 500 510 520 530
pF1KB3 LTGAVFSQDKDVVQEATKVLRNAAGNFYINDKSTGSIVGQQPFGGARASGTNDKPGGPHY
::.:::... : . . ...:.. :. .:: ... .: :::: . :: : . : .
CCDS10 LTAAVFTKNLDKALKLASALES--GTVWIN--CYNALYAQAPFGGFKMSG-NGRELGEYA
440 450 460 470 480 490
540 550 560
pF1KB3 ILRWTSPQVIKETHKPLGDWSYAYMQ
. ..: .: . :::
CCDS10 LAEYTE---VKTVTIKLGDKNP
500 510
>>CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 (487 aa)
initn: 429 init1: 157 opt: 489 Z-score: 578.7 bits: 116.7 E(32554): 6.5e-26
Smith-Waterman score: 489; 26.5% identity (60.2% similar) in 437 aa overlap (99-527:44-464)
70 80 90 100 110 120
pF1KB3 GDEEVWTSDVQYQVSPFNHGHKVAKFCYADKSLLNKAIEAALAARKEWDLKPIADRAQIF
:. .. :..:: : :. . .:....
CCDS51 IDGKFLPCSSYIDSYDPSTGEVYCRVPNSGKDEIEAAVKAAREAFPSWSSRSPQERSRVL
20 30 40 50 60 70
130 140 150 160 170 180
pF1KB3 LKAADMLSGPRRAEILAKTMVGQGKTVIQAEIDAAAELIDFFRFNAKYAVELEGQQPISV
..::.: . :.. ::::. :. . .. ::: :. ... ..
CCDS51 NQVADLLEQSLEEFAQAESK-DQGKTLALARTMDIPRSVQNFRFFASSSLHHTSECTQMD
80 90 100 110 120 130
190 200 210 220 230 240
pF1KB3 PPSTNSTVYRGLEGFVAAISPFNFTAIGGNLAGAPALM-GNVVLWKPSDTAMLASYAVYR
. . :. : .. :::.:. . :::. ::.:. :::. . .... . .
CCDS51 HLGCMHYTVRAPVGVAGLISPWNLPLYLLTWKIAPAMAAGNTVIAKPSELTSVTAWMLCK
140 150 160 170 180 190
250 260 270 280 290 300
pF1KB3 ILREAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKHLWKQVAQNLDRFHT
.: .::.::.....: . :: :....: .. :.:::: :: . ...: :. :
CCDS51 LLDKAGVPPGVVNIVFGTGPRVGEALVSHPEVPLISFTGSQPTAE----RITQ-LSAPHC
200 210 220 230 240
310 320 330 340 350 360
pF1KB3 FPRLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSRLYVPHSLWPQIKGR
.:. : :::: .. ..:... . .:.::.: :. : ::..: .:.. .. :
CCDS51 -KKLSLELGGKNPAIIFEDANLDECIPATVRSSFANQGEICLCTSRIFVQKSIYSEFLKR
250 260 270 280 290 300
370 380 390 400 410 420
pF1KB3 LLEEHSRIKVGDPAEDFGTFFSAVIDAKSFARIKKWLEHARSSPSLTILAGGKCD-----
..: . ::: :.. . .. .:.:. . ........: . . : : :
CCDS51 FVEATRKWKVGIPSDPLVSI-GALISKAHLEKVRSYVKRALAEGA-QIWCGEGVDKLSLP
310 320 330 340 350 360
430 440 450 460 470 480
pF1KB3 --DSVGYFVEPCIVESKDPQEPIMKEEIFGPVLSVYVYPDDKYKETLQLVDSTTSYGLTG
...:::. : .. . . : ::::::: : : :. .:... .... .:::..
CCDS51 ARNQAGYFMLPTVITDIKDESCCMTEEIFGPVTCV--VPFDSEEEVIERANNV-KYGLAA
370 380 390 400 410 420
490 500 510 520 530 540
pF1KB3 AVFSQDKDVVQEATKVLRNAAGNFYINDKSTGSIVGQQPFGGARASGTNDKPGGPHYILR
.:.:.. :....: :. .: . : . . :::: ..::
CCDS51 TVWSSNVGRVHRVAKKLQ--SGLVWTNCWLIREL--NLPFGGMKSSGIGREGAKDSYDFF
430 440 450 460 470
550 560
pF1KB3 WTSPQVIKETHKPLGDWSYAYMQ
CCDS51 TEIKTITVKH
480
>>CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 (497 aa)
initn: 411 init1: 146 opt: 476 Z-score: 563.1 bits: 113.9 E(32554): 4.8e-25
Smith-Waterman score: 556; 27.4% identity (59.7% similar) in 471 aa overlap (74-533:25-475)
50 60 70 80 90 100
pF1KB3 SPERDALQKALKDLKGRMEAIPCVVGDEEVWTSDVQYQVSP-FNH--GHKVAKFCYADKS
: .. . .: : .: :..: . :::.
CCDS55 MKNQCETVWLKSPIKLKLIFINNEWQNSESGRVFPVYNPATGEQVCEVQEADKA
10 20 30 40 50
110 120 130 140 150
pF1KB3 LLNKAIEAALAARKE---WDLKPIADRAQIFLKAADMLSGPRRAEILAKTMVGQGKTVIQ
..::..:: : . : ..:.... : ::.. : . ... : :: .:
CCDS55 DIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATMESLNG-GKPFLQ
60 70 80 90 100 110
160 170 180 190 200 210
pF1KB3 AEIDAAAELIDFFRFNAKYAVELEGQQPISVPPSTNSTVYRGLE--GFVAAISPFNFTAI
: .: ::. : .: ...: ...: . . .. : : . : :.:: .
CCDS55 AFYVDLQGVIKTFRYYAGWADKIHG---MTIPVDGDYFTFTRHEPIGVCGQIIPWNFPLL
120 130 140 150 160 170
220 230 240 250 260 270
pF1KB3 GGNLAGAPALM-GNVVLWKPSDTAMLASYAVYRILREAGLPPNIIQFVPADGPLFGDTVT
:::: ::.:. ::.. . :.. . ...:::.::..:...:. :: : ...
CCDS55 MFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGPTAGAAIA
180 190 200 210 220 230
280 290 300 310 320 330
pF1KB3 SSEHLCGINFTGSVPTFKHLWKQVAQNLDRFHTFPRLAGECGGKNFHFVHRSADVESVVS
: . : ::::. . : . . .... .. :.. : :::. ... .::.. .:
CCDS55 SHIGIDKIAFTGSTEVGKLIQEAAGRS-----NLKRVTLELGGKSPNIIFADADLDYAVE
240 250 260 270 280
340 350 360 370 380 390
pF1KB3 GTLRSAFEYGGQKCSACSRLYVPHSLWPQIKGRLLEEHSRIKVGDPAEDFGTFFSAVIDA
. ...: :: :.: ::..: .:.. .. : .:. .: ::.: : : . ::
CCDS55 QAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPF-DPTTEQGPQIDK
290 300 310 320 330 340
400 410 420 430 440 450
pF1KB3 KSFARIKKWLEHARSSPSLTILAGGKCDDSVGYFVEPCIVESKDPQEPIMKEEIFGPVLS
:.. .: . .. . . . . ::: :.:.:: . . . : ::::::::
CCDS55 KQYNKILELIQSG-VAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQE
350 360 370 380 390 400
460 470 480 490 500 510
pF1KB3 VYVYPDDKYKETLQLVD--STTSYGLTGAVFSQDKDVVQEATKVLRNAAGNFYINDKSTG
. ..: .... .....::..:::..: . . ...... ::. .:: .
CCDS55 IL-----RFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQ--AGTVWIN--CYN
410 420 430 440 450
520 530 540 550 560
pF1KB3 SIVGQQPFGGARASGTNDKPGGPHYILRWTSPQVIKETHKPLGDWSYAYMQ
.. .:.:::: . ::.. . :
CCDS55 ALNAQSPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
460 470 480 490
563 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 21:54:56 2016 done: Sat Nov 5 21:54:57 2016
Total Scan time: 3.190 Total Display time: 0.090
Function used was FASTA [36.3.4 Apr, 2011]