FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA0408, 947 aa
1>>>pF1KA0408 947 - 947 aa - 947 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 13.2264+/-0.0012; mu= -11.7648+/- 0.072
mean_var=524.7221+/-108.756, 0's: 0 Z-trim(116.5): 21 B-trim: 881 in 2/51
Lambda= 0.055990
statistics sampled from 17066 (17079) to 17066 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.784), E-opt: 0.2 (0.525), width: 16
Scan time: 6.080
The best scores are: opt bits E(32554)
CCDS43505.1 SOGA3 gene_id:387104|Hs108|chr6 ( 947) 6211 516.9 7.5e-146
CCDS54459.1 SOGA1 gene_id:140710|Hs108|chr20 (1661) 1456 133.0 4.7e-30
CCDS11841.1 MTCL1 gene_id:23255|Hs108|chr18 (1586) 1353 124.6 1.5e-27
CCDS46598.1 SOGA1 gene_id:140710|Hs108|chr20 (1016) 1342 123.6 2e-27
>>CCDS43505.1 SOGA3 gene_id:387104|Hs108|chr6 (947 aa)
initn: 6211 init1: 6211 opt: 6211 Z-score: 2732.0 bits: 516.9 E(32554): 7.5e-146
Smith-Waterman score: 6211; 100.0% identity (100.0% similar) in 947 aa overlap (1-947:1-947)
10 20 30 40 50 60
pF1KA0 MSQPPIGGAAPATAAASPAAAATEARLHPEGSSRKQQRAQSPARPRDSSLRQTIAATRSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MSQPPIGGAAPATAAASPAAAATEARLHPEGSSRKQQRAQSPARPRDSSLRQTIAATRSP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA0 VGAGTKLNSVRQQQLQQQQQQGNKTGSRTGPPASIRGGGGGAEKATPLAPKGAAPGAVQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VGAGTKLNSVRQQQLQQQQQQGNKTGSRTGPPASIRGGGGGAEKATPLAPKGAAPGAVQP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA0 VAGAEAAPAATLAALGGRRPGPPEEPPRELESVPSKLGEPPPLGEGGGGGGEGGGAGGGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VAGAEAAPAATLAALGGRRPGPPEEPPRELESVPSKLGEPPPLGEGGGGGGEGGGAGGGS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA0 GEREGGAPQPPPPRGWRGKGVRAQQRGGSGGEGASPSPSSSSAGKTPGTGSRNSGSGVAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GEREGGAPQPPPPRGWRGKGVRAQQRGGSGGEGASPSPSSSSAGKTPGTGSRNSGSGVAG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA0 GGSGGGGSYWKEGCLQSELIQFHLKKERAAAAAAAAQMHAKNGGGSSSRSSPVSGPPAVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GGSGGGGSYWKEGCLQSELIQFHLKKERAAAAAAAAQMHAKNGGGSSSRSSPVSGPPAVC
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA0 ETLAVASASPMAAAAEGPQQSAEGSASGGGMQAAAPPSSQPHPQQLQEQEEMQEEMEKLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ETLAVASASPMAAAAEGPQQSAEGSASGGGMQAAAPPSSQPHPQQLQEQEEMQEEMEKLR
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA0 EENETLKNEIDELRTEMDEMRDTFFEEDACQLQEMRHELERANKNCRILQYRLRKAERKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EENETLKNEIDELRTEMDEMRDTFFEEDACQLQEMRHELERANKNCRILQYRLRKAERKR
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA0 LRYAQTGEIDGELLRSLEQDLKVAKDVSVRLHHELENVEEKRTTTEDENEKLRQQLIEVE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LRYAQTGEIDGELLRSLEQDLKVAKDVSVRLHHELENVEEKRTTTEDENEKLRQQLIEVE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA0 IAKQALQNELEKMKELSLKRRGSKDLPKSEKKAQQTPTEEDNEDLKCQLQFVKEEAALMR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 IAKQALQNELEKMKELSLKRRGSKDLPKSEKKAQQTPTEEDNEDLKCQLQFVKEEAALMR
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA0 KKMAKIDKEKDRFEHELQKYRSFYGDLDSPLPKGEAGGPPSTREAELKLRLRLVEEEANI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KKMAKIDKEKDRFEHELQKYRSFYGDLDSPLPKGEAGGPPSTREAELKLRLRLVEEEANI
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA0 LGRKIVELEVENRGLKAELDDLRGDDFNGSANPLMREQSESLSELRQHLQLVEDETELLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LGRKIVELEVENRGLKAELDDLRGDDFNGSANPLMREQSESLSELRQHLQLVEDETELLR
610 620 630 640 650 660
670 680 690 700 710 720
pF1KA0 RNVADLEEQNKRITAELNKYKYKSGGHDSARHHDNAKTEALQEELKAARLQINELSGKVM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 RNVADLEEQNKRITAELNKYKYKSGGHDSARHHDNAKTEALQEELKAARLQINELSGKVM
670 680 690 700 710 720
730 740 750 760 770 780
pF1KA0 QLQYENRVLMSNMQRYDLASHLGIRGSPRDSDAESDAGKKESDDDSRPPHRKREGPIGGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QLQYENRVLMSNMQRYDLASHLGIRGSPRDSDAESDAGKKESDDDSRPPHRKREGPIGGE
730 740 750 760 770 780
790 800 810 820 830 840
pF1KA0 SDSEEVRNIRCLTPTRSFYPAPGPWPKSFSDRQQMKDIRSEAERLGKTIDRLIADTSTII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SDSEEVRNIRCLTPTRSFYPAPGPWPKSFSDRQQMKDIRSEAERLGKTIDRLIADTSTII
790 800 810 820 830 840
850 860 870 880 890 900
pF1KA0 TEARIYVANGDLFGLMDEEDDGSRIREHELLYRINAQMKAFRKELQTFIDRLEVPKSADD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 TEARIYVANGDLFGLMDEEDDGSRIREHELLYRINAQMKAFRKELQTFIDRLEVPKSADD
850 860 870 880 890 900
910 920 930 940
pF1KA0 RGAEEPISVSQMFQPIILLILILVLFSSLSYTTIFKLVFLFTLFFVL
:::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 RGAEEPISVSQMFQPIILLILILVLFSSLSYTTIFKLVFLFTLFFVL
910 920 930 940
>>CCDS54459.1 SOGA1 gene_id:140710|Hs108|chr20 (1661 aa)
initn: 1104 init1: 677 opt: 1456 Z-score: 653.0 bits: 133.0 E(32554): 4.7e-30
Smith-Waterman score: 1553; 42.1% identity (67.6% similar) in 760 aa overlap (161-888:8-727)
140 150 160 170 180
pF1KA0 TLAALGGRRPGPPEEPPRELESVPSKLGEPPPLGEGGGGGGEGGGAGGGSGEREGG--AP
::. : : . . : . . ::. . ::
CCDS54 MEAPAAEPPVR---GCGPQPAPAPAPAPERKKSHRAP
10 20 30
190 200 210 220 230 240
pF1KA0 QPPPPR---GWR-GKGVRAQQRGGSGGEGASPSPSSSSAGKTPGTGSRNSGSGVAGGGSG
.: :. :: .:: :. :.. . .:. : .. :.. . :.:..: ::: .:
CCDS54 SPARPKDVAGWSLAKGRRGPGPGSAVACSAAFSSRPDKKGRAVAPGARGAGVRVAGVRTG
40 50 60 70 80 90
250 260 270 280 290 300
pF1KA0 -GGGSYWKEGCLQSELIQFHLKKERAAAAAAAAQMHAKNGG---GSSSRSSPVSGPPAVC
. . . : . .. .. :. .:. : . :: . ..: ::
CCDS54 VRAKGRPRSGAGPRPPPPPPSLTDSSSEVSDCASEEARLLGLELALSSDAESAAGGPAGV
100 110 120 130 140 150
310 320 330 340 350
pF1KA0 ETLAVASASPMAAAAEGPQQSA-EGSASGGGMQAAAPP--SSQPHPQQLQEQEE-----M
.: :. .: : : : : :...... .. : .: . .:. . .
CCDS54 RTGQPAQPAPSAQQPPRPPASPDEPSVAASSVGSSRLPLSASLAFSDLTEEMLDCGPSGL
160 170 180 190 200 210
360 370 380 390 400 410
pF1KA0 QEEMEKLREENETLKNEIDELRTEMDEMRDTFFEEDACQLQEMRHELERANKNCRILQYR
.:.:.:: ::. ::.::.:::.:: ::::...:::. ::::.:..:..:.:.:::::::
CCDS54 VRELEELRSENDYLKDEIEELRAEMLEMRDVYMEEDVYQLQELRQQLDQASKTCRILQYR
220 230 240 250 260 270
420 430 440 450 460 470
pF1KA0 LRKAERKRLRYAQTGEIDGELLRSLEQDLKVAKDVSVRLHHELENVEEKRTTTEDENEKL
::::::. :: ::::..::::.:.::::.::.::.:.:::.::: ::.::. :.:::.:
CCDS54 LRKAERRSLRAAQTGQVDGELIRGLEQDVKVSKDISMRLHKELEVVEKKRARLEEENEEL
280 290 300 310 320 330
480 490 500 510 520 530
pF1KA0 RQQLIEVEIAKQALQNELEKMKELSLKRRGSKDLPKSEKKAQQTPTEEDNEDLKCQLQFV
::.:::.:.:::.::.:::. .: :::.::...: :..:: : ..::. ::::::.:.
CCDS54 RQRLIETELAKQVLQTELERPREHSLKKRGTRSLGKADKK---TLVQEDSADLKCQLHFA
340 350 360 370 380 390
540 550 560 570 580 590
pF1KA0 KEEAALMRKKMAKIDKEKDRFEHELQKYRSFYGDLDSPLPKGEAGGPPSTREAELKLRLR
:::.::: ::..:. ::.: ...:: ::::.:::::: : : . : .::.:::..:.
CCDS54 KEESALMCKKLTKLAKENDSMKEELLKYRSLYGDLDSALSAEELADAPHSRETELKVHLK
400 410 420 430 440 450
600 610 620 630 640
pF1KA0 LVEEEANILGRKIVELEVENRGLKAELDDLRGDDFNGSANPLMR---------EQSESLS
:::::::.:.:.:::::::::::.::.::.. : .: ..: : : .:::.
CCDS54 LVEEEANLLSRRIVELEVENRGLRAEMDDMK-DHGGGCGGPEARLAFSALGGGECGESLA
460 470 480 490 500 510
650 660 670 680 690 700
pF1KA0 ELRQHLQLVEDETELLRRNVADLEEQNKRITAELNKYKYKSGGHDSARHHDNAK--TEAL
:::.:::.::.:.:::::. :.::.::: . :: :.. . : : .:. . .:
CCDS54 ELRRHLQFVEEEAELLRRSSAELEDQNKLLLNELAKFRSEHE-LDVALSEDSCSVLSEPS
520 530 540 550 560
710 720 730 740 750 760
pF1KA0 QEELKAARLQINELSGKVMQLQYENRVLMSNMQRYDLASHLGIRGSPR-DSDAESDAGKK
:::: ::.:::.:::::: .::::::::.::.:: :::: . : : ..::: ::
CCDS54 QEELAAAKLQIGELSGKVKKLQYENRVLLSNLQRCDLASCQSTR--PMLETDAE--AG--
570 580 590 600 610 620
770 780 790 800 810 820
pF1KA0 ESDDDSRPPHRKREGPIGGESDSEEVRNIRCLTPTRSFYPAPGPWPKSFSDRQQMKDIRS
:. . : .:.: .:. :: : .: :: .:
CCDS54 --DSAQCVP-----APLGETHESHAVR----LCRAREAEVLPG--------------LRE
630 640 650
830 840 850 860 870
pF1KA0 EAERLGKTIDRLIADTSTIITEARIYVAN--GDLFGLMDEEDDGSRIREHELLYRINAQM
.: ..:.:: :.::.. . . :. . : .: : : . :.. :. .:.. : ...
CCDS54 QAALVSKAIDVLVADANGFTAGLRLCLDNECAD-FRLHEAPDNSEGPRDTKLIHAILVRL
660 670 680 690 700 710
880 890 900 910 920 930
pF1KA0 KAFRKELQTFIDRLEVPKSADDRGAEEPISVSQMFQPIILLILILVLFSSLSYTTIFKLV
.....::..:
CCDS54 SVLQQELNAFTRKADAVLGCSVKEQQESFSSLPPLGSQGLSKEILLAKDLGSDFQPPDFR
720 730 740 750 760 770
>>CCDS11841.1 MTCL1 gene_id:23255|Hs108|chr18 (1586 aa)
initn: 1391 init1: 662 opt: 1353 Z-score: 608.3 bits: 124.6 E(32554): 1.5e-27
Smith-Waterman score: 1906; 58.8% identity (82.2% similar) in 539 aa overlap (377-892:1-533)
350 360 370 380 390 400
pF1KA0 QEQEEMQEEMEKLREENETLKNEIDELRTEMDEMRDTFFEEDACQLQEMRHELERANKNC
:.::::...:::. ::::.:.::.::::::
CCDS11 MEEMRDSYLEEDVYQLQELRRELDRANKNC
10 20 30
410 420 430 440 450 460
pF1KA0 RILQYRLRKAERKRLRYAQTGEIDGELLRSLEQDLKVAKDVSVRLHHELENVEEKRTTTE
:::::::::::.: :. :.::..::::.:::::::::::::::::::::..:::::. .:
CCDS11 RILQYRLRKAEQKSLKVAETGQVDGELIRSLEQDLKVAKDVSVRLHHELKTVEEKRAKAE
40 50 60 70 80 90
470 480 490 500 510 520
pF1KA0 DENEKLRQQLIEVEIAKQALQNELEKMKELSLKRRGSKDLPKSEKKAQQTPTEEDNEDLK
:::: ::::.:::::.:::::::::..:: :::::..... : ::: : ...:. ::.
CCDS11 DENETLRQQMIEVEISKQALQNELERLKESSLKRRSTREMYK-EKK---TFNQDDSADLR
100 110 120 130 140
530 540 550 560 570 580
pF1KA0 CQLQFVKEEAALMRKKMAKIDKEKDRFEHELQKYRSFYGDLDSPLPKGEAGGPPSTREAE
:::::.:::: ::::::::. .:::..:.:::::.:.:::.::::: :::::::::::::
CCDS11 CQLQFAKEEAFLMRKKMAKLGREKDELEQELQKYKSLYGDVDSPLPTGEAGGPPSTREAE
150 160 170 180 190 200
590 600 610 620 630
pF1KA0 LKLRLRLVEEEANILGRKIVELEVENRGLKAELDDLRGD--------DFNGS--ANPLMR
:::::.::::::::::::::::::::::::::..:.::. : : ..:.
CCDS11 LKLRLKLVEEEANILGRKIVELEVENRGLKAEMEDMRGQQEREGPGRDHAPSIPTSPFG-
210 220 230 240 250 260
640 650 660 670 680 690
pF1KA0 EQSESLSELRQHLQLVEDETELLRRNVADLEEQNKRITAELNKYKYKS----GGHDSARH
.. :: .:::.:::.::.:.:::::.....:..:...: ::.:.:.. : .
CCDS11 DSLESSTELRRHLQFVEEEAELLRRSISEIEDHNRQLTHELSKFKFEPPREPGWLGEGAS
270 280 290 300 310 320
700 710 720 730 740 750
pF1KA0 HDNAKTEALQEELKAARLQINELSGKVMQLQYENRVLMSNMQRYDLASHLGIRG-SPRDS
. ::::::.:::::.::::::..::.::..:.::.:: :::.:::.:. :::::
CCDS11 PGAGGGAPLQEELKSARLQISELSGKVLKLQHENHALLSNIQRCDLAAHLGLRAPSPRDS
330 340 350 360 370 380
760 770 780 790 800
pF1KA0 DAESDAGKKESD-DDSRPPHRKREGPIGGESDSEEV----RNIRCLTPTRSFYPAPGPWP
:::::::::::: ..:: :. :::::.::::::::. .. :... : :
CCDS11 DAESDAGKKESDGEESRLPQPKREGPVGGESDSEEMFEKTSGFGSGKPSEASEPCPTELL
390 400 410 420 430 440
810 820 830 840 850 860
pF1KA0 KSFSDRQQMKDIRSEAERLGKTIDRLIADTSTIITEARIYVANGDLFG--LMDEEDDG-S
:. : . . .. ::.:: .:..:::.::.... .: . ... : : :. ::..: .
CCDS11 KAREDSEYLVTLKHEAQRLERTVERLITDTDSFLHDAGLR-GGAPLPGPGLQGEEEQGEG
450 460 470 480 490 500
870 880 890 900 910 920
pF1KA0 RIREHELLYRINAQMKAFRKELQTFIDRLEVPKSADDRGAEEPISVSQMFQPIILLILIL
.: .:: :::.::::.::::.:....
CCDS11 DQQEPQLLGTINAKMKAFKKELQAFLEQVNRIGDGLSPLPHLTESSSFLSTVTSVSRDSP
510 520 530 540 550 560
>>CCDS46598.1 SOGA1 gene_id:140710|Hs108|chr20 (1016 aa)
initn: 923 init1: 587 opt: 1342 Z-score: 606.0 bits: 123.6 E(32554): 2e-27
Smith-Waterman score: 1392; 49.2% identity (74.0% similar) in 526 aa overlap (377-888:1-489)
350 360 370 380 390 400
pF1KA0 QEQEEMQEEMEKLREENETLKNEIDELRTEMDEMRDTFFEEDACQLQEMRHELERANKNC
: ::::...:::. ::::.:..:..:.:.:
CCDS46 MLEMRDVYMEEDVYQLQELRQQLDQASKTC
10 20 30
410 420 430 440 450 460
pF1KA0 RILQYRLRKAERKRLRYAQTGEIDGELLRSLEQDLKVAKDVSVRLHHELENVEEKRTTTE
::::::::::::. :: ::::..::::.:.::::.::.::.:.:::.::: ::.::. :
CCDS46 RILQYRLRKAERRSLRAAQTGQVDGELIRGLEQDVKVSKDISMRLHKELEVVEKKRARLE
40 50 60 70 80 90
470 480 490 500 510 520
pF1KA0 DENEKLRQQLIEVEIAKQALQNELEKMKELSLKRRGSKDLPKSEKKAQQTPTEEDNEDLK
.:::.:::.:::.:.:::.::.:::. .: :::.::...: :..:: : ..::. :::
CCDS46 EENEELRQRLIETELAKQVLQTELERPREHSLKKRGTRSLGKADKK---TLVQEDSADLK
100 110 120 130 140
530 540 550 560 570 580
pF1KA0 CQLQFVKEEAALMRKKMAKIDKEKDRFEHELQKYRSFYGDLDSPLPKGEAGGPPSTREAE
:::.:.:::.::: ::..:. ::.: ...:: ::::.:::::: : : . : .::.:
CCDS46 CQLHFAKEESALMCKKLTKLAKENDSMKEELLKYRSLYGDLDSALSAEELADAPHSRETE
150 160 170 180 190 200
590 600 610 620 630
pF1KA0 LKLRLRLVEEEANILGRKIVELEVENRGLKAELDDLRGDDFNGSANPLMR---------E
::..:.:::::::.:.:.:::::::::::.::.::.. : .: ..: : :
CCDS46 LKVHLKLVEEEANLLSRRIVELEVENRGLRAEMDDMK-DHGGGCGGPEARLAFSALGGGE
210 220 230 240 250 260
640 650 660 670 680 690
pF1KA0 QSESLSELRQHLQLVEDETELLRRNVADLEEQNKRITAELNKYKYKSGGHDSARHHDNAK
.:::.:::.:::.::.:.:::::. :.::.::: . :: :.. . : : .:. .
CCDS46 CGESLAELRRHLQFVEEEAELLRRSSAELEDQNKLLLNELAKFRSEHE-LDVALSEDSCS
270 280 290 300 310 320
700 710 720 730 740 750
pF1KA0 --TEALQEELKAARLQINELSGKVMQLQYENRVLMSNMQRYDLASHLGIRGSPR-DSDAE
.: :::: ::.:::.:::::: .::::::::.::.:: :::: . : : ..:::
CCDS46 VLSEPSQEELAAAKLQIGELSGKVKKLQYENRVLLSNLQRCDLASCQSTR--PMLETDAE
330 340 350 360 370 380
760 770 780 790 800 810
pF1KA0 SDAGKKESDDDSRPPHRKREGPIGGESDSEEVRNIRCLTPTRSFYPAPGPWPKSFSDRQQ
:: :. . : .:.: .:. :: : .: ::
CCDS46 --AG----DSAQCVP-----APLGETHESHAVR----LCRAREAEVLPG-----------
390 400 410
820 830 840 850 860 870
pF1KA0 MKDIRSEAERLGKTIDRLIADTSTIITEARIYVAN--GDLFGLMDEEDDGSRIREHELLY
.: .: ..:.:: :.::.. . . :. . : .: : : . :.. :. .:..
CCDS46 ---LREQAALVSKAIDVLVADANGFTAGLRLCLDNECAD-FRLHEAPDNSEGPRDTKLIH
420 430 440 450 460 470
880 890 900 910 920 930
pF1KA0 RINAQMKAFRKELQTFIDRLEVPKSADDRGAEEPISVSQMFQPIILLILILVLFSSLSYT
: ........::..:
CCDS46 AILVRLSVLQQELNAFTRKADAVLGCSVKEQQESFSSLPPLGSQGLSKEILLAKDLGSDF
480 490 500 510 520 530
947 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 23:23:39 2016 done: Sat Nov 5 23:23:40 2016
Total Scan time: 6.080 Total Display time: 0.120
Function used was FASTA [36.3.4 Apr, 2011]