FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA0802, 1545 aa
1>>>pF1KA0802 1545 - 1545 aa - 1545 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.2976+/-0.000965; mu= 11.3837+/- 0.058
mean_var=219.6042+/-44.229, 0's: 0 Z-trim(112.0): 49 B-trim: 86 in 2/50
Lambda= 0.086547
statistics sampled from 12829 (12863) to 12829 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.716), E-opt: 0.2 (0.395), width: 16
Scan time: 3.790
The best scores are: opt bits E(32554)
CCDS11841.1 MTCL1 gene_id:23255|Hs108|chr18 (1586) 6287 799.3 0
CCDS54459.1 SOGA1 gene_id:140710|Hs108|chr20 (1661) 1628 217.6 2.6e-55
CCDS46598.1 SOGA1 gene_id:140710|Hs108|chr20 (1016) 1622 216.7 3e-55
CCDS43505.1 SOGA3 gene_id:387104|Hs108|chr6 ( 947) 1353 183.1 3.7e-45
>>CCDS11841.1 MTCL1 gene_id:23255|Hs108|chr18 (1586 aa)
initn: 6287 init1: 6287 opt: 6287 Z-score: 4250.8 bits: 799.3 E(32554): 0
Smith-Waterman score: 10228; 97.3% identity (97.4% similar) in 1577 aa overlap (10-1545:10-1586)
10 20 30 40 50 60
pF1KA0 MEEMRDSYLEEDVYQLQELRRELDRANKNCRILQYRLRKAEQKSLKVAETGQVDGELIRS
:::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MEEMRDSYLEEDVYQLQELRRELDRANKNCRILQYRLRKAEQKSLKVAETGQVDGELIRS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA0 LEQDLKVAKDVSVRLHHELKTVEEKRAKAEDENETLRQQMIEVEISKQALQNELERLKES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LEQDLKVAKDVSVRLHHELKTVEEKRAKAEDENETLRQQMIEVEISKQALQNELERLKES
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA0 SLKRRSTREMYKEKKTFNQDDSADLRCQLQFAKEEAFLMRKKMAKLGREKDELEQELQKY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SLKRRSTREMYKEKKTFNQDDSADLRCQLQFAKEEAFLMRKKMAKLGREKDELEQELQKY
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA0 KSLYGDVDSPLPTGEAGGPPSTREAELKLRLKLVEEEANILGRKIVELEVENRGLKAEME
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KSLYGDVDSPLPTGEAGGPPSTREAELKLRLKLVEEEANILGRKIVELEVENRGLKAEME
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA0 DMRGQQEREGPGRDHAPSIPTSPFGDSLESSTELRRHLQFVEEEAELLRRSISEIEDHNR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 DMRGQQEREGPGRDHAPSIPTSPFGDSLESSTELRRHLQFVEEEAELLRRSISEIEDHNR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA0 QLTHELSKFKFEPPREPGWLGEGASPGAGGGAPLQEELKSARLQISELSGKVLKLQHENH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 QLTHELSKFKFEPPREPGWLGEGASPGAGGGAPLQEELKSARLQISELSGKVLKLQHENH
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA0 ALLSNIQRCDLAAHLGLRAPSPRDSDAESDAGKKESDGEESRLPQPKREGPVGGESDSEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 ALLSNIQRCDLAAHLGLRAPSPRDSDAESDAGKKESDGEESRLPQPKREGPVGGESDSEE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA0 MFEKTSGFGSGKPSEASEPCPTELLKAREDSEYLVTLKHEAQRLERTVERLITDTDSFLH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MFEKTSGFGSGKPSEASEPCPTELLKAREDSEYLVTLKHEAQRLERTVERLITDTDSFLH
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA0 DAGLRGGAPLPGPGLQGEEERGEGDQQEPQLLGTINAKMKAFKKELQAFLEQVNRIGDGL
::::::::::::::::::::.:::::::::::::::::::::::::::::::::::::::
CCDS11 DAGLRGGAPLPGPGLQGEEEQGEGDQQEPQLLGTINAKMKAFKKELQAFLEQVNRIGDGL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA0 SPLPHLTESSSFLSTVTSVSRDSPIGNLGKELGPDLQSRLKEQLEWQLGPARGDERESLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SPLPHLTESSSFLSTVTSVSRDSPIGNLGKELGPDLQSRLKEQLEWQLGPARGDERESLR
550 560 570 580 590 600
610 620
pF1KA0 LRAARELHRRADGDTGSHGLGGQTCFSLE-------------------------------
:::::::::::::::::::::::::::::
CCDS11 LRAARELHRRADGDTGSHGLGGQTCFSLELRGPPVLPEQSVSIEELQGQLVQAARLHQEE
610 620 630 640 650 660
630 640 650 660 670
pF1KA0 ----------MEEEHLYALRWKELEMHSLALQNTLHERTWSDEKNLMQQELRSLKQNIFL
::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 TETFTNKIHKMEEEHLYALRWKELEMHSLALQNTLHERTWSDEKNLMQQELRSLKQNIFL
670 680 690 700 710 720
680 690 700 710 720 730
pF1KA0 FYVKLRWLLKHWRQGKQMEEEGEEFTEGEHPETLSRLGELGVQGGHQADGPDHDSDRSCG
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::.::
CCDS11 FYVKLRWLLKHWRQGKQMEEEGEEFTEGEHPETLSRLGELGVQGGHQADGPDHDSDRGCG
730 740 750 760 770 780
740 750 760 770 780 790
pF1KA0 FPVGEHSPHSRVQIGDHSLRLQTADRGQPHKQVVENQQLFSAFKALLEDFRAELREDERA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 FPVGEHSPHSRVQIGDHSLRLQTADRGQPHKQVVENQQLFSAFKALLEDFRAELREDERA
790 800 810 820 830 840
800 810 820 830 840 850
pF1KA0 RLRLQQQYASDKAAWDVEWAVLKCRLEQLEEKTENKLGELGSSAESKGALKKEREVHQKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RLRLQQQYASDKAAWDVEWAVLKCRLEQLEEKTENKLGELGSSAESKGALKKEREVHQKL
850 860 870 880 890 900
860 870 880 890 900 910
pF1KA0 LADSHSLVMDLRWQIHHSEKNWNREKVELLDRLDRDRQEWERQKKEFLWRIEQLQKENSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LADSHSLVMDLRWQIHHSEKNWNREKVELLDRLDRDRQEWERQKKEFLWRIEQLQKENSP
910 920 930 940 950 960
920 930 940 950 960 970
pF1KA0 RRGGSFLCDQKDGNVRPFPHQGSLRMPRPVAMWPCADADSIPFEDRPLSKLKESDRCSAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RRGGSFLCDQKDGNVRPFPHQGSLRMPRPVAMWPCADADSIPFEDRPLSKLKESDRCSAS
970 980 990 1000 1010 1020
980 990 1000 1010 1020 1030
pF1KA0 ENLYLDALSLDDEPEEPPAHRPEREFRNRLPEEEENHKGNLQRAVSVSSMSEFQRLMDIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 ENLYLDALSLDDEPEEPPAHRPEREFRNRLPEEEENHKGNLQRAVSVSSMSEFQRLMDIS
1030 1040 1050 1060 1070 1080
1040 1050 1060 1070 1080 1090
pF1KA0 PFLPEKGLPSTSSKEDVTPPLSPDDLKYIEEFNKSWDYTPNRGHNGGGPDLWADRTEVGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PFLPEKGLPSTSSKEDVTPPLSPDDLKYIEEFNKSWDYTPNRGHNGGGPDLWADRTEVGR
1090 1100 1110 1120 1130 1140
1100 1110 1120 1130 1140 1150
pF1KA0 AGHEDSTEPFPDSSWYLTTSVTMTTDTMTSPEHCQKQPLRSHVLTEQSGLRVLHSPPAVR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AGHEDSTEPFPDSSWYLTTSVTMTTDTMTSPEHCQKQPLRSHVLTEQSGLRVLHSPPAVR
1150 1160 1170 1180 1190 1200
1160 1170 1180 1190 1200 1210
pF1KA0 RVDSITAAGGEGPFPTSRARGSPGDTKGGPPEPMLSRWPCTSPRHSRDYVEGARRPLDSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RVDSITAAGGEGPFPTSRARGSPGDTKGGPPEPMLSRWPCTSPRHSRDYVEGARRPLDSP
1210 1220 1230 1240 1250 1260
1220 1230 1240 1250 1260 1270
pF1KA0 LCTSLGFASPLHSLEMSKNLSDDMKEVAFSVRNAICSGPGELQVKDMACQTNGSRTMGTQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LCTSLGFASPLHSLEMSKNLSDDMKEVAFSVRNAICSGPGELQVKDMACQTNGSRTMGTQ
1270 1280 1290 1300 1310 1320
1280 1290 1300 1310 1320 1330
pF1KA0 TVQTISVGLQTEALRGSGVTSSPHKCLTPKAGGGATPVSSPSRSLRSRQVAPAIEKVQAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 TVQTISVGLQTEALRGSGVTSSPHKCLTPKAGGGATPVSSPSRSLRSRQVAPAIEKVQAK
1330 1340 1350 1360 1370 1380
1340 1350 1360 1370 1380 1390
pF1KA0 FERTCCSPKYGSPKLQRKPLPKADQPNNRTSPGMAQKGYSESAWARSTTTRESPVHTTIN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 FERTCCSPKYGSPKLQRKPLPKADQPNNRTSPGMAQKGYSESAWARSTTTRESPVHTTIN
1390 1400 1410 1420 1430 1440
1400 1410 1420 1430 1440 1450
pF1KA0 DGLSSLFNIIDHSPVVQDPFQKGLRAGSRSRSAEPRPELGPGQETGTNSRGRSPSPIGVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 DGLSSLFNIIDHSPVVQDPFQKGLRAGSRSRSAEPRPELGPGQETGTNSRGRSPSPIGVG
1450 1460 1470 1480 1490 1500
1460 1470 1480 1490 1500 1510
pF1KA0 SEMCREEGGEGTPVKQDLSAPPGYTLTENVARILNKKLLEHALKEERRQAAHGPPGLHSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SEMCREEGGEGTPVKQDLSAPPGYTLTENVARILNKKLLEHALKEERRQAAHGPPGLHSD
1510 1520 1530 1540 1550 1560
1520 1530 1540
pF1KA0 SHSLGDTAEPGPMENQTVLLTAPWGL
::::::::::::::::::::::::::
CCDS11 SHSLGDTAEPGPMENQTVLLTAPWGL
1570 1580
>>CCDS54459.1 SOGA1 gene_id:140710|Hs108|chr20 (1661 aa)
initn: 1998 init1: 662 opt: 1628 Z-score: 1106.6 bits: 217.6 E(32554): 2.6e-55
Smith-Waterman score: 2633; 37.5% identity (61.8% similar) in 1583 aa overlap (1-1534:239-1612)
10 20 30
pF1KA0 MEEMRDSYLEEDVYQLQELRRELDRANKNC
: :::: :.:::::::::::..::.:.:.:
CCDS54 CGPSGLVRELEELRSENDYLKDEIEELRAEMLEMRDVYMEEDVYQLQELRQQLDQASKTC
210 220 230 240 250 260
40 50 60 70 80 90
pF1KA0 RILQYRLRKAEQKSLKVAETGQVDGELIRSLEQDLKVAKDVSVRLHHELKTVEEKRAKAE
:::::::::::..::..:.::::::::::.::::.::.::.:.:::.::..::.:::. :
CCDS54 RILQYRLRKAERRSLRAAQTGQVDGELIRGLEQDVKVSKDISMRLHKELEVVEKKRARLE
270 280 290 300 310 320
100 110 120 130 140
pF1KA0 DENETLRQQMIEVEISKQALQNELERLKESSLKRRSTREMYK-EKKTFNQDDSADLRCQL
.::: :::..::.:..::.::.:::: .: :::.:.:: . : .:::. :.:::::.:::
CCDS54 EENEELRQRLIETELAKQVLQTELERPREHSLKKRGTRSLGKADKKTLVQEDSADLKCQL
330 340 350 360 370 380
150 160 170 180 190 200
pF1KA0 QFAKEEAFLMRKKMAKLGREKDELEQELQKYKSLYGDVDSPLPTGEAGGPPSTREAELKL
.:::::. :: ::..::..:.: ...:: ::.:::::.:: : . : . : .::.:::.
CCDS54 HFAKEESALMCKKLTKLAKENDSMKEELLKYRSLYGDLDSALSAEELADAPHSRETELKV
390 400 410 420 430 440
210 220 230 240 250 260
pF1KA0 RLKLVEEEANILGRKIVELEVENRGLKAEMEDMRGQQEREGPGRDHAPSIPTSPFGDSLE
.:::::::::.:.:.:::::::::::.:::.::. . : : . .. . :. :
CCDS54 HLKLVEEEANLLSRRIVELEVENRGLRAEMDDMKDHGGGCG-GPEARLAFSALGGGECGE
450 460 470 480 490 500
270 280 290 300 310 320
pF1KA0 SSTELRRHLQFVEEEAELLRRSISEIEDHNRQLTHELSKFKFEPPREPGWLGEGASPGAG
: .::::::::::::::::::: .:.::.:. : .::.::. : . . :.: . .
CCDS54 SLAELRRHLQFVEEEAELLRRSSAELEDQNKLLLNELAKFRSEHELDVA-LSEDSCSVLS
510 520 530 540 550 560
330 340 350 360 370 380
pF1KA0 GGAPLQEELKSARLQISELSGKVLKLQHENHALLSNIQRCDLAAHLGLRAPSPRDSDAES
: :::: .:.:::.:::::: :::.::..::::.::::::. . : : ..:::
CCDS54 --EPSQEELAAAKLQIGELSGKVKKLQYENRVLLSNLQRCDLASCQSTR-PM-LETDAE-
570 580 590 600 610 620
390 400 410 420 430 440
pF1KA0 DAGKKESDGEESRLPQPKREGPVGGESDSEEMFEKTSGFGSGKPSEASEPCPTELLKARE
:: :. . .: : .: . :.: . : .:::
CCDS54 -AG----DSAQC-VPAP---------------------LGETHESHAVRLC-----RARE
630 640
450 460 470 480 490 500
pF1KA0 DSEYLVTLKHEAQRLERTVERLITDTDSFLHDAGLRGGAPLPGPGLQGEE--ERGEGDQQ
.: : :...: . .... :..:...: :::: .. .: . .:: .
CCDS54 -AEVLPGLREQAALVSKAIDVLVADANGFT--AGLRLCLDNECADFRLHEAPDNSEGPR-
650 660 670 680 690 700
510 520 530 540 550 560
pF1KA0 EPQLLGTINAKMKAFKKELQAFLEQVNRIGDGLSPLPHLTESSSFLSTVTSVSRDSPIGN
. .:. .: ........::.:: .... . : : . . :: : : . : . .. :
CCDS54 DTKLIHAILVRLSVLQQELNAFTRKADAVL-GCS-VKEQQESFSSLPPLGSQGLSKEIL-
710 720 730 740 750 760
570 580 590 600
pF1KA0 LGKELGPDLQS-RLKEQLEWQ--------LGP--ARGDERESLR-LRA------ARELHR
:.:.:: :.: ... ::. : .. : .:.: :: : :...
CCDS54 LAKDLGSDFQPPDFRDLPEWEPRIREAFRTGDLDSKPDPSRSFRPYRAEDNDSYASEIKE
770 780 790 800 810 820
610 620 630 640 650
pF1KA0 R----ADGDTGSHGLGGQTC------------FSLEM---EEEHLYALRWKELEMHSLAL
:.. . .:: : :. .: .:.. :: .:.:..::.:
CCDS54 LQLVLAEAHDSLRGLQEQLSQERQLRKEEADNFNQKMVQLKEDQQRALLRREFELQSLSL
830 840 850 860 870 880
660 670 680 690 700 710
pF1KA0 QNTLHERTWSDEKNLMQQELRSLKQNIFLFYVKLRWLLKHWRQGKQMEEEGEEFTEGEHP
: :... ::.:::.. :: ...:.:..:...::::.::.::::: . ::..: :
CCDS54 QRRLEQKFWSQEKNMLVQESQQFKHNFLLLFMKLRWFLKRWRQGKVLPSEGDDFLE----
890 900 910 920 930
720 730 740 750 760 770
pF1KA0 ETLSRLGELGVQGGHQADGPDHDSDRSCGFPVGEHSPHSRVQIGDHSLRLQTADRGQPHK
.. . :: . .. . .:.....: :: . .. :..
CCDS54 --VNSMKELYLLMEEEEINAQHSDNKAC--------------TGD------SWTQNTPNE
940 950 960 970
780 790 800 810 820 830
pF1KA0 QVVENQQLFSAFKALLEDFRAELREDERARLRLQQQYASDKAAWDVEWAVLKCRLEQLEE
. . .. .:. :... ::...:. .::::.:. ::.:..: : :: . :.:
CCDS54 YI----KTLADMKVTLKELCWLLRDERRGLTELQQQFAKAKATWETERAELKGHTSQMEL
980 990 1000 1010 1020 1030
840 850 860 870 880 890
pF1KA0 KTENKLGELGSSAESKGALKKEREVHQKLLADSHSLVMDLRWQIHHSEKNWNREKVELLD
:: . :: .. . :.::..::: .:.:::.:.: ::.: :.. ::.::..::..:..
CCDS54 KTGKGAGER-AGPDWKAALQREREEQQHLLAESYSAVMELTRQLQISERNWSQEKLQLVE
1040 1050 1060 1070 1080 1090
900 910 920 930 940 950
pF1KA0 RLDRDRQEWERQKKEFLWRIEQLQKENSPRRGGSFLCDQKDGNVRPFPHQGSLRMPRPVA
::. ..:. :.: ::. :. :::: .:
CCDS54 RLQGEKQQVEQQVKELQNRLSQLQKAADP-------------------------------
1100 1110 1120
960 970 980 990 1000 1010
pF1KA0 MWPCADADSIPFEDRPLSKLKESDRCSASENLYLDALSLDDEPEEPPAHRPEREFRNRLP
: .. : : .: . . ::... : : .
CCDS54 -WVLKHSE--------LEKQDNSWKETRSEKIH------DKEA---------------VS
1130 1140 1150
1020 1030 1040 1050 1060 1070
pF1KA0 EEEENHKGNLQRAVSVSSMSEFQRLMDISPFLPEKGLPSTSSKEDVTPPLSPDDLKYIEE
: : . .: :.:. ::::::::. :.: ::.: : . ..: .: ..
CCDS54 EVELGGNG-LKRTKSVSSMSEFESLLDCSPYLA--GGDARGKKLPNNPAFG---------
1160 1170 1180 1190
1080 1090 1100 1110 1120 1130
pF1KA0 FNKSWDYTPNRGHNGGGPDLWADRTEVGRAGHEDSTEPFPDSSWYLTTSVTMTTDTMTSP
: .: : : :. .:. : : :.. ...
CCDS54 FVSS---EP------GDPE-------------KDTKEK-PG----LSSRDCNHLGALACQ
1200 1210 1220 1230
1140 1150 1160 1170 1180
pF1KA0 EHCQKQPLRSHVLTEQSGLRVLHSPPAVRRVDSITAAGGEG-----P-FPTSRARGSPGD
. .: ::.. ...:.:: .:::..::. .. :: : : . :. . .
CCDS54 DPPGRQMQRSYTAPDKTGIRVYYSPPVARRLGVPVVHDKEGKIIIEPGFLFTTAKPKESA
1240 1250 1260 1270 1280 1290
1190 1200 1210 1220 1230 1240
pF1KA0 TKGGPPEPMLSRWPCTSPRHSRDYVEGARRPLDSPLCTSLGFASPLHSLEMSKNLSDDMK
: : .:: :. ::. ..:. :: .. :: . ::..::: :.:::::
CCDS54 EADGLAESSYGRWLCN---FSRQRLDGGSA--GSPSAAGPGFPAALHDFEMSGNMSDDMK
1300 1310 1320 1330 1340
1250 1260 1270 1280 1290 1300
pF1KA0 EVAFSVRNAICSGPGELQVKDMACQTNGSRTMGTQTVQTISVGLQTEALRGSGVTSSPHK
:.. ::.:. :: : .::. . :: : ..::::..:.::::::. : :: :
CCDS54 EITNCVRQAMRSGSLERKVKSTSSQTVGLASVGTQTIRTVSVGLQTDPPR-----SSLH-
1350 1360 1370 1380 1390 1400
1310 1320 1330 1340 1350 1360
pF1KA0 CLTPKAGGGATPVSSPSRSLRSRQVAPAIEKVQAKFERTCCSPKYGSPKLQRKPLPKADQ
: . .: :: :.::.:.. ...::....:: :::::::::::::. . : :.
CCDS54 ------GKAWSPRSSSLVSVRSKQISSSLDKVHSRIERPCCSPKYGSPKLQRRSVSKLDS
1410 1420 1430 1440 1450
1370 1380 1390 1400 1410 1420
pF1KA0 PNNRTSPGMAQKGYSESAWARSTTTRESPVHTTINDGLSSLFNIIDHSPVVQDPFQKGLR
..:. .. : . ::::::::::.::: .:::::::::....:: ... .. :.
CCDS54 SKDRSLWNLHQGKQNGSAWARSTTTRDSPVLRNINDGLSSLFSVVEHSGSTESVWKLGM-
1460 1470 1480 1490 1500 1510
1430 1440 1450 1460 1470 1480
pF1KA0 AGSRSRSAEPRPELGPGQETGTNSRGRSPSPIGVGSEMCREEGGEGTPVKQDLSAPPGYT
:..:. :. : :: : ::.::: . ..: ::: . :: : .:
CCDS54 --SETRAKPEPPKYGIVQEFFRNVCGRAPSPTSSAGE-------EGTKKPEPLS-PASYH
1520 1530 1540 1550 1560
1490 1500 1510 1520 1530 1540
pF1KA0 LTENVARILNKKLLEHALKEERRQAAH---GPPGLHSDSHSLGDTAEPGPMENQTVLLTA
:.:::::::: . . .:: : . : :. : :: : : :.
CCDS54 QPEGVARILNKKAAKLGSSEEVRLTMLPQVGKDGVLRD----GDGAVVLPNEDAVCDCST
1570 1580 1590 1600 1610
pF1KA0 PWGL
CCDS54 QSLTSCFARSSRSAIRHSPSKCRLHPSESSWGGEERALPPSE
1620 1630 1640 1650 1660
>>CCDS46598.1 SOGA1 gene_id:140710|Hs108|chr20 (1016 aa)
initn: 1496 init1: 662 opt: 1622 Z-score: 1105.3 bits: 216.7 E(32554): 3e-55
Smith-Waterman score: 1947; 41.3% identity (68.3% similar) in 959 aa overlap (1-919:1-882)
10 20 30 40 50 60
pF1KA0 MEEMRDSYLEEDVYQLQELRRELDRANKNCRILQYRLRKAEQKSLKVAETGQVDGELIRS
: :::: :.:::::::::::..::.:.:.::::::::::::..::..:.::::::::::.
CCDS46 MLEMRDVYMEEDVYQLQELRQQLDQASKTCRILQYRLRKAERRSLRAAQTGQVDGELIRG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA0 LEQDLKVAKDVSVRLHHELKTVEEKRAKAEDENETLRQQMIEVEISKQALQNELERLKES
::::.::.::.:.:::.::..::.:::. :.::: :::..::.:..::.::.:::: .:
CCDS46 LEQDVKVSKDISMRLHKELEVVEKKRARLEEENEELRQRLIETELAKQVLQTELERPREH
70 80 90 100 110 120
130 140 150 160 170
pF1KA0 SLKRRSTREMYK-EKKTFNQDDSADLRCQLQFAKEEAFLMRKKMAKLGREKDELEQELQK
:::.:.:: . : .:::. :.:::::.:::.:::::. :: ::..::..:.: ...:: :
CCDS46 SLKKRGTRSLGKADKKTLVQEDSADLKCQLHFAKEESALMCKKLTKLAKENDSMKEELLK
130 140 150 160 170 180
180 190 200 210 220 230
pF1KA0 YKSLYGDVDSPLPTGEAGGPPSTREAELKLRLKLVEEEANILGRKIVELEVENRGLKAEM
:.:::::.:: : . : . : .::.:::..:::::::::.:.:.:::::::::::.:::
CCDS46 YRSLYGDLDSALSAEELADAPHSRETELKVHLKLVEEEANLLSRRIVELEVENRGLRAEM
190 200 210 220 230 240
240 250 260 270 280 290
pF1KA0 EDMRGQQEREGPGRDHAPSIPTSPFGDSLESSTELRRHLQFVEEEAELLRRSISEIEDHN
.::. . : : . .. . :. :: .::::::::::::::::::: .:.::.:
CCDS46 DDMKDHGGGCG-GPEARLAFSALGGGECGESLAELRRHLQFVEEEAELLRRSSAELEDQN
250 260 270 280 290
300 310 320 330 340 350
pF1KA0 RQLTHELSKFKFEPPREPGWLGEGASPGAGGGAPLQEELKSARLQISELSGKVLKLQHEN
. : .::.::. : . . :.: . . : :::: .:.:::.:::::: :::.::
CCDS46 KLLLNELAKFRSEHELDVA-LSEDSCSVLS--EPSQEELAAAKLQIGELSGKVKKLQYEN
300 310 320 330 340 350
360 370 380 390 400 410
pF1KA0 HALLSNIQRCDLAAHLGLRAPSPRDSDAESDAGKKESDGEESRLPQPKREGPVGGESDSE
..::::.::::::. . : : ..::: :: :. . .: :
CCDS46 RVLLSNLQRCDLASCQSTR-PM-LETDAE--AG----DSAQC-VPAP-------------
360 370 380 390
420 430 440 450 460 470
pF1KA0 EMFEKTSGFGSGKPSEASEPCPTELLKAREDSEYLVTLKHEAQRLERTVERLITDTDSFL
.: . :.: . : .::: .: : :...: . .... :..:...:
CCDS46 --------LGETHESHAVRLC-----RARE-AEVLPGLREQAALVSKAIDVLVADANGF-
400 410 420 430
480 490 500 510 520 530
pF1KA0 HDAGLRGGAPLPGPGLQGEE--ERGEGDQQEPQLLGTINAKMKAFKKELQAFLEQVNRIG
:::: .. .: . .:: . . .:. .: ........::.:: .... .
CCDS46 -TAGLRLCLDNECADFRLHEAPDNSEGPR-DTKLIHAILVRLSVLQQELNAFTRKADAVL
440 450 460 470 480 490
540 550 560 570 580
pF1KA0 DGLSPLPHLTESSSFLSTVTSVSRDSPIGNLGKELGPDLQS-RLKEQLEWQ--------L
: : . . :: : : . : . .. : :.:.:: :.: ... ::.
CCDS46 -GCS-VKEQQESFSSLPPLGSQGLSKEIL-LAKDLGSDFQPPDFRDLPEWEPRIREAFRT
500 510 520 530 540 550
590 600 610 620
pF1KA0 GP--ARGDERESLR-LRA------ARELHRR----ADGDTGSHGLGGQTC----------
: .. : .:.: :: : :... :.. . .:: :
CCDS46 GDLDSKPDPSRSFRPYRAEDNDSYASEIKELQLVLAEAHDSLRGLQEQLSQERQLRKEEA
560 570 580 590 600 610
630 640 650 660 670 680
pF1KA0 --FSLEM---EEEHLYALRWKELEMHSLALQNTLHERTWSDEKNLMQQELRSLKQNIFLF
:. .: .:.. :: .:.:..::.:: :... ::.:::.. :: ...:.:..:.
CCDS46 DNFNQKMVQLKEDQQRALLRREFELQSLSLQRRLEQKFWSQEKNMLVQESQQFKHNFLLL
620 630 640 650 660 670
690 700 710 720 730 740
pF1KA0 YVKLRWLLKHWRQGKQMEEEGEEFTEGEHPETLSRLGELGVQGGHQADGPDHDSDRSCGF
..::::.::.::::: . ::..: : .. . :: . .. . .:.....:
CCDS46 FMKLRWFLKRWRQGKVLPSEGDDFLE------VNSMKELYLLMEEEEINAQHSDNKAC--
680 690 700 710 720
750 760 770 780 790 800
pF1KA0 PVGEHSPHSRVQIGDHSLRLQTADRGQPHKQVVENQQLFSAFKALLEDFRAELREDERAR
:: . .. :.. . . .. .:. :... ::...:.
CCDS46 ------------TGD------SWTQNTPNEYI----KTLADMKVTLKELCWLLRDERRGL
730 740 750 760
810 820 830 840 850 860
pF1KA0 LRLQQQYASDKAAWDVEWAVLKCRLEQLEEKTENKLGELGSSAESKGALKKEREVHQKLL
.::::.:. ::.:..: : :: . :.: :: . :: .. . :.::..::: .:.::
CCDS46 TELQQQFAKAKATWETERAELKGHTSQMELKTGKGAGER-AGPDWKAALQREREEQQHLL
770 780 790 800 810 820
870 880 890 900 910 920
pF1KA0 ADSHSLVMDLRWQIHHSEKNWNREKVELLDRLDRDRQEWERQKKEFLWRIEQLQKENSPR
:.:.: ::.: :.. ::.::..::..:..::. ..:. :.: ::. :. :::: .:
CCDS46 AESYSAVMELTRQLQISERNWSQEKLQLVERLQGEKQQVEQQVKELQNRLSQLQKAADPW
830 840 850 860 870 880
930 940 950 960 970 980
pF1KA0 RGGSFLCDQKDGNVRPFPHQGSLRMPRPVAMWPCADADSIPFEDRPLSKLKESDRCSASE
CCDS46 VLKHSELEKQDNSWKETRSEKIHDKEAVSEVELGGNGLKRTKSVSSMSEFESLLDCSPYL
890 900 910 920 930 940
>>CCDS43505.1 SOGA3 gene_id:387104|Hs108|chr6 (947 aa)
initn: 1389 init1: 662 opt: 1353 Z-score: 924.2 bits: 183.1 E(32554): 3.7e-45
Smith-Waterman score: 1904; 58.8% identity (82.0% similar) in 539 aa overlap (1-533:377-892)
10 20 30
pF1KA0 MEEMRDSYLEEDVYQLQELRRELDRANKNC
:.::::...:::. ::::.:.::.::::::
CCDS43 QEQEEMQEEMEKLREENETLKNEIDELRTEMDEMRDTFFEEDACQLQEMRHELERANKNC
350 360 370 380 390 400
40 50 60 70 80 90
pF1KA0 RILQYRLRKAEQKSLKVAETGQVDGELIRSLEQDLKVAKDVSVRLHHELKTVEEKRAKAE
:::::::::::.: :. :.::..::::.:::::::::::::::::::::..:::::. .:
CCDS43 RILQYRLRKAERKRLRYAQTGEIDGELLRSLEQDLKVAKDVSVRLHHELENVEEKRTTTE
410 420 430 440 450 460
100 110 120 130 140
pF1KA0 DENETLRQQMIEVEISKQALQNELERLKESSLKRRSTREMYK-EKK---TFNQDDSADLR
:::: ::::.:::::.:::::::::..:: :::::..... : ::: : ...:. ::.
CCDS43 DENEKLRQQLIEVEIAKQALQNELEKMKELSLKRRGSKDLPKSEKKAQQTPTEEDNEDLK
470 480 490 500 510 520
150 160 170 180 190 200
pF1KA0 CQLQFAKEEAFLMRKKMAKLGREKDELEQELQKYKSLYGDVDSPLPTGEAGGPPSTREAE
:::::.:::: ::::::::. .:::..:.:::::.:.:::.::::: :::::::::::::
CCDS43 CQLQFVKEEAALMRKKMAKIDKEKDRFEHELQKYRSFYGDLDSPLPKGEAGGPPSTREAE
530 540 550 560 570 580
210 220 230 240 250 260
pF1KA0 LKLRLKLVEEEANILGRKIVELEVENRGLKAEMEDMRGQQEREGPGRDHAPSIPTSPFG-
:::::.::::::::::::::::::::::::::..:.::. : : ..:.
CCDS43 LKLRLRLVEEEANILGRKIVELEVENRGLKAELDDLRGD--------DFNGS--ANPLMR
590 600 610 620 630
270 280 290 300 310 320
pF1KA0 DSLESSTELRRHLQFVEEEAELLRRSISEIEDHNRQLTHELSKFKFEPPREPGWLGEGAS
.. :: .:::.:::.::.:.:::::.....:..:...: ::.:.:. . : .
CCDS43 EQSESLSELRQHLQLVEDETELLRRNVADLEEQNKRITAELNKYKY----KSGGHDSARH
640 650 660 670 680 690
330 340 350 360 370 380
pF1KA0 PGAGGGAPLQEELKSARLQISELSGKVLKLQHENHALLSNIQRCDLAAHLGLRAPSPRDS
. ::::::.:::::.::::::..::.::..:.::.:: :::.:::.:. :::::
CCDS43 HDNAKTEALQEELKAARLQINELSGKVMQLQYENRVLMSNMQRYDLASHLGIRG-SPRDS
700 710 720 730 740 750
390 400 410 420 430 440
pF1KA0 DAESDAGKKESDGEESRLPQPKREGPVGGESDSEEMFEKTSGFGSGKPSEASEPCPTELL
:::::::::::: ..:: :. :::::.::::::::. .. :... : :
CCDS43 DAESDAGKKESD-DDSRPPHRKREGPIGGESDSEEV----RNIRCLTPTRSFYPAPGPWP
760 770 780 790 800
450 460 470 480 490 500
pF1KA0 KAREDSEYLVTLKHEAQRLERTVERLITDTDSFLHDAGLR-GGAPLPGPGLQGEEERGEG
:. : . . .. ::.:: .:..:::.::.... .: . ... : : :. ::. : .
CCDS43 KSFSDRQQMKDIRSEAERLGKTIDRLIADTSTIITEARIYVANGDLFG--LMDEEDDG-S
810 820 830 840 850 860
510 520 530 540 550 560
pF1KA0 DQQEPQLLGTINAKMKAFKKELQAFLEQVNRIGDGLSPLPHLTESSSFLSTVTSVSRDSP
.: .:: :::.::::.::::.:....
CCDS43 RIREHELLYRINAQMKAFRKELQTFIDRLEVPKSADDRGAEEPISVSQMFQPIILLILIL
870 880 890 900 910 920
1545 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 19:44:09 2016 done: Wed Nov 2 19:44:10 2016
Total Scan time: 3.790 Total Display time: 0.210
Function used was FASTA [36.3.4 Apr, 2011]