FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE9253, 3114 aa
1>>>pF1KE9253 3114 - 3114 aa - 3114 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 14.6046+/-0.00187; mu= -15.7692+/- 0.110
mean_var=558.3610+/-119.753, 0's: 0 Z-trim(106.4): 260 B-trim: 0 in 0/52
Lambda= 0.054277
statistics sampled from 8766 (8974) to 8766 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.578), E-opt: 0.2 (0.276), width: 16
Scan time: 7.550
The best scores are: opt bits E(32554)
CCDS31023.1 CENPF gene_id:1063|Hs108|chr1 (3114) 19598 1552.6 0
CCDS74989.1 GOLGB1 gene_id:2804|Hs108|chr3 (3184) 969 93.8 1.8e-17
CCDS3004.1 GOLGB1 gene_id:2804|Hs108|chr3 (3259) 948 92.2 5.9e-17
CCDS58847.1 GOLGB1 gene_id:2804|Hs108|chr3 (3269) 948 92.2 5.9e-17
>>CCDS31023.1 CENPF gene_id:1063|Hs108|chr1 (3114 aa)
initn: 19598 init1: 19598 opt: 19598 Z-score: 8310.8 bits: 1552.6 E(32554): 0
Smith-Waterman score: 19598; 100.0% identity (100.0% similar) in 3114 aa overlap (1-3114:1-3114)
10 20 30 40 50 60
pF1KE9 MSWALEEWKEGLPTRALQKIQELEGQLDKLKKEKQQRQFQLDSLEAALQKQKQKVENEKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MSWALEEWKEGLPTRALQKIQELEGQLDKLKKEKQQRQFQLDSLEAALQKQKQKVENEKT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE9 EGTNLKRENQRLMEICESLEKTKQKISHELQVKESQVNFQEGQLNSGKKQIEKLEQELKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 EGTNLKRENQRLMEICESLEKTKQKISHELQVKESQVNFQEGQLNSGKKQIEKLEQELKR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE9 CKSELERSQQAAQSADVSLNPCNTPQKIFTTPLTPSQYYSGSKYEDLKEKYNKEVEERKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 CKSELERSQQAAQSADVSLNPCNTPQKIFTTPLTPSQYYSGSKYEDLKEKYNKEVEERKR
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE9 LEAEVKALQAKKASQTLPQATMNHRDIARHQASSSVFSWQQEKTPSHLSSNSQRTPIRRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LEAEVKALQAKKASQTLPQATMNHRDIARHQASSSVFSWQQEKTPSHLSSNSQRTPIRRD
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE9 FSASYFSGEQEVTPSRSTLQIGKRDANSSFFDNSSSPHLLDQLKAQNQELRNKINELELR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 FSASYFSGEQEVTPSRSTLQIGKRDANSSFFDNSSSPHLLDQLKAQNQELRNKINELELR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE9 LQGHEKEMKGQVNKFQELQLQLEKAKVELIEKEKVLNKCRDELVRTTAQYDQASTKYTAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LQGHEKEMKGQVNKFQELQLQLEKAKVELIEKEKVLNKCRDELVRTTAQYDQASTKYTAL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE9 EQKLKKLTEDLSCQRQNAESARCSLEQKIKEKEKEFQEELSRQQRSFQTLDQECIQMKAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 EQKLKKLTEDLSCQRQNAESARCSLEQKIKEKEKEFQEELSRQQRSFQTLDQECIQMKAR
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE9 LTQELQQAKNMHNVLQAELDKLTSVKQQLENNLEEFKQKLCRAEQAFQASQIKENELRRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LTQELQQAKNMHNVLQAELDKLTSVKQQLENNLEEFKQKLCRAEQAFQASQIKENELRRS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE9 MEEMKKENNLLKSHSEQKAREVCHLEAELKNIKQCLNQSQNFAEEMKAKNTSQETMLRDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MEEMKKENNLLKSHSEQKAREVCHLEAELKNIKQCLNQSQNFAEEMKAKNTSQETMLRDL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE9 QEKINQQENSLTLEKLKLAVADLEKQRDCSQDLLKKREHHIEQLNDKLSKTEKESKALLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 QEKINQQENSLTLEKLKLAVADLEKQRDCSQDLLKKREHHIEQLNDKLSKTEKESKALLS
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE9 ALELKKKEYEELKEEKTLFSCWKSENEKLLTQMESEKENLQSKINHLETCLKTQQIKSHE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 ALELKKKEYEELKEEKTLFSCWKSENEKLLTQMESEKENLQSKINHLETCLKTQQIKSHE
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE9 YNERVRTLEMDRENLSVEIRNLHNVLDSKSVEVETQKLAYMELQQKAEFSDQKHQKEIEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 YNERVRTLEMDRENLSVEIRNLHNVLDSKSVEVETQKLAYMELQQKAEFSDQKHQKEIEN
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE9 MCLKTSQLTGQVEDLEHKLQLLSNEIMDKDRCYQDLHAEYESLRDLLKSKDASLVTNEDH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MCLKTSQLTGQVEDLEHKLQLLSNEIMDKDRCYQDLHAEYESLRDLLKSKDASLVTNEDH
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE9 QRSLLAFDQQPAMHHSFANIIGEQGSMPSERSECRLEADQSPKNSAILQNRVDSLEFSLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 QRSLLAFDQQPAMHHSFANIIGEQGSMPSERSECRLEADQSPKNSAILQNRVDSLEFSLE
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE9 SQKQMNSDLQKQCEELVQIKGEIEENLMKAEQMHQSFVAETSQRISKLQEDTSAHQNVVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SQKQMNSDLQKQCEELVQIKGEIEENLMKAEQMHQSFVAETSQRISKLQEDTSAHQNVVA
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE9 ETLSALENKEKELQLLNDKVETEQAEIQELKKSNHLLEDSLKELQLLSETLSLEKKEMSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 ETLSALENKEKELQLLNDKVETEQAEIQELKKSNHLLEDSLKELQLLSETLSLEKKEMSS
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE9 IISLNKREIEELTQENGTLKEINASLNQEKMNLIQKSESFANYIDEREKSISELSDQYKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 IISLNKREIEELTQENGTLKEINASLNQEKMNLIQKSESFANYIDEREKSISELSDQYKQ
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE9 EKLILLQRCEETGNAYEDLSQKYKAAQEKNSKLECLLNECTSLCENRKNELEQLKEAFAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 EKLILLQRCEETGNAYEDLSQKYKAAQEKNSKLECLLNECTSLCENRKNELEQLKEAFAK
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE9 EHQEFLTKLAFAEERNQNLMLELETVQQALRSEMTDNQNNSKSEAGGLKQEIMTLKEEQN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 EHQEFLTKLAFAEERNQNLMLELETVQQALRSEMTDNQNNSKSEAGGLKQEIMTLKEEQN
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE9 KMQKEVNDLLQENEQLMKVMKTKHECQNLESEPIRNSVKERESERNQCNFKPQMDLEVKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 KMQKEVNDLLQENEQLMKVMKTKHECQNLESEPIRNSVKERESERNQCNFKPQMDLEVKE
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE9 ISLDSYNAQLVQLEAMLRNKELKLQESEKEKECLQHELQTIRGDLETSNLQDMQSQEISG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 ISLDSYNAQLVQLEAMLRNKELKLQESEKEKECLQHELQTIRGDLETSNLQDMQSQEISG
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE9 LKDCEIDAEEKYISGPHELSTSQNDNAHLQCSLQTTMNKLNELEKICEILQAEKYELVTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LKDCEIDAEEKYISGPHELSTSQNDNAHLQCSLQTTMNKLNELEKICEILQAEKYELVTE
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE9 LNDSRSECITATRKMAEEVGKLLNEVKILNDDSGLLHGELVEDIPGGEFGEQPNEQHPVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LNDSRSECITATRKMAEEVGKLLNEVKILNDDSGLLHGELVEDIPGGEFGEQPNEQHPVS
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE9 LAPLDESNSYEHLTLSDKEVQMHFAELQEKFLSLQSEHKILHDQHCQMSSKMSELQTYVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LAPLDESNSYEHLTLSDKEVQMHFAELQEKFLSLQSEHKILHDQHCQMSSKMSELQTYVD
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE9 SLKAENLVLSTNLRNFQGDLVKEMQLGLEEGLVPSLSSSCVPDSSSLSSLGDSSFYRALL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SLKAENLVLSTNLRNFQGDLVKEMQLGLEEGLVPSLSSSCVPDSSSLSSLGDSSFYRALL
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE9 EQTGDMSLLSNLEGTVSANQCSVDEVFCSSLQEENLTRKETPSAPAKGVEELESLCEVYR
::::::::::::::.:::::::::::::::::::::::::::::::::::::::::::::
CCDS31 EQTGDMSLLSNLEGAVSANQCSVDEVFCSSLQEENLTRKETPSAPAKGVEELESLCEVYR
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KE9 QSLEKLEEKMESQGIMKNKEIQELEQLLSSERQELDCLRKQYLSENEQWQQKLTSVTLEM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 QSLEKLEEKMESQGIMKNKEIQELEQLLSSERQELDCLRKQYLSENEQWQQKLTSVTLEM
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KE9 ESKLAAEKKQTEQLSLELEVARLQLQGLDLSSRSLLGIDTEDAIQGRNESCDISKEHTSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 ESKLAAEKKQTEQLSLELEVARLQLQGLDLSSRSLLGIDTEDAIQGRNESCDISKEHTSE
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KE9 TTERTPKHDVHQICDKDAQQDLNLDIEKITETGAVKPTGECSGEQSPDTNYEPPGEDKTQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 TTERTPKHDVHQICDKDAQQDLNLDIEKITETGAVKPTGECSGEQSPDTNYEPPGEDKTQ
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KE9 GSSECISELSFSGPNALVPMDFLGNQEDIHNLQLRVKETSNENLRLLHVIEDRDRKVESL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 GSSECISELSFSGPNALVPMDFLGNQEDIHNLQLRVKETSNENLRLLHVIEDRDRKVESL
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KE9 LNEMKELDSKLHLQEVQLMTKIEACIELEKIVGELKKENSDLSEKLEYFSCDHQELLQRV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LNEMKELDSKLHLQEVQLMTKIEACIELEKIVGELKKENSDLSEKLEYFSCDHQELLQRV
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KE9 ETSEGLNSDLEMHADKSSREDIGDNVAKVNDSWKERFLDVENELSRIRSEKASIEHEALY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 ETSEGLNSDLEMHADKSSREDIGDNVAKVNDSWKERFLDVENELSRIRSEKASIEHEALY
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KE9 LEADLEVVQTEKLCLEKDNENKQKVIVCLEEELSVVTSERNQLRGELDTMSKKTTALDQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LEADLEVVQTEKLCLEKDNENKQKVIVCLEEELSVVTSERNQLRGELDTMSKKTTALDQL
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KE9 SEKMKEKTQELESHQSECLHCIQVAEAEVKEKTELLQTLSSDVSELLKDKTHLQEKLQSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SEKMKEKTQELESHQSECLHCIQVAEAEVKEKTELLQTLSSDVSELLKDKTHLQEKLQSL
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KE9 EKDSQALSLTKCELENQIAQLNKEKELLVKESESLQARLSESDYEKLNVSKALEAALVEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 EKDSQALSLTKCELENQIAQLNKEKELLVKESESLQARLSESDYEKLNVSKALEAALVEK
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KE9 GEFALRLSSTQEEVHQLRRGIEKLRVRIEADEKKQLHIAEKLKERERENDSLKDKVENLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 GEFALRLSSTQEEVHQLRRGIEKLRVRIEADEKKQLHIAEKLKERERENDSLKDKVENLE
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KE9 RELQMSEENQELVILDAENSKAEVETLKTQIEEMARSLKVFELDLVTLRSEKENLTKQIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 RELQMSEENQELVILDAENSKAEVETLKTQIEEMARSLKVFELDLVTLRSEKENLTKQIQ
2170 2180 2190 2200 2210 2220
2230 2240 2250 2260 2270 2280
pF1KE9 EKQGQLSELDKLLSSFKSLLEEKEQAEIQIKEESKTAVEMLQNQLKELNEAVAALCGDQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 EKQGQLSELDKLLSSFKSLLEEKEQAEIQIKEESKTAVEMLQNQLKELNEAVAALCGDQE
2230 2240 2250 2260 2270 2280
2290 2300 2310 2320 2330 2340
pF1KE9 IMKATEQSLDPPIEEEHQLRNSIEKLRARLEADEKKQLCVLQQLKESEHHADLLKGRVEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 IMKATEQSLDPPIEEEHQLRNSIEKLRARLEADEKKQLCVLQQLKESEHHADLLKGRVEN
2290 2300 2310 2320 2330 2340
2350 2360 2370 2380 2390 2400
pF1KE9 LERELEIARTNQEHAALEAENSKGEVETLKAKIEGMTQSLRGLELDVVTIRSEKENLTNE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LERELEIARTNQEHAALEAENSKGEVETLKAKIEGMTQSLRGLELDVVTIRSEKENLTNE
2350 2360 2370 2380 2390 2400
2410 2420 2430 2440 2450 2460
pF1KE9 LQKEQERISELEIINSSFENILQEKEQEKVQMKEKSSTAMEMLQTQLKELNERVAALHND
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LQKEQERISELEIINSSFENILQEKEQEKVQMKEKSSTAMEMLQTQLKELNERVAALHND
2410 2420 2430 2440 2450 2460
2470 2480 2490 2500 2510 2520
pF1KE9 QEACKAKEQNLSSQVECLELEKAQLLQGLDEAKNNYIVLQSSVNGLIQEVEDGKQKLEKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 QEACKAKEQNLSSQVECLELEKAQLLQGLDEAKNNYIVLQSSVNGLIQEVEDGKQKLEKK
2470 2480 2490 2500 2510 2520
2530 2540 2550 2560 2570 2580
pF1KE9 DEEISRLKNQIQDQEQLVSKLSQVEGEHQLWKEQNLELRNLTVELEQKIQVLQSKNASLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 DEEISRLKNQIQDQEQLVSKLSQVEGEHQLWKEQNLELRNLTVELEQKIQVLQSKNASLQ
2530 2540 2550 2560 2570 2580
2590 2600 2610 2620 2630 2640
pF1KE9 DTLEVLQSSYKNLENELELTKMDKMSFVEKVNKMTAKETELQREMHEMAQKTAELQEELS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 DTLEVLQSSYKNLENELELTKMDKMSFVEKVNKMTAKETELQREMHEMAQKTAELQEELS
2590 2600 2610 2620 2630 2640
2650 2660 2670 2680 2690 2700
pF1KE9 GEKNRLAGELQLLLEEIKSSKDQLKELTLENSELKKSLDCMHKDQVEKEGKVREEIAEYQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 GEKNRLAGELQLLLEEIKSSKDQLKELTLENSELKKSLDCMHKDQVEKEGKVREEIAEYQ
2650 2660 2670 2680 2690 2700
2710 2720 2730 2740 2750 2760
pF1KE9 LRLHEAEKKHQALLLDTNKQYEVEIQTYREKLTSKEECLSSQKLEIDLLKSSKEELNNSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LRLHEAEKKHQALLLDTNKQYEVEIQTYREKLTSKEECLSSQKLEIDLLKSSKEELNNSL
2710 2720 2730 2740 2750 2760
2770 2780 2790 2800 2810 2820
pF1KE9 KATTQILEELKKTKMDNLKYVNQLKKENERAQGKMKLLIKSCKQLEEEKEILQKELSQLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 KATTQILEELKKTKMDNLKYVNQLKKENERAQGKMKLLIKSCKQLEEEKEILQKELSQLQ
2770 2780 2790 2800 2810 2820
2830 2840 2850 2860 2870 2880
pF1KE9 AAQEKQKTGTVMDTKVDELTTEIKELKETLEEKTKEADEYLDKYCSLLISHEKLEKAKEM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 AAQEKQKTGTVMDTKVDELTTEIKELKETLEEKTKEADEYLDKYCSLLISHEKLEKAKEM
2830 2840 2850 2860 2870 2880
2890 2900 2910 2920 2930 2940
pF1KE9 LETQVAHLCSQQSKQDSRGSPLLGPVVPGPSPIPSVTEKRLSSGQNKASGKRQRSSGIWE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LETQVAHLCSQQSKQDSRGSPLLGPVVPGPSPIPSVTEKRLSSGQNKASGKRQRSSGIWE
2890 2900 2910 2920 2930 2940
2950 2960 2970 2980 2990 3000
pF1KE9 NGRGPTPATPESFSKKSKKAVMSGIHPAEDTEGTEFEPEGLPEVVKKGFADIPTGKTSPY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 NGRGPTPATPESFSKKSKKAVMSGIHPAEDTEGTEFEPEGLPEVVKKGFADIPTGKTSPY
2950 2960 2970 2980 2990 3000
3010 3020 3030 3040 3050 3060
pF1KE9 ILRRTTMATRTSPRLAAQKLALSPLSLGKENLAESSKPTAGGSRSQKVKVAQRSPVDSGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 ILRRTTMATRTSPRLAAQKLALSPLSLGKENLAESSKPTAGGSRSQKVKVAQRSPVDSGT
3010 3020 3030 3040 3050 3060
3070 3080 3090 3100 3110
pF1KE9 ILREPTTKSVPVNNLPERSPTDSPREGLRVKRGRLVPSPKAGLESNGSENCKVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 ILREPTTKSVPVNNLPERSPTDSPREGLRVKRGRLVPSPKAGLESNGSENCKVQ
3070 3080 3090 3100 3110
>>CCDS74989.1 GOLGB1 gene_id:2804|Hs108|chr3 (3184 aa)
initn: 205 init1: 106 opt: 969 Z-score: 426.9 bits: 93.8 E(32554): 1.8e-17
Smith-Waterman score: 1294; 22.1% identity (56.1% similar) in 3013 aa overlap (18-2857:13-2791)
10 20 30 40 50 60
pF1KE9 MSWALEEWKEGLPTRALQKIQELEGQLDKLKKEKQQRQFQLDSLEAALQKQKQKVENEKT
... : . .:: .:.. ::.. . :::.... ..: :
CCDS74 MEFNNTTQEDVQERLAYAEQLVVELKDIIRQKDVQLQQKDEALQEERKAADN-KI
10 20 30 40 50
70 80 90 100 110 120
pF1KE9 EGTNLKRENQRLMEICESLEKTKQKISHELQVKESQVNFQEGQLNSGKKQIEKLEQELKR
. .:. . .: . . .:. : . . : . : : .: ::.. :. . :.:...
CCDS74 KKLKLHAKA-KLTSLNKYIEEMKAQGGTVLPT-EPQ---SEEQLSKHDKSSTEEEMEIEK
60 70 80 90 100
130 140 150 160 170
pF1KE9 CKSELERSQQAAQSADVSLNPCNTPQKIFTTPLTPSQYYSGSKYED---LKEKYNKEVEE
: .:..... .. ...:. .. : :.: :....:. .:.. ... :
CCDS74 IKHKLQEKEELISTLQAQLTQAQAEQ--------PAQ--SSTEMEEFVMMKQQLQEKEEF
110 120 130 140 150
180 190 200 210 220
pF1KE9 RKRLEAEVKALQAKKASQTLPQATMNHRDIARHQAS----SSVFSW-QQEKTPSH-----
. :.:... ::..:.: : . .: . .:. : ..: . ::: : ..
CCDS74 ISTLQAQLSQTQAEQAAQKL---RVLQRKLEEHEESLVGRAQVVDLLQQELTAAEQRNQI
160 170 180 190 200 210
230 240 250 260 270 280
pF1KE9 LSSNSQRTPIRRDFSASYFSGEQE---VTPSRSTLQIGKRDANSSFFD-NSSSPHLLDQL
::.. :. ... . :.: . . :....: :: . . :::.:.
CCDS74 LSQQLQQMEAEHNTLRNTVETEREESKILLEKMELEVAERKL--SFHNLQEEMHHLLEQF
220 230 240 250 260 270
290 300 310 320 330 340
pF1KE9 KAQNQ---ELRNKINELELRLQGHEKEMKGQVNKFQELQLQLEKAKVELIEKEKVLNKCR
. .: ::... . :: . ... .: ... ..:. .:..: : .... : . .
CCDS74 EQAGQAQAELESRYSALEQKHKAEMEEKTSHILSLQKTGQELQSACDALKDQNSKLLQDK
280 290 300 310 320 330
350 360 370 380 390
pF1KE9 DELVRTTAQYDQASTKYTALEQKLKKLTEDLSCQ--RQNAESARCSLEQKIKEKEKEFQE
.: . .:: : :.:: :.... :. .:. ... :. . .: . :
CCDS74 NEQAVQSAQTIQQLEDQ--LQQKSKEISQFLNRLPLQQHETASQTSFPDVYNEGTQAVTE
340 350 360 370 380 390
400 410 420 430 440
pF1KE9 E--LSRQQRSFQTLDQECIQMKARLTQELQQAKNMH-----NVLQA-----ELDKLTS--
: : :.: . ... . . . : .:.: . ..:.: : :. .:
CCDS74 ENIASLQKRVVELENEKGALLLSSIELEELKAENEKLSSQITLLEAQNRTGEADREVSEI
400 410 420 430 440 450
450 460 470 480 490
pF1KE9 ----VKQQLENNLEEFKQKLCRAEQAFQASQIKENELRRSMEEMKKENNLLKSHSE-QKA
. .. .. :: : . :..:. .. . . : :.: ..: .:: . . ..:
CCDS74 SIVDIANKRSSSAEESGQDV--LENTFSQKHKELSVLLLEMKEAQEEIAFLKLQLQGKRA
460 470 480 490 500 510
500 510 520 530 540
pF1KE9 REVCHLEAELKNIKQCLNQSQNFAE-EMKA--KNTSQ--------ETMLRDLQ-EKINQQ
.:. : . :..:: .....: .::. ..:.: :. : .. :. . .
CCDS74 EEADHEVLDQKEMKQM--EGEGIAPIKMKVFLEDTGQDFPLMPNEESSLPAVEKEQASTE
520 530 540 550 560
550 560 570 580 590
pF1KE9 ENSLTLEKLKLAVADLE----KQR------------DCSQDLLKKREHHIEQLNDKLSKT
..: : :...: : .: :: .: :: :.. . .: .:. .. :.
CCDS74 HQSRTSEEISLNDAGVELKSTKQDGDKSLSAVPDIGQCHQDELERLKSQILELELNFHKA
570 580 590 600 610 620
600 610 620 630 640
pF1KE9 EK--ESKALLSALELKK--KEYEELKEE----KTLFSCWKSENEKLLTQME--SEKENLQ
.. :.. .: :... . ::.:.. .. :. . : ..::.:.. : .:.
CCDS74 QEIYEKNLDEKAKEISNLNQLIEEFKKNADNNSSAFTALSEERDQLLSQVKELSMVTELR
630 640 650 660 670 680
650 660 670 680 690
pF1KE9 SKINHLETCL-----------KTQQIKSHEYNERVRTLEMDRENLSVEIRNLHNVLDSKS
.....:: : ..: ... .:....: .. .. .:.:. :.: ::. .
CCDS74 AQVKQLEMNLAEAERQRRLDYESQTAHDNLLTEQIHSLSIEAKSKDVKIEVLQNELDDVQ
690 700 710 720 730 740
700 710 720 730 740 750
pF1KE9 VEVETQKLAYMELQQKAEFSDQKHQKEIENMCLKTSQLTGQVEDLEHKLQLLSNEIMDKD
.. :. ::.. :....:. . .. .....::.: . :. :: :
CCDS74 LQFSEQSTLIRSLQSQL----QNKESEVLEGAERVRHISSKVEELSQALSQKELEITKMD
750 760 770 780 790 800
760 770 780 790 800
pF1KE9 RCYQDLHAEYESLRDLLKSKDASLVT-NEDHQRSLLAFDQQPAMHHSFANIIGEQGSMPS
. . . . :.:.. .. :: ... . . .... .... . . :: .. :
CCDS74 QLLLEKKRDVETLQQTIEEKDQQVTEISFSMTEKMVQLNEEKFSLGVEIKTLKEQLNLLS
810 820 830 840 850 860
810 820 830 840 850 860
pF1KE9 ERSECRLE-ADQSPKNSAILQNRVDSLEFSLESQKQMNSDLQKQCEELVQIKGEIEENLM
. : . : .... . :. :.. : . . . .:. .::.. . :.. ..: .. .
CCDS74 RAEEAKKEQVEEDNEVSSGLKQNYDEMSPAGQISKE---ELQHEFD-LLKKENEQRKRKL
870 880 890 900 910 920
870 880 890 900 910 920
pF1KE9 KAEQMHQSFVAETSQRISKLQEDTSAHQNVVAETLSALENKEKELQLLNDKVETEQAEIQ
.: .... : ::.:.:.:. . .. :.: ::. : :::..:..
CCDS74 QAALINRK---ELLQRVSRLEEELANLKD---------ESK-KEIPL----SETERGEVE
930 940 950 960
930 940 950 960 970 980
pF1KE9 ELKKSNHLLEDSL----KELQL-LSETLSLEKKEMSSIISLNKREIEE-LTQENGTLKEI
: :.... : . .:... :..:.: .. :.. : ....:: :. : ...
CCDS74 EDKENKEYSEKCVTSKCQEIEIYLKQTISEKEVELQHI----RKDLEEKLAAE----EQF
970 980 990 1000 1010
990 1000 1010 1020 1030 1040
pF1KE9 NASLNQEKMNLIQKSESFANYIDEREKSISELSDQYKQEKLILLQRCEETGNAYEDLSQK
.: ..: ...: .:. : :: . ::: .: .::: :.:. : :.
CCDS74 QALVKQMNQTLQDKT----NQIDLLQAEISE--NQAIIQKLI-------TSNT--DASDG
1020 1030 1040 1050 1060
1050 1060 1070 1080 1090 1100
pF1KE9 YKAAQEKNSKLECLLNECTSLCENRKNELEQLKEAFAKEHQEFLTKLAFAEERNQNLMLE
..: :.. . . ::. :. : :::. :. ::.... :: : . .. .
CCDS74 DSVALVKETVV--ISPPCTGSSEHWKPELEEKILALEKEKEQLQKKLQEALTSRKAILKK
1070 1080 1090 1100 1110
1110 1120 1130 1140 1150
pF1KE9 LETVQQALRSEMT---DNQNNSKSEAGGLKQEIMTLKEEQNKMQKEVNDLLQENEQLMKV
. .. :: :. :. : . . ..: .. .. ..: .: . .. .
CCDS74 AQEKERHLREELKQQKDDYNRLQEQFDEQSKENENIGDQLRQLQIQVRESIDGKLPSTDQ
1120 1130 1140 1150 1160 1170
1160 1170 1180 1190 1200 1210
pF1KE9 MKTKHECQNLESEPIRNSVKERESERN-QCNFKPQMDLEVKEISLDSYNAQLVQLEAMLR
... .:: ::. ......... . :. :. . .. : . .....:..:.:
CCDS74 QESCSSTPGLE-EPLFKATEQHHTQPVLESNLCPDWPSHSEDASALQGGTSVAQIKAQL-
1180 1190 1200 1210 1220 1230
1220 1230 1240 1250 1260 1270
pF1KE9 NKELKLQESEKEKECLQHELQTIRGDLETSNLQDM---QSQEISGLKDCEIDAEEKYISG
::.. .. : : . . . . . :. .::.. :. :: .:: .:: . :
CCDS74 -KEIEAEKVELELKVSSTTSELTKKSEEVFQLQEQINKQGLEIESLKTVSHEAEVHAESL
1240 1250 1260 1270 1280 1290
1280 1290 1300 1310 1320 1330
pF1KE9 PHELSTSQNDNAHLQCSLQTTMNKLNELEKICEILQAEKYELVTELNDSRSECITATRKM
..: .:: . : :. :. . ::.::.: : ..: : :. :. . :: .: :.
CCDS74 QQKLESSQLQIAGLE-HLRELQPKLDELQK----LISKKEEDVSYLSGQLSEKEAALTKI
1300 1310 1320 1330 1340 1350
1340 1350 1360 1370 1380 1390
pF1KE9 AEEVGKLLNEVKILNDDSGLLHGELVEDIPGGEFGEQPNEQHPVSLAPLDESNSYEHLTL
:. . . .: :. . . : : : . .:.: .. .:: . ...
CCDS74 QTEIIEQEDLIKALHTQLEMQAKEHDERIKQLQVELCEMKQKPEEIG--EESRAKQQIQR
1360 1370 1380 1390 1400
1400 1410 1420 1430 1440 1450
pF1KE9 SDKEVQMHFAELQEKFLSLQSEHKILHDQHCQMSSKMSELQTYVDSL-KAENLVLS--TN
. . . . : .. ::: : .. . ........... :.. : .. ::. .
CCDS74 KLQAALISRKEALKENKSLQEELSLARGTIERLTKSLADVESQVSAQNKEKDTVLGRLAL
1410 1420 1430 1440 1450 1460
1460 1470 1480 1490 1500 1510
pF1KE9 LRNFQGDLVKEMQLGLEEGLVPSLSSSCVPDSSSLSSLGDSSFYRALLEQTGDMSLLSNL
:.. . :. ::. .: :. :::::: .: .:. : . . :... . .:
CCDS74 LQEERDKLITEMDRSLLEN--QSLSSSC--ESLKLALEGLTEDKEKLVKE------IESL
1470 1480 1490 1500 1510
1520 1530 1540 1550 1560 1570
pF1KE9 EGTVSANQCSVDEVFCSSLQEENLTRKETPSAPAKGVEELESLCEVYRQSLEKLEEKMES
... :.. .: . ::.: .. .. .:... . :. :: ::.:
CCDS74 KSSKIAESTEWQEKH-KELQKEYEILLQSYENVSNEAERIQHVVEAVRQ------EKQEL
1520 1530 1540 1550 1560 1570
1580 1590 1600 1610 1620 1630
pF1KE9 QGIMKNKEI--QELEQLLSSERQELDCLRKQYLSENEQWQQKLTSVTLEMESKLAAEKKQ
: ... : .: :. :. .::.. ..... . .. :::. . : ...: :: .
CCDS74 YGKLRSTEANKKETEKQLQEAEQEMEEMKEKMRKFAKSKQQKILELE-EENDRLRAEVHP
1580 1590 1600 1610 1620 1630
1640 1650 1660 1670 1680 1690
pF1KE9 TEQLSLELEVARLQLQGLDLSSRSLLGIDTEDAIQGRNESCDISKEHTSETTERTPKHDV
. ..:. .. : ::: . . . : . . : .::. : .:.
CCDS74 AG------DTAKECMETL-LSSNASMKEELERV---KMEYETLSKKFQSLMSEKDSL---
1640 1650 1660 1670
1700 1710 1720 1730 1740 1750
pF1KE9 HQICDKDAQQDLNLDIEKITETGAVKPTGECSGEQSPDTNYEPPGEDKTQGSSECISELS
.. :::. .:: :. : ..: : . .: ..... : .
CCDS74 -----SEEVQDLKHQIE---------------GNVSKQANLE--ATEKHDNQTNVTEEGT
1680 1690 1700 1710
1760 1770 1780 1790 1800 1810
pF1KE9 FSGPNALVPMDFLGNQEDIHNLQLRVKETSNENLRLLHVIEDRDRKVESLLNEMKELDSK
: : :. :. .:.. .. : .:. . .. . : . .. :...
CCDS74 QSIP---------GETEEQDSLSMSTRPTCSES---VPSAKSANPAVSKDFSSHDEINN-
1720 1730 1740 1750 1760
1820 1830 1840 1850 1860
pF1KE9 LHLQEVQLMTKIEACIELEKIVG--ELKKENSDLSEKLEYFSCDHQELLQRVETSEGLNS
.::... . :.:.: : :..:...:. :: ... ::... :..:
CCDS74 -YLQQIDQLK--------ERIAGLEEEKQKNKEFSQTLEN---EKNTLLSQISTKDG---
1770 1780 1790 1800
1870 1880 1890 1900 1910 1920
pF1KE9 DLEMHADKSSREDIGDNVAKVNDSWKERFLDVENELSRIRSEKASIEHEALYLEADLEVV
.:.: . ..:.:.: .. ...::::. . : . :.: . :::
CCDS74 ELKM---------LQEEVTKMNLLNQQ----IQEELSRVTKLKETAEEE----KDDLE--
1810 1820 1830 1840
1930 1940 1950 1960 1970 1980
pF1KE9 QTEKLCLEKDNENKQKVIVCLEEELSVVTSERNQLRGELDTMSKKTTALDQLSEKM-KEK
:.: . . : . : . . . .: :..:. ...: .. :.. .... :::
CCDS74 --ERLMNQLAELNGSIGNYCQDVTDAQIKNE--LLESEMKNLKKCVSELEEEKQQLVKEK
1850 1860 1870 1880 1890 1900
1990 2000 2010 2020 2030 2040
pF1KE9 TQELESH-QSECLHCIQVAEAE------VKEKTELLQTLSSDVSELLKDKTHLQEKLQSL
:. .::. ..: :. :: :. : .:: :::. ...:..: :: . :::...:
CCDS74 TK-VESEIRKEYLEKIQGAQKEPGNKSHAKELQELLKEKQQEVKQLQKDCIRYQEKISAL
1910 1920 1930 1940 1950 1960
2050 2060 2070 2080 2090 2100
pF1KE9 EKDSQALSLTKCELENQIAQLNKEKELLVKESESLQARLSESDYEKLNVSKALEAALVEK
:. .:: ... : .... ... :.. .. ::.:. ... : . ::: :
CCDS74 ERTVKALEFVQTESQKDLEITKENLAQAVEHRKKAQAELA--SFKVLLDDTQSEAARVLA
1970 1980 1990 2000 2010 2020
2110 2120 2130 2140 2150
pF1KE9 GEFALR--LSSTQEEVH-QLRRGIEKLRVRIEADEKKQLHIAEKLKERERENDSLKDKVE
.. :. :.:..: :. :... : :. :.: :.:.: .:..: ...:..
CCDS74 DNLKLKKELQSNKESVKSQMKQKDEDLERRLEQAEEKHL--------KEKKN--MQEKLD
2030 2040 2050 2060 2070
2160 2170 2180 2190 2200 2210
pF1KE9 NLERELQMSEENQELVILDAENSKAEVETLKTQIEEMARSLKVFELDLVTLRSEKENLTK
:.:: ::. . . ... ::. :. ... . .: .: .. .:..... .
CCDS74 ALRREKVHLEETIGEIQVTLNKKDKEVQQLQENLDSTVTQLAAFTKSMSSLQDDRDRV--
2080 2090 2100 2110 2120
2220 2230 2240 2250 2260 2270
pF1KE9 QIQEKQGQLSELDKLLSSFKSLLEEKEQAEIQIKEES----KTAVEMLQNQLKELNEAVA
..: : .:.. .. ::. ::..::.. : ..... ...::. ..
CCDS74 --------IDEAKKWERKFSDAIQSKEE-EIRLKEDNCSVLKDQLRQMSIHMEELKINIS
2130 2140 2150 2160 2170 2180
2280 2290 2300 2310
pF1KE9 ALCGDQEIMKATEQS------------------LDPPIEEEHQLRNSIEKLRARLEADEK
: :..: .. :. : .:: ..: .: .. :.::.. :
CCDS74 RLEHDKQIWESKAQTEVQLQQKVCDTLQGENKELLSQLEETRHLYHSSQNELAKLESELK
2190 2200 2210 2220 2230 2240
2320 2330 2340 2350 2360 2370
pF1KE9 KQLCVLQQLKESEHHADLLKGRVENLERELEIARTNQEHAALEAENSKGEVETLKAKIEG
. : .:..: .. :: .:.. :. : :.. . . :.. . : ....
CCDS74 SLKDQLTDLSNSLEKCKEQKGNLEGIIRQQEADIQNSKFSYEQLETDLQASRELTSRLH-
2250 2260 2270 2280 2290
2380 2390 2400 2410 2420
pF1KE9 MTQSLRGLELDVVTIRSEKENLTN----ELQKEQER-ISELEIINSSFE--NILQEKEQE
. . : .... : ::. . ::...... :.::: . :. : ::. :.:..
CCDS74 --EEINMKEQKIISLLSGKEEAIQVAIAELRQQHDKEIKELENLLSQEEEENIVLEEENK
2300 2310 2320 2330 2340 2350
2430 2440 2450 2460 2470
pF1KE9 KVQMKEKSSTAMEMLQT----------QLKELNERVAALHNDQEACKAKEQNLSSQVECL
:. .:.. :: :.: :: . . ...:.::.. . :.: . .
CCDS74 KA--VDKTNQLMETLKTIKKENIQQKAQLDSFVKSMSSLQNDRDRIVGDYQQLEERHLSI
2360 2370 2380 2390 2400 2410
2480 2490 2500 2510 2520 2530
pF1KE9 ELEKAQLLQGLDEAKNNYIVLQSSVNGLIQEVEDGKQKLEKKDEEISRLKNQIQDQEQLV
::: ::.: :.:: :. . :: ....: ... : : :. . . .: .:..
CCDS74 ILEKDQLIQEA-AAENNK--LKEEIRGLRSHMDDLNSENAKLDAELIQYR---EDLNQVI
2420 2430 2440 2450 2460
2540 2550 2560 2570 2580 2590
pF1KE9 S-KLSQVEGEHQLWKEQNLELRNLTVELEQKIQVLQSKNASLQDTLEVLQSSYKNLENEL
. : :: . .. .:: ::.: ..::.:.. . : .:. ....:: ..: .:.
CCDS74 TIKDSQQKQLLEVQLQQNKELENKYAKLEEKLKESEEANEDLRRSFNALQEEKQDLSKEI
2470 2480 2490 2500 2510 2520
2600 2610 2620 2630 2640 2650
pF1KE9 ELTKMDKMSFVEKVNKMTAKETE--LQREMHEMAQKTAELQEELSGEKNRLAGELQLLLE
: :.. .....:. . . : . ... ... .:. .:. ..:.: .: :
CCDS74 ESLKVSISQLTRQVTALQEEGTLGLYHAQLKVKEEEVHRLSALFSSSQKRIA---ELEEE
2530 2540 2550 2560 2570 2580
2660 2670 2680 2690 2700 2710
pF1KE9 EIKSSKDQLKELTLENSELKKSLDCMHKDQ--VEKEGKVREE-IAEYQLRLHEAEKKHQA
. .:. :.. ...::: : .:.: ...: .. :: .:: : : :.:
CCDS74 LVCVQKEAAKKVGEIEDKLKKELKHLHHDAGIMRNETETAEERVAELARDLVEMEQK-LL
2590 2600 2610 2620 2630 2640
2720 2730 2740 2750 2760 2770
pF1KE9 LLLDTNKQYEVEIQTYREKLTSKEECLSSQKLEIDLLKSSKEELNNSLKATTQILEE-LK
.. :: ..::.. ....: .. . . :.: :: .. . ::: .:. :. :
CCDS74 MVTKENKGLTAQIQSFGRSMSSLQNSRDHANEELDELK---RKYDASLKELAQLKEQGLL
2650 2660 2670 2680 2690 2700
2780 2790 2800 2810 2820
pF1KE9 KTKMDNLKYVNQLKKENERAQGKMKLLIKSCKQLEEEKEILQKELSQLQAA----QEKQK
. . : : . .. : ..... : : .:: . : : . :::. . : .:
CCDS74 NRERDALLSETAFSM-NSTEENSLSHLEKLNQQLLSKDEQLLHLSSQLEDSYNQVQSFSK
2710 2720 2730 2740 2750 2760
2830 2840 2850 2860 2870 2880
pF1KE9 TGTVMDTKVDELTTEIKELKETLEEKTKEADEYLDKYCSLLISHEKLEKAKEMLETQVAH
. . .... :.: .:....... : : . :
CCDS74 AMASLQNERDHLWNELEKFRKSEEGKQRSAAQPSTSPAEVQSLKKAMSSLQNDRDRLLKE
2770 2780 2790 2800 2810 2820
>>CCDS3004.1 GOLGB1 gene_id:2804|Hs108|chr3 (3259 aa)
initn: 205 init1: 106 opt: 948 Z-score: 417.9 bits: 92.2 E(32554): 5.9e-17
Smith-Waterman score: 1289; 22.4% identity (56.2% similar) in 3038 aa overlap (18-2857:52-2866)
10 20 30 40
pF1KE9 MSWALEEWKEGLPTRALQKIQELEGQLDKLKKEKQQRQFQLDSLEAA
... : . .:: .:.. ::.. . :
CCDS30 TDQNMRAPLDPELHQESDMEFNNTTQEDVQERLAYAEQLVVELKDIIRQKDVQLQQKDEA
30 40 50 60 70 80
50 60 70 80 90 100
pF1KE9 LQKQKQKVENEKTEGTNLKRENQRLMEICESLEKTKQKISHELQVKESQVNFQEGQLNSG
::.... ..: : . .:. . .: . . .:. : . . : . : : .: ::..
CCDS30 LQEERKAADN-KIKKLKLHAKA-KLTSLNKYIEEMKAQGGTVLPT-EPQ---SEEQLSKH
90 100 110 120 130
110 120 130 140 150 160
pF1KE9 KKQIEKLEQELKRCKSELERSQQAAQSADVSLNPCNTPQKIFTTPLTPSQYYSGSKYED-
:. . :.:... : .:..... .. ...:. .. : :.: :....:.
CCDS30 DKSSTEEEMEIEKIKHKLQEKEELISTLQAQLTQAQAEQ--------PAQ--SSTEMEEF
140 150 160 170 180
170 180 190 200 210 220
pF1KE9 --LKEKYNKEVEERKRLEAEVKALQAKKASQTLPQATMNHRDIARHQASSSVFSWQQEKT
.:.. ... : . :.:... ::..:.: . . ..: :: ... . . .
CCDS30 VMMKQQLQEKEEFISTLQAQLSQTQAEQAAQQV----VREKD-ARFETQVRLHEDELLQL
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE9 PSHLSSNSQRTPIRRDFSASYFSGEQEVTPSRSTLQIGKRDANSSFFDNSSSPHLLDQLK
.. . ... : .. . :. .. ..... ... ... :. . :.:..
CCDS30 VTQADVETEMQQKLRVLQRKLEEHEESLVGRAQVVDLLQQELTAAEQRNQILSQQLQQME
250 260 270 280 290 300
290 300 310 320 330 340
pF1KE9 AQNQELRNKINELELRLQGHEKEMKGQVNKFQELQLQLEKAKVELIEKEKVLNKCRDELV
:... ::: .. :.: : .. ::: ..:. :.. ... ..:.
CCDS30 AEHNTLRNTVET--------ERE---------ESKILLEKMELEVAERKLSFHNLQEEMH
310 320 330 340
350 360 370 380 390 400
pF1KE9 RTTAQYDQASTKYTALEQKLKKLTEDLSCQRQNAESARCSLEQKIKEKEKEFQEELSRQQ
. :..::. . ::.. . .:::: : . .: .. :
CCDS30 HLLEQFEQAGQAQAELESRYS------------------ALEQKHKAEMEEKTSHILSLQ
350 360 370 380
410 420 430 440 450 460
pF1KE9 RSFQTLDQECIQMKARLTQELQQAKNMHNVLQAELDKLTSVKQQLENNLEEFKQKLCRA-
.. : :.. : .: . ...: : :: . : .:. . ....::... .:..: : :
CCDS30 KTGQELQSACDALKDQ-NSKLLQDKNEQAVQSAQT--IQQLEDQLQQKSKEISQFLNRLP
390 400 410 420 430 440
470 480 490 500 510 520
pF1KE9 -EQAFQASQIKENELRRSMEEMKKENNLLKSHSEQKAREVCHLEAELKNIKQCLNQSQNF
.: ::: . .. . :.:. : :: : : ::.: : : :.
CCDS30 LQQHETASQTSFPDVYNEGTQAVTEENI---ASLQK-RVV-----ELENEKGALLLSSIE
450 460 470 480 490
530 540 550 560 570
pF1KE9 AEEMKAKN---TSQETMLRDLQEKINQQENSLTLEKLKLAVADLEKQRDCSQDLLKKREH
::.::.: .:: :.: . :.. .. . .. .....:. ..:. : . :
CCDS30 LEELKAENEKLSSQITLL-EAQNRTGEADREVS----EISIVDIANKRSSSAE-----ES
500 510 520 530 540
580 590 600 610 620 630
pF1KE9 HIEQLNDKLSKTEKESKALLSALELKKKEYEELKEEKTLFSCWKSE-------NEKLLTQ
. :.. .:. .:: ..:: ::.:. . ::. : .. ..: ..: . :
CCDS30 GQDVLENTFSQKHKELSVLL--LEMKEAQ-EEIAFLKLQLQGKRAEEADHEVLDQKEMKQ
550 560 570 580 590 600
640 650 660 670 680
pF1KE9 MESEK-ENLQSKINHLETCLKTQQIKSHEYNERVRTLEMDRENLSVE--IRNLHNV-LDS
::.: .. :. :: : : ::. ...:. :.: :. ... :..
CCDS30 MEGEGIAPIKMKV-FLED---TGQDFPLMPNEESSLPAVEKEQASTEHQSRTSEEISLND
610 620 630 640 650
690 700 710 720 730 740
pF1KE9 KSVEVETQKLAYMELQQKAEFSDQKHQKEIENMCLKTSQLTGQVEDLE---HKLQLLSNE
.::... : . . . : :: :.: .: .:. .:: :: : . ..
CCDS30 AGVELKSTKQDGDKSLSAVPDIGQCHQDELE-------RLKSQILELELNFHKAQEIYEK
660 670 680 690 700
750 760 770 780
pF1KE9 IMD-KDRCYQDLHAEYESL-----------------RDLLKS--KDASLVTNEDHQRSLL
.: : . ..:. : . :: : : :. :.::. : . :
CCDS30 NLDEKAKEISNLNQLIEEFKKNADNNSSAFTALSEERDQLLSQVKELSMVTELRAQVKQL
710 720 730 740 750 760
790 800 810 820 830 840
pF1KE9 AFDQQPAMHH---SFANIIGEQGSMPSERSECRLEADQSPKNSAILQNRVDS--LEFSLE
.. : .. .. . .... . . .:: .. . .:::..:. :.:: .
CCDS30 EMNLAEAERQRRLDYESQTAHDNLLTEQIHSLSIEAKSKDVKIEVLQNELDDVQLQFSEQ
770 780 790 800 810 820
850 860 870 880 890
pF1KE9 SQ--KQMNSDLQKQCEELVQIKGEIEENLMKAEQMHQSFVAETSQRISKLQEDTSAHQNV
: ....:.::.. :... .... :.:.. :.. .. .:.:... ..
CCDS30 STLIRSLQSQLQNKESEVLEGAERVRHISSKVEELSQAL-SQKELEITKMDQLLLEKKRD
830 840 850 860 870 880
900 910 920 930 940 950
pF1KE9 VAETLSALENKEKELQLLNDKVETEQAEIQELKKSNHLLEDSLKE-LQLLSETLSLEKK-
: ...:.:.... .. .. ......: : : . .::: :.:::.. .:.
CCDS30 VETLQQTIEEKDQQVTEISFSMTEKMVQLNEEKFSLGVEIKTLKEQLNLLSRAEEAKKEQ
890 900 910 920 930 940
960 970 980 990 1000
pF1KE9 -----EMSSIISLNKREI--------EELTQENGTLKEINASLNQE-KMNLIQKSESFAN
:.:: .. : :. ::: .: ::. : . ... . ::...: . .
CCDS30 VEEDNEVSSGLKQNYDEMSPAGQISKEELQHEFDLLKKENEQRKRKLQAALINRKE-LLQ
950 960 970 980 990 1000
1010 1020 1030 1040 1050
pF1KE9 YIDEREKSISELSDQYKQEKLILLQRCEETGNAYEDLSQKY---KAAQEKNSKLECLLNE
... :. ...:.:. :.: : :.. :. :.. :: .: : . : ...: :..
CCDS30 RVSRLEEELANLKDESKKE--IPLSETER-GEVEEDKENKEYSEKCVTSKCQEIEIYLKQ
1010 1020 1030 1040 1050 1060
1060 1070 1080 1090 1100 1110
pF1KE9 CTSLCENRKNELEQ-LKEAFAKEHQ-EFLTKL---AFAEERNQNLMLELETV--QQALRS
: : . ..... :.: .: :.: . :.: .. .. :: .:. : : ...
CCDS30 TISEKEVELQHIRKDLEEKLAAEEQFQALVKQMNQTLQDKTNQIDLLQAEISENQAIIQK
1070 1080 1090 1100 1110 1120
1120 1130 1140 1150 1160 1170
pF1KE9 EMTDNQNNSKSEAGGLKQEIMTLKEEQNKMQKEVNDLLQENEQLMKVMKTKHECQNLESE
.:.: . : ... .: .: .... . ... . :. :... . : :.. :. .:
CCDS30 LITSNTDASDGDSVALVKETVVISPPCTGSSEHWKPELE--EKILALEKEKEQLQKKLQE
1130 1140 1150 1160 1170 1180
1180 1190 1200 1210 1220 1230
pF1KE9 PI--RNSVKERESERNQCNFKPQMDLEVKEISLDSYNAQLVQLEAMLRNKELKLQESEKE
. :... .. .:... .. :.:. . :.:: :.. . ...: .. .. ..
CCDS30 ALTSRKAILKKAQEKER-----HLREELKQ-QKDDYNRLQEQFDEQSKENE-NIGDQLRQ
1190 1200 1210 1220 1230
1240 1250 1260 1270 1280
pF1KE9 KECLQHEL-QTIRGDLETSNLQDMQSQEISGLKDCEIDAEEKYISGP---HELSTSQNDN
:: .. ..: : : ... :. :. ::.. . : :.. . : .: . ..
CCDS30 ---LQIQVRESIDGKLPSTDQQESCSST-PGLEEPLFKATEQHHTQPVLESNLCPDWPSH
1240 1250 1260 1270 1280 1290
1290 1300 1310 1320 1330 1340
pF1KE9 AHLQCSLQTTMNKLNELEKICEILQAEKYELVTELNDSRSECITATR---KMAEEVGKLL
.. .:: . . .. :: .::: :: ..... :: .. .. :...:
CCDS30 SEDASALQGGTSVAQIKAQLKEI-EAEKVELELKVSSTTSELTKKSEEVFQLQEQINKQG
1300 1310 1320 1330 1340 1350
1350 1360 1370 1380 1390
pF1KE9 NEVKILNDDS--GLLHGELVED--------IPGGEFGE--QPN-EQHPVSLAPLDESNSY
:.. :. : . .:.: ... : : : . ::. .. .. .:. ::
CCDS30 LEIESLKTVSHEAEVHAESLQQKLESSQLQIAGLEHLRELQPKLDELQKLISKKEEDVSY
1360 1370 1380 1390 1400 1410
1400 1410 1420 1430 1440
pF1KE9 EHLTLSDKE-----VQMHFAELQEKFLSLQSEHKIL---HDQHC-QMSSKMSELQTYVDS
::.:: .: .. : .. . .:... .. ::.. :.. .. :.. .
CCDS30 LSGQLSEKEAALTKIQTEIIEQEDLIKALHTQLEMQAKEHDERIKQLQVELCEMKQKPEE
1420 1430 1440 1450 1460 1470
1450 1460 1470 1480 1490
pF1KE9 LKAENLVLSTNLRNFQGDLV---------KEMQ--LGLEEGLVPSLSSSCVPDSSSLSSL
. :. . . :..:. :. : .: :.: .: . :..: . :..:.
CCDS30 IGEESRAKQQIQRKLQAALISRKEALKENKSLQEELSLARGTIERLTKSLADVESQVSAQ
1480 1490 1500 1510 1520 1530
1500 1510 1520 1530 1540
pF1KE9 G---DSSFYR-ALLEQTGDMSLLSNLEGTVSANQCSVDEVFCSSLQE--ENLTRKETPSA
. :. . : :::.. : .:..... .. :: . : ::. :.::. .
CCDS30 NKEKDTVLGRLALLQEERD-KLITEMDRSLLENQSLSSS--CESLKLALEGLTEDKE---
1540 1550 1560 1570 1580
1550 1560 1570 1580 1590 1600
pF1KE9 PAKGVEELESLCEVYRQSLEKLEEKMESQGIMKNKEIQ-ELEQLLSS-ERQELDCLRKQY
: :.:.::: ..: :. :. : : :.::.: : : ::.: : . : :.
CCDS30 --KLVKEIESL----KSS--KIAESTEWQ--EKHKELQKEYEILLQSYENVSNEAERIQH
1590 1600 1610 1620 1630
1610 1620 1630 1640 1650 1660
pF1KE9 LSEN-EQWQQKLTSVTLEMESKLAAEKKQTEQLSLELEVARLQLQGLDLSSRS-LLGIDT
. : .: .:.: . :.. .:: .. :.: . ... . :... .: ..
CCDS30 VVEAVRQEKQELYGKLRSTEANKKETEKQLQEAEQEMEEMKEKMRKFAKSKQQKILELEE
1640 1650 1660 1670 1680 1690
1670 1680 1690 1700 1710
pF1KE9 E-DAIQGR-NESCDISKE--HTSETTERTPKHDVHQIC---DKDAQQDLNLDIEKITETG
: : .... . . : .:: .: ... . :...... . ... .: :: . .
CCDS30 ENDRLRAEVHPAGDTAKECMETLLSSNASMKEELERVKMEYETLSKKFQSLMSEKDSLSE
1700 1710 1720 1730 1740 1750
1720 1730 1740 1750 1760 1770
pF1KE9 AVKPTG-ECSGEQSPDTNYEPPGEDKTQGSSECISELSFSGPNALVPMDFLGNQEDIHNL
:. . :. : ..: : . .: ..... : . : : :. :. .:
CCDS30 EVQDLKHQIEGNVSKQANLE--ATEKHDNQTNVTEEGTQSIP---------GETEEQDSL
1760 1770 1780 1790 1800
1780 1790 1800 1810 1820 1830
pF1KE9 QLRVKETSNENLRLLHVIEDRDRKVESLLNEMKELDSKLHLQEVQLMTKIEACIELEKIV
.. .. : .:. . .. . : . .. :... .::... . :.:.
CCDS30 SMSTRPTCSES---VPSAKSANPAVSKDFSSHDEINN--YLQQIDQLK--------ERIA
1810 1820 1830 1840 1850
1840 1850 1860 1870 1880 1890
pF1KE9 G--ELKKENSDLSEKLEYFSCDHQELLQRVETSEGLNSDLEMHADKSSREDIGDNVAKVN
: : :..:...:. :: ... ::... :..: .:.: . ..:.:.:
CCDS30 GLEEEKQKNKEFSQTLEN---EKNTLLSQISTKDG---ELKM---------LQEEVTKMN
1860 1870 1880 1890
1900 1910 1920 1930 1940 1950
pF1KE9 DSWKERFLDVENELSRIRSEKASIEHEALYLEADLEVVQTEKLCLEKDNENKQKVIVCLE
.. ...::::. . : . :.: . ::: :.: . . : . : .
CCDS30 LLNQQ----IQEELSRVTKLKETAEEE----KDDLE----ERLMNQLAELNGSIGNYCQD
1900 1910 1920 1930 1940
1960 1970 1980 1990 2000
pF1KE9 EELSVVTSERNQLRGELDTMSKKTTALDQLSEKM-KEKTQELESH-QSECLHCIQVAEAE
. . .: :..:. ...: .. :.. .... ::::. .::. ..: :. :: :. :
CCDS30 VTDAQIKNE--LLESEMKNLKKCVSELEEEKQQLVKEKTK-VESEIRKEYLEKIQGAQKE
1950 1960 1970 1980 1990 2000
2010 2020 2030 2040 2050 2060
pF1KE9 ------VKEKTELLQTLSSDVSELLKDKTHLQEKLQSLEKDSQALSLTKCELENQIAQLN
.:: :::. ...:..: :: . :::...::. .:: ... : .... .
CCDS30 PGNKSHAKELQELLKEKQQEVKQLQKDCIRYQEKISALERTVKALEFVQTESQKDLEITK
2010 2020 2030 2040 2050 2060
2070 2080 2090 2100 2110
pF1KE9 KEKELLVKESESLQARLSESDYEKLNVSKALEAALVEKGEFALR--LSSTQEEVH-QLRR
.. :.. .. ::.:. ... : . ::: : .. :. :.:..: :. :...
CCDS30 ENLAQAVEHRKKAQAELA--SFKVLLDDTQSEAARVLADNLKLKKELQSNKESVKSQMKQ
2070 2080 2090 2100 2110
2120 2130 2140 2150 2160 2170
pF1KE9 GIEKLRVRIEADEKKQLHIAEKLKERERENDSLKDKVENLERELQMSEENQELVILDAEN
: :. :.: :.:.: .:..: ...:.. :.:: ::. . . ..
CCDS30 KDEDLERRLEQAEEKHL--------KEKKN--MQEKLDALRREKVHLEETIGEIQVTLNK
2120 2130 2140 2150 2160
2180 2190 2200 2210 2220 2230
pF1KE9 SKAEVETLKTQIEEMARSLKVFELDLVTLRSEKENLTKQIQEKQGQLSELDKLLSSFKSL
. ::. :. ... . .: .: .. .:..... . ..: : .:..
CCDS30 KDKEVQQLQENLDSTVTQLAAFTKSMSSLQDDRDRV----------IDEAKKWERKFSDA
2170 2180 2190 2200 2210
2240 2250 2260 2270 2280
pF1KE9 LEEKEQAEIQIKEES----KTAVEMLQNQLKELNEAVAALCGDQEIMKATEQS-------
.. ::. ::..::.. : ..... ...::. .. : :..: .. :.
CCDS30 IQSKEE-EIRLKEDNCSVLKDQLRQMSIHMEELKINISRLEHDKQIWESKAQTEVQLQQK
2220 2230 2240 2250 2260 2270
2290 2300 2310 2320 2330
pF1KE9 -----------LDPPIEEEHQLRNSIEKLRARLEADEKKQLCVLQQLKESEHHADLLKGR
: .:: ..: .: .. :.::.. :. : .:..: .. ::
CCDS30 VCDTLQGENKELLSQLEETRHLYHSSQNELAKLESELKSLKDQLTDLSNSLEKCKEQKGN
2280 2290 2300 2310 2320 2330
2340 2350 2360 2370 2380 2390
pF1KE9 VENLERELEIARTNQEHAALEAENSKGEVETLKAKIEGMTQSLRGLELDVVTIRSEKENL
.:.. :. : :.. . . :.. . : .... . . : .... : ::.
CCDS30 LEGIIRQQEADIQNSKFSYEQLETDLQASRELTSRLH---EEINMKEQKIISLLSGKEEA
2340 2350 2360 2370 2380 2390
2400 2410 2420 2430 2440
pF1KE9 TN----ELQKEQER-ISELEIINSSFE--NILQEKEQEKVQMKEKSSTAMEMLQT-----
. ::...... :.::: . :. : ::. :.:..:. .:.. :: :.:
CCDS30 IQVAIAELRQQHDKEIKELENLLSQEEEENIVLEEENKKA--VDKTNQLMETLKTIKKEN
2400 2410 2420 2430 2440 2450
2450 2460 2470 2480 2490 2500
pF1KE9 -----QLKELNERVAALHNDQEACKAKEQNLSSQVECLELEKAQLLQGLDEAKNNYIVLQ
:: . . ...:.::.. . :.: . . ::: ::.: :.:: :.
CCDS30 IQQKAQLDSFVKSMSSLQNDRDRIVGDYQQLEERHLSIILEKDQLIQEA-AAENNK--LK
2460 2470 2480 2490 2500
2510 2520 2530 2540 2550
pF1KE9 SSVNGLIQEVEDGKQKLEKKDEEISRLKNQIQDQEQLVS-KLSQVEGEHQLWKEQNLELR
. :: ....: ... : : :. . . .: .:... : :: . .. .:: ::.
CCDS30 EEIRGLRSHMDDLNSENAKLDAELIQYR---EDLNQVITIKDSQQKQLLEVQLQQNKELE
2510 2520 2530 2540 2550 2560
2560 2570 2580 2590 2600 2610
pF1KE9 NLTVELEQKIQVLQSKNASLQDTLEVLQSSYKNLENELELTKMDKMSFVEKVNKMTAKET
: ..::.:.. . : .:. ....:: ..: .:.: :.. .....:. . . :
CCDS30 NKYAKLEEKLKESEEANEDLRRSFNALQEEKQDLSKEIESLKVSISQLTRQVTALQEEGT
2570 2580 2590 2600 2610 2620
2620 2630 2640 2650 2660 2670
pF1KE9 E--LQREMHEMAQKTAELQEELSGEKNRLAGELQLLLEEIKSSKDQLKELTLENSELKKS
. ... ... .:. .:. ..:.: .: : . .:. :.. ...:::
CCDS30 LGLYHAQLKVKEEEVHRLSALFSSSQKRIA---ELEEELVCVQKEAAKKVGEIEDKLKKE
2630 2640 2650 2660 2670 2680
2680 2690 2700 2710 2720 2730
pF1KE9 LDCMHKDQ--VEKEGKVREE-IAEYQLRLHEAEKKHQALLLDTNKQYEVEIQTYREKLTS
: .:.: ...: .. :: .:: : : :.: .. :: ..::.. ....:
CCDS30 LKHLHHDAGIMRNETETAEERVAELARDLVEMEQK-LLMVTKENKGLTAQIQSFGRSMSS
2690 2700 2710 2720 2730 2740
2740 2750 2760 2770 2780 2790
pF1KE9 KEECLSSQKLEIDLLKSSKEELNNSLKATTQILEE-LKKTKMDNLKYVNQLKKENERAQG
.. . . :.: :: .. . ::: .:. :. : . . : : . .. : ..
CCDS30 LQNSRDHANEELDELK---RKYDASLKELAQLKEQGLLNRERDALLSETAFSM-NSTEEN
2750 2760 2770 2780 2790
2800 2810 2820 2830 2840
pF1KE9 KMKLLIKSCKQLEEEKEILQKELSQLQAA----QEKQKTGTVMDTKVDELTTEIKELKET
... : : .:: . : : . :::. . : .:. . .... :.: .:.......
CCDS30 SLSHLEKLNQQLLSKDEQLLHLSSQLEDSYNQVQSFSKAMASLQNERDHLWNELEKFRKS
2800 2810 2820 2830 2840 2850
2850 2860 2870 2880 2890 2900
pF1KE9 LEEKTKEADEYLDKYCSLLISHEKLEKAKEMLETQVAHLCSQQSKQDSRGSPLLGPVVPG
: : . :
CCDS30 EEGKQRSAAQPSTSPAEVQSLKKAMSSLQNDRDRLLKELKNLQQQYLQINQEITELHPLK
2860 2870 2880 2890 2900 2910
>>CCDS58847.1 GOLGB1 gene_id:2804|Hs108|chr3 (3269 aa)
initn: 205 init1: 106 opt: 948 Z-score: 417.9 bits: 92.2 E(32554): 5.9e-17
Smith-Waterman score: 1297; 22.5% identity (56.2% similar) in 3039 aa overlap (18-2857:52-2871)
10 20 30 40
pF1KE9 MSWALEEWKEGLPTRALQKIQELEGQLDKLKKEKQQRQFQLDSLEAA
... : . .:: .:.. ::.. . :
CCDS58 TDQNMRAPLDPELHQESDMEFNNTTQEDVQERLAYAEQLVVELKDIIRQKDVQLQQKDEA
30 40 50 60 70 80
50 60 70 80 90 100
pF1KE9 LQKQKQKVENEKTEGTNLKRENQRLMEICESLEKTKQKISHELQVKESQVNFQEGQLNSG
::.... ..: : . .:. . .: . . .:. : . . : . : : .: ::..
CCDS58 LQEERKAADN-KIKKLKLHAKA-KLTSLNKYIEEMKAQGGTVLPT-EPQ---SEEQLSKH
90 100 110 120 130
110 120 130 140 150 160
pF1KE9 KKQIEKLEQELKRCKSELERSQQAAQSADVSLNPCNTPQKIFTTPLTPSQYYSGSKYED-
:. . :.:... : .:..... .. ...:. .. : :.: :....:.
CCDS58 DKSSTEEEMEIEKIKHKLQEKEELISTLQAQLTQAQAEQ--------PAQ--SSTEMEEF
140 150 160 170 180
170 180 190 200 210 220
pF1KE9 --LKEKYNKEVEERKRLEAEVKALQAKKASQ-TLPQATMNHRDIARHQASSSVFSWQQEK
.:.. ... : . :.:... ::..:.: . : .. ..: :: ... . . .
CCDS58 VMMKQQLQEKEEFISTLQAQLSQTQAEQAAQLSSMQQVVREKD-ARFETQVRLHEDELLQ
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE9 TPSHLSSNSQRTPIRRDFSASYFSGEQEVTPSRSTLQIGKRDANSSFFDNSSSPHLLDQL
.. . ... : .. . :. .. ..... ... ... :. . :.:.
CCDS58 LVTQADVETEMQQKLRVLQRKLEEHEESLVGRAQVVDLLQQELTAAEQRNQILSQQLQQM
250 260 270 280 290 300
290 300 310 320 330 340
pF1KE9 KAQNQELRNKINELELRLQGHEKEMKGQVNKFQELQLQLEKAKVELIEKEKVLNKCRDEL
.:... ::: .. :.: : .. ::: ..:. :.. ... ..:.
CCDS58 EAEHNTLRNTVET--------ERE---------ESKILLEKMELEVAERKLSFHNLQEEM
310 320 330 340
350 360 370 380 390 400
pF1KE9 VRTTAQYDQASTKYTALEQKLKKLTEDLSCQRQNAESARCSLEQKIKEKEKEFQEELSRQ
. :..::. . ::.. . .:::: : . .: ..
CCDS58 HHLLEQFEQAGQAQAELESRYS------------------ALEQKHKAEMEEKTSHILSL
350 360 370 380
410 420 430 440 450 460
pF1KE9 QRSFQTLDQECIQMKARLTQELQQAKNMHNVLQAELDKLTSVKQQLENNLEEFKQKLCRA
:.. : :.. : .: . ...: : :: . : .:. . ....::... .:..: : :
CCDS58 QKTGQELQSACDALKDQ-NSKLLQDKNEQAVQSAQT--IQQLEDQLQQKSKEISQFLNRL
390 400 410 420 430 440
470 480 490 500 510 520
pF1KE9 --EQAFQASQIKENELRRSMEEMKKENNLLKSHSEQKAREVCHLEAELKNIKQCLNQSQN
.: ::: . .. . :.:. : :: : : ::.: : : :.
CCDS58 PLQQHETASQTSFPDVYNEGTQAVTEENI---ASLQK-RVV-----ELENEKGALLLSSI
450 460 470 480 490
530 540 550 560 570
pF1KE9 FAEEMKAKN---TSQETMLRDLQEKINQQENSLTLEKLKLAVADLEKQRDCSQDLLKKRE
::.::.: .:: :.: . :.. .. . .. .....:. ..:. : . :
CCDS58 ELEELKAENEKLSSQITLL-EAQNRTGEADREVS----EISIVDIANKRSSSAE-----E
500 510 520 530 540
580 590 600 610 620 630
pF1KE9 HHIEQLNDKLSKTEKESKALLSALELKKKEYEELKEEKTLFSCWKSE-------NEKLLT
. :.. .:. .:: ..:: ::.:. . ::. : .. ..: ..: .
CCDS58 SGQDVLENTFSQKHKELSVLL--LEMKEAQ-EEIAFLKLQLQGKRAEEADHEVLDQKEMK
550 560 570 580 590 600
640 650 660 670 680
pF1KE9 QMESEK-ENLQSKINHLETCLKTQQIKSHEYNERVRTLEMDRENLSVE--IRNLHNV-LD
:::.: .. :. :: : : ::. ...:. :.: :. ... :.
CCDS58 QMEGEGIAPIKMKV-FLED---TGQDFPLMPNEESSLPAVEKEQASTEHQSRTSEEISLN
610 620 630 640 650 660
690 700 710 720 730 740
pF1KE9 SKSVEVETQKLAYMELQQKAEFSDQKHQKEIENMCLKTSQLTGQVEDLE---HKLQLLSN
. .::... : . . . : :: :.: .: .:. .:: :: : . .
CCDS58 DAGVELKSTKQDGDKSLSAVPDIGQCHQDELE-------RLKSQILELELNFHKAQEIYE
670 680 690 700 710
750 760 770 780
pF1KE9 EIMD-KDRCYQDLHAEYESL-----------------RDLLKS--KDASLVTNEDHQRSL
. .: : . ..:. : . :: : : :. :.::. : .
CCDS58 KNLDEKAKEISNLNQLIEEFKKNADNNSSAFTALSEERDQLLSQVKELSMVTELRAQVKQ
720 730 740 750 760 770
790 800 810 820 830
pF1KE9 LAFDQQPAMHH---SFANIIGEQGSMPSERSECRLEADQSPKNSAILQNRVDS--LEFSL
: .. : .. .. . .... . . .:: .. . .:::..:. :.::
CCDS58 LEMNLAEAERQRRLDYESQTAHDNLLTEQIHSLSIEAKSKDVKIEVLQNELDDVQLQFSE
780 790 800 810 820 830
840 850 860 870 880 890
pF1KE9 ESQ--KQMNSDLQKQCEELVQIKGEIEENLMKAEQMHQSFVAETSQRISKLQEDTSAHQN
.: ....:.::.. :... .... :.:.. :.. .. .:.:... ..
CCDS58 QSTLIRSLQSQLQNKESEVLEGAERVRHISSKVEELSQAL-SQKELEITKMDQLLLEKKR
840 850 860 870 880 890
900 910 920 930 940 950
pF1KE9 VVAETLSALENKEKELQLLNDKVETEQAEIQELKKSNHLLEDSLKE-LQLLSETLSLEKK
: ...:.:.... .. .. ......: : : . .::: :.:::.. .:.
CCDS58 DVETLQQTIEEKDQQVTEISFSMTEKMVQLNEEKFSLGVEIKTLKEQLNLLSRAEEAKKE
900 910 920 930 940 950
960 970 980 990 1000
pF1KE9 ------EMSSIISLNKREI--------EELTQENGTLKEINASLNQE-KMNLIQKSESFA
:.:: .. : :. ::: .: ::. : . ... . ::...: .
CCDS58 QVEEDNEVSSGLKQNYDEMSPAGQISKEELQHEFDLLKKENEQRKRKLQAALINRKE-LL
960 970 980 990 1000 1010
1010 1020 1030 1040 1050
pF1KE9 NYIDEREKSISELSDQYKQEKLILLQRCEETGNAYEDLSQKY---KAAQEKNSKLECLLN
. ... :. ...:.:. :.: : :.. :. :.. :: .: : . : ...: :.
CCDS58 QRVSRLEEELANLKDESKKE--IPLSETER-GEVEEDKENKEYSEKCVTSKCQEIEIYLK
1020 1030 1040 1050 1060
1060 1070 1080 1090 1100 1110
pF1KE9 ECTSLCENRKNELEQ-LKEAFAKEHQ-EFLTKL---AFAEERNQNLMLELETV--QQALR
. : : . ..... :.: .: :.: . :.: .. .. :: .:. : : ..
CCDS58 QTISEKEVELQHIRKDLEEKLAAEEQFQALVKQMNQTLQDKTNQIDLLQAEISENQAIIQ
1070 1080 1090 1100 1110 1120
1120 1130 1140 1150 1160 1170
pF1KE9 SEMTDNQNNSKSEAGGLKQEIMTLKEEQNKMQKEVNDLLQENEQLMKVMKTKHECQNLES
. .:.: . : ... .: .: .... . ... . :. :... . : :.. :. .
CCDS58 KLITSNTDASDGDSVALVKETVVISPPCTGSSEHWKPELE--EKILALEKEKEQLQKKLQ
1130 1140 1150 1160 1170 1180
1180 1190 1200 1210 1220
pF1KE9 EPI--RNSVKERESERNQCNFKPQMDLEVKEISLDSYNAQLVQLEAMLRNKELKLQESEK
: . :... .. .:... .. :.:. . :.:: :.. . ...: .. .. .
CCDS58 EALTSRKAILKKAQEKER-----HLREELKQ-QKDDYNRLQEQFDEQSKENE-NIGDQLR
1190 1200 1210 1220 1230
1230 1240 1250 1260 1270 1280
pF1KE9 EKECLQHEL-QTIRGDLETSNLQDMQSQEISGLKDCEIDAEEKYISGP---HELSTSQND
. :: .. ..: : : ... :. :. ::.. . : :.. . : .: . .
CCDS58 Q---LQIQVRESIDGKLPSTDQQESCSST-PGLEEPLFKATEQHHTQPVLESNLCPDWPS
1240 1250 1260 1270 1280 1290
1290 1300 1310 1320 1330 1340
pF1KE9 NAHLQCSLQTTMNKLNELEKICEILQAEKYELVTELNDSRSECITATR---KMAEEVGKL
... .:: . . .. :: .::: :: ..... :: .. .. :...:
CCDS58 HSEDASALQGGTSVAQIKAQLKEI-EAEKVELELKVSSTTSELTKKSEEVFQLQEQINKQ
1300 1310 1320 1330 1340 1350
1350 1360 1370 1380
pF1KE9 LNEVKILNDDS--GLLHGELVED--------IPGGEFGE--QPN-EQHPVSLAPLDESNS
:.. :. : . .:.: ... : : : . ::. .. .. .:. :
CCDS58 GLEIESLKTVSHEAEVHAESLQQKLESSQLQIAGLEHLRELQPKLDELQKLISKKEEDVS
1360 1370 1380 1390 1400 1410
1390 1400 1410 1420 1430 1440
pF1KE9 YEHLTLSDKE-----VQMHFAELQEKFLSLQSEHKIL---HDQHC-QMSSKMSELQTYVD
: ::.:: .: .. : .. . .:... .. ::.. :.. .. :.. .
CCDS58 YLSGQLSEKEAALTKIQTEIIEQEDLIKALHTQLEMQAKEHDERIKQLQVELCEMKQKPE
1420 1430 1440 1450 1460 1470
1450 1460 1470 1480
pF1KE9 SLKAENLVLSTNLRNFQGDLV---------KEMQ--LGLEEGLVPSLSSSCVPDSSSLSS
. :. . . :..:. :. : .: :.: .: . :..: . :..:.
CCDS58 EIGEESRAKQQIQRKLQAALISRKEALKENKSLQEELSLARGTIERLTKSLADVESQVSA
1480 1490 1500 1510 1520 1530
1490 1500 1510 1520 1530 1540
pF1KE9 LG---DSSFYR-ALLEQTGDMSLLSNLEGTVSANQCSVDEVFCSSLQE--ENLTRKETPS
. :. . : :::.. : .:..... .. :: . : ::. :.::. .
CCDS58 QNKEKDTVLGRLALLQEERD-KLITEMDRSLLENQSLSSS--CESLKLALEGLTEDKE--
1540 1550 1560 1570 1580
1550 1560 1570 1580 1590 1600
pF1KE9 APAKGVEELESLCEVYRQSLEKLEEKMESQGIMKNKEIQ-ELEQLLSS-ERQELDCLRKQ
: :.:.::: ..: :. :. : : :.::.: : : ::.: : . : :
CCDS58 ---KLVKEIESL----KSS--KIAESTEWQ--EKHKELQKEYEILLQSYENVSNEAERIQ
1590 1600 1610 1620 1630
1610 1620 1630 1640 1650
pF1KE9 YLSEN-EQWQQKLTSVTLEMESKLAAEKKQTEQLSLELEVARLQLQGLDLSSRS-LLGID
.. : .: .:.: . :.. .:: .. :.: . ... . :... .: ..
CCDS58 HVVEAVRQEKQELYGKLRSTEANKKETEKQLQEAEQEMEEMKEKMRKFAKSKQQKILELE
1640 1650 1660 1670 1680 1690
1660 1670 1680 1690 1700 1710
pF1KE9 TE-DAIQGR-NESCDISKE--HTSETTERTPKHDVHQIC---DKDAQQDLNLDIEKITET
: : .... . . : .:: .: ... . :...... . ... .: :: . .
CCDS58 EENDRLRAEVHPAGDTAKECMETLLSSNASMKEELERVKMEYETLSKKFQSLMSEKDSLS
1700 1710 1720 1730 1740 1750
1720 1730 1740 1750 1760 1770
pF1KE9 GAVKPTG-ECSGEQSPDTNYEPPGEDKTQGSSECISELSFSGPNALVPMDFLGNQEDIHN
:. . :. : ..: : . .: ..... : . : : :. :. .
CCDS58 EEVQDLKHQIEGNVSKQANLE--ATEKHDNQTNVTEEGTQSIP---------GETEEQDS
1760 1770 1780 1790 1800
1780 1790 1800 1810 1820 1830
pF1KE9 LQLRVKETSNENLRLLHVIEDRDRKVESLLNEMKELDSKLHLQEVQLMTKIEACIELEKI
:.. .. : .:. . .. . : . .. :... .::... . :.:
CCDS58 LSMSTRPTCSES---VPSAKSANPAVSKDFSSHDEINN--YLQQIDQLK--------ERI
1810 1820 1830 1840 1850
1840 1850 1860 1870 1880
pF1KE9 VG--ELKKENSDLSEKLEYFSCDHQELLQRVETSEGLNSDLEMHADKSSREDIGDNVAKV
.: : :..:...:. :: ... ::... :..: .:.: . ..:.:.
CCDS58 AGLEEEKQKNKEFSQTLEN---EKNTLLSQISTKDG---ELKM---------LQEEVTKM
1860 1870 1880 1890
1890 1900 1910 1920 1930 1940
pF1KE9 NDSWKERFLDVENELSRIRSEKASIEHEALYLEADLEVVQTEKLCLEKDNENKQKVIVCL
: .. ...::::. . : . :.: . ::: :.: . . : . :
CCDS58 NLLNQQ----IQEELSRVTKLKETAEEE----KDDLE----ERLMNQLAELNGSIGNYCQ
1900 1910 1920 1930 1940
1950 1960 1970 1980 1990 2000
pF1KE9 EEELSVVTSERNQLRGELDTMSKKTTALDQLSEKM-KEKTQELESH-QSECLHCIQVAEA
. . . .: :..:. ...: .. :.. .... ::::. .::. ..: :. :: :.
CCDS58 DVTDAQIKNE--LLESEMKNLKKCVSELEEEKQQLVKEKTK-VESEIRKEYLEKIQGAQK
1950 1960 1970 1980 1990 2000
2010 2020 2030 2040 2050 2060
pF1KE9 E------VKEKTELLQTLSSDVSELLKDKTHLQEKLQSLEKDSQALSLTKCELENQIAQL
: .:: :::. ...:..: :: . :::...::. .:: ... : ....
CCDS58 EPGNKSHAKELQELLKEKQQEVKQLQKDCIRYQEKISALERTVKALEFVQTESQKDLEIT
2010 2020 2030 2040 2050 2060
2070 2080 2090 2100 2110
pF1KE9 NKEKELLVKESESLQARLSESDYEKLNVSKALEAALVEKGEFALR--LSSTQEEVH-QLR
... :.. .. ::.:. ... : . ::: : .. :. :.:..: :. :..
CCDS58 KENLAQAVEHRKKAQAELA--SFKVLLDDTQSEAARVLADNLKLKKELQSNKESVKSQMK
2070 2080 2090 2100 2110 2120
2120 2130 2140 2150 2160 2170
pF1KE9 RGIEKLRVRIEADEKKQLHIAEKLKERERENDSLKDKVENLERELQMSEENQELVILDAE
. : :. :.: :.:.: .:..: ...:.. :.:: ::. . . .
CCDS58 QKDEDLERRLEQAEEKHL--------KEKKN--MQEKLDALRREKVHLEETIGEIQVTLN
2130 2140 2150 2160 2170
2180 2190 2200 2210 2220 2230
pF1KE9 NSKAEVETLKTQIEEMARSLKVFELDLVTLRSEKENLTKQIQEKQGQLSELDKLLSSFKS
.. ::. :. ... . .: .: .. .:..... . ..: : .:..
CCDS58 KKDKEVQQLQENLDSTVTQLAAFTKSMSSLQDDRDRV----------IDEAKKWERKFSD
2180 2190 2200 2210 2220
2240 2250 2260 2270 2280
pF1KE9 LLEEKEQAEIQIKEES----KTAVEMLQNQLKELNEAVAALCGDQEIMKATEQS------
.. ::. ::..::.. : ..... ...::. .. : :..: .. :.
CCDS58 AIQSKEE-EIRLKEDNCSVLKDQLRQMSIHMEELKINISRLEHDKQIWESKAQTEVQLQQ
2230 2240 2250 2260 2270 2280
2290 2300 2310 2320 2330
pF1KE9 ------------LDPPIEEEHQLRNSIEKLRARLEADEKKQLCVLQQLKESEHHADLLKG
: .:: ..: .: .. :.::.. :. : .:..: .. ::
CCDS58 KVCDTLQGENKELLSQLEETRHLYHSSQNELAKLESELKSLKDQLTDLSNSLEKCKEQKG
2290 2300 2310 2320 2330 2340
2340 2350 2360 2370 2380 2390
pF1KE9 RVENLERELEIARTNQEHAALEAENSKGEVETLKAKIEGMTQSLRGLELDVVTIRSEKEN
.:.. :. : :.. . . :.. . : .... . . : .... : ::.
CCDS58 NLEGIIRQQEADIQNSKFSYEQLETDLQASRELTSRLH---EEINMKEQKIISLLSGKEE
2350 2360 2370 2380 2390
2400 2410 2420 2430 2440
pF1KE9 LTN----ELQKEQER-ISELEIINSSFE--NILQEKEQEKVQMKEKSSTAMEMLQT----
. ::...... :.::: . :. : ::. :.:..:. .:.. :: :.:
CCDS58 AIQVAIAELRQQHDKEIKELENLLSQEEEENIVLEEENKKA--VDKTNQLMETLKTIKKE
2400 2410 2420 2430 2440 2450
2450 2460 2470 2480 2490
pF1KE9 ------QLKELNERVAALHNDQEACKAKEQNLSSQVECLELEKAQLLQGLDEAKNNYIVL
:: . . ...:.::.. . :.: . . ::: ::.: :.:: :
CCDS58 NIQQKAQLDSFVKSMSSLQNDRDRIVGDYQQLEERHLSIILEKDQLIQEA-AAENNK--L
2460 2470 2480 2490 2500 2510
2500 2510 2520 2530 2540 2550
pF1KE9 QSSVNGLIQEVEDGKQKLEKKDEEISRLKNQIQDQEQLVS-KLSQVEGEHQLWKEQNLEL
. . :: ....: ... : : :. . . .: .:... : :: . .. .:: ::
CCDS58 KEEIRGLRSHMDDLNSENAKLDAELIQYR---EDLNQVITIKDSQQKQLLEVQLQQNKEL
2520 2530 2540 2550 2560 2570
2560 2570 2580 2590 2600 2610
pF1KE9 RNLTVELEQKIQVLQSKNASLQDTLEVLQSSYKNLENELELTKMDKMSFVEKVNKMTAKE
.: ..::.:.. . : .:. ....:: ..: .:.: :.. .....:. . .
CCDS58 ENKYAKLEEKLKESEEANEDLRRSFNALQEEKQDLSKEIESLKVSISQLTRQVTALQEEG
2580 2590 2600 2610 2620 2630
2620 2630 2640 2650 2660 2670
pF1KE9 TE--LQREMHEMAQKTAELQEELSGEKNRLAGELQLLLEEIKSSKDQLKELTLENSELKK
: . ... ... .:. .:. ..:.: .: : . .:. :.. ...:::
CCDS58 TLGLYHAQLKVKEEEVHRLSALFSSSQKRIA---ELEEELVCVQKEAAKKVGEIEDKLKK
2640 2650 2660 2670 2680
2680 2690 2700 2710 2720 2730
pF1KE9 SLDCMHKDQ--VEKEGKVREE-IAEYQLRLHEAEKKHQALLLDTNKQYEVEIQTYREKLT
: .:.: ...: .. :: .:: : : :.: .. :: ..::.. ....
CCDS58 ELKHLHHDAGIMRNETETAEERVAELARDLVEMEQK-LLMVTKENKGLTAQIQSFGRSMS
2690 2700 2710 2720 2730 2740
2740 2750 2760 2770 2780 2790
pF1KE9 SKEECLSSQKLEIDLLKSSKEELNNSLKATTQILEE-LKKTKMDNLKYVNQLKKENERAQ
: .. . . :.: :: .. . ::: .:. :. : . . : : . .. : .
CCDS58 SLQNSRDHANEELDELK---RKYDASLKELAQLKEQGLLNRERDALLSETAFSM-NSTEE
2750 2760 2770 2780 2790 2800
2800 2810 2820 2830 2840
pF1KE9 GKMKLLIKSCKQLEEEKEILQKELSQLQAA----QEKQKTGTVMDTKVDELTTEIKELKE
.... : : .:: . : : . :::. . : .:. . .... :.: .:......
CCDS58 NSLSHLEKLNQQLLSKDEQLLHLSSQLEDSYNQVQSFSKAMASLQNERDHLWNELEKFRK
2810 2820 2830 2840 2850 2860
2850 2860 2870 2880 2890 2900
pF1KE9 TLEEKTKEADEYLDKYCSLLISHEKLEKAKEMLETQVAHLCSQQSKQDSRGSPLLGPVVP
. : : . :
CCDS58 SEEGKQRSAAQPSTSPAEVQSLKKAMSSLQNDRDRLLKELKNLQQQYLQINQEITELHPL
2870 2880 2890 2900 2910 2920
3114 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 10:56:02 2016 done: Tue Nov 8 10:56:03 2016
Total Scan time: 7.550 Total Display time: 1.650
Function used was FASTA [36.3.4 Apr, 2011]