FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE9253, 3114 aa 1>>>pF1KE9253 3114 - 3114 aa - 3114 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 14.6046+/-0.00187; mu= -15.7692+/- 0.110 mean_var=558.3610+/-119.753, 0's: 0 Z-trim(106.4): 260 B-trim: 0 in 0/52 Lambda= 0.054277 statistics sampled from 8766 (8974) to 8766 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.578), E-opt: 0.2 (0.276), width: 16 Scan time: 7.550 The best scores are: opt bits E(32554) CCDS31023.1 CENPF gene_id:1063|Hs108|chr1 (3114) 19598 1552.6 0 CCDS74989.1 GOLGB1 gene_id:2804|Hs108|chr3 (3184) 969 93.8 1.8e-17 CCDS3004.1 GOLGB1 gene_id:2804|Hs108|chr3 (3259) 948 92.2 5.9e-17 CCDS58847.1 GOLGB1 gene_id:2804|Hs108|chr3 (3269) 948 92.2 5.9e-17 >>CCDS31023.1 CENPF gene_id:1063|Hs108|chr1 (3114 aa) initn: 19598 init1: 19598 opt: 19598 Z-score: 8310.8 bits: 1552.6 E(32554): 0 Smith-Waterman score: 19598; 100.0% identity (100.0% similar) in 3114 aa overlap (1-3114:1-3114) 10 20 30 40 50 60 pF1KE9 MSWALEEWKEGLPTRALQKIQELEGQLDKLKKEKQQRQFQLDSLEAALQKQKQKVENEKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MSWALEEWKEGLPTRALQKIQELEGQLDKLKKEKQQRQFQLDSLEAALQKQKQKVENEKT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 EGTNLKRENQRLMEICESLEKTKQKISHELQVKESQVNFQEGQLNSGKKQIEKLEQELKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 EGTNLKRENQRLMEICESLEKTKQKISHELQVKESQVNFQEGQLNSGKKQIEKLEQELKR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 CKSELERSQQAAQSADVSLNPCNTPQKIFTTPLTPSQYYSGSKYEDLKEKYNKEVEERKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 CKSELERSQQAAQSADVSLNPCNTPQKIFTTPLTPSQYYSGSKYEDLKEKYNKEVEERKR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 LEAEVKALQAKKASQTLPQATMNHRDIARHQASSSVFSWQQEKTPSHLSSNSQRTPIRRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LEAEVKALQAKKASQTLPQATMNHRDIARHQASSSVFSWQQEKTPSHLSSNSQRTPIRRD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 FSASYFSGEQEVTPSRSTLQIGKRDANSSFFDNSSSPHLLDQLKAQNQELRNKINELELR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 FSASYFSGEQEVTPSRSTLQIGKRDANSSFFDNSSSPHLLDQLKAQNQELRNKINELELR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 LQGHEKEMKGQVNKFQELQLQLEKAKVELIEKEKVLNKCRDELVRTTAQYDQASTKYTAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LQGHEKEMKGQVNKFQELQLQLEKAKVELIEKEKVLNKCRDELVRTTAQYDQASTKYTAL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE9 EQKLKKLTEDLSCQRQNAESARCSLEQKIKEKEKEFQEELSRQQRSFQTLDQECIQMKAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 EQKLKKLTEDLSCQRQNAESARCSLEQKIKEKEKEFQEELSRQQRSFQTLDQECIQMKAR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE9 LTQELQQAKNMHNVLQAELDKLTSVKQQLENNLEEFKQKLCRAEQAFQASQIKENELRRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LTQELQQAKNMHNVLQAELDKLTSVKQQLENNLEEFKQKLCRAEQAFQASQIKENELRRS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE9 MEEMKKENNLLKSHSEQKAREVCHLEAELKNIKQCLNQSQNFAEEMKAKNTSQETMLRDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MEEMKKENNLLKSHSEQKAREVCHLEAELKNIKQCLNQSQNFAEEMKAKNTSQETMLRDL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE9 QEKINQQENSLTLEKLKLAVADLEKQRDCSQDLLKKREHHIEQLNDKLSKTEKESKALLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 QEKINQQENSLTLEKLKLAVADLEKQRDCSQDLLKKREHHIEQLNDKLSKTEKESKALLS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE9 ALELKKKEYEELKEEKTLFSCWKSENEKLLTQMESEKENLQSKINHLETCLKTQQIKSHE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ALELKKKEYEELKEEKTLFSCWKSENEKLLTQMESEKENLQSKINHLETCLKTQQIKSHE 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE9 YNERVRTLEMDRENLSVEIRNLHNVLDSKSVEVETQKLAYMELQQKAEFSDQKHQKEIEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 YNERVRTLEMDRENLSVEIRNLHNVLDSKSVEVETQKLAYMELQQKAEFSDQKHQKEIEN 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE9 MCLKTSQLTGQVEDLEHKLQLLSNEIMDKDRCYQDLHAEYESLRDLLKSKDASLVTNEDH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MCLKTSQLTGQVEDLEHKLQLLSNEIMDKDRCYQDLHAEYESLRDLLKSKDASLVTNEDH 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE9 QRSLLAFDQQPAMHHSFANIIGEQGSMPSERSECRLEADQSPKNSAILQNRVDSLEFSLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 QRSLLAFDQQPAMHHSFANIIGEQGSMPSERSECRLEADQSPKNSAILQNRVDSLEFSLE 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE9 SQKQMNSDLQKQCEELVQIKGEIEENLMKAEQMHQSFVAETSQRISKLQEDTSAHQNVVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SQKQMNSDLQKQCEELVQIKGEIEENLMKAEQMHQSFVAETSQRISKLQEDTSAHQNVVA 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE9 ETLSALENKEKELQLLNDKVETEQAEIQELKKSNHLLEDSLKELQLLSETLSLEKKEMSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ETLSALENKEKELQLLNDKVETEQAEIQELKKSNHLLEDSLKELQLLSETLSLEKKEMSS 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE9 IISLNKREIEELTQENGTLKEINASLNQEKMNLIQKSESFANYIDEREKSISELSDQYKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 IISLNKREIEELTQENGTLKEINASLNQEKMNLIQKSESFANYIDEREKSISELSDQYKQ 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE9 EKLILLQRCEETGNAYEDLSQKYKAAQEKNSKLECLLNECTSLCENRKNELEQLKEAFAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 EKLILLQRCEETGNAYEDLSQKYKAAQEKNSKLECLLNECTSLCENRKNELEQLKEAFAK 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE9 EHQEFLTKLAFAEERNQNLMLELETVQQALRSEMTDNQNNSKSEAGGLKQEIMTLKEEQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 EHQEFLTKLAFAEERNQNLMLELETVQQALRSEMTDNQNNSKSEAGGLKQEIMTLKEEQN 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE9 KMQKEVNDLLQENEQLMKVMKTKHECQNLESEPIRNSVKERESERNQCNFKPQMDLEVKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 KMQKEVNDLLQENEQLMKVMKTKHECQNLESEPIRNSVKERESERNQCNFKPQMDLEVKE 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE9 ISLDSYNAQLVQLEAMLRNKELKLQESEKEKECLQHELQTIRGDLETSNLQDMQSQEISG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ISLDSYNAQLVQLEAMLRNKELKLQESEKEKECLQHELQTIRGDLETSNLQDMQSQEISG 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE9 LKDCEIDAEEKYISGPHELSTSQNDNAHLQCSLQTTMNKLNELEKICEILQAEKYELVTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LKDCEIDAEEKYISGPHELSTSQNDNAHLQCSLQTTMNKLNELEKICEILQAEKYELVTE 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE9 LNDSRSECITATRKMAEEVGKLLNEVKILNDDSGLLHGELVEDIPGGEFGEQPNEQHPVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LNDSRSECITATRKMAEEVGKLLNEVKILNDDSGLLHGELVEDIPGGEFGEQPNEQHPVS 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE9 LAPLDESNSYEHLTLSDKEVQMHFAELQEKFLSLQSEHKILHDQHCQMSSKMSELQTYVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LAPLDESNSYEHLTLSDKEVQMHFAELQEKFLSLQSEHKILHDQHCQMSSKMSELQTYVD 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KE9 SLKAENLVLSTNLRNFQGDLVKEMQLGLEEGLVPSLSSSCVPDSSSLSSLGDSSFYRALL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SLKAENLVLSTNLRNFQGDLVKEMQLGLEEGLVPSLSSSCVPDSSSLSSLGDSSFYRALL 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KE9 EQTGDMSLLSNLEGTVSANQCSVDEVFCSSLQEENLTRKETPSAPAKGVEELESLCEVYR ::::::::::::::.::::::::::::::::::::::::::::::::::::::::::::: CCDS31 EQTGDMSLLSNLEGAVSANQCSVDEVFCSSLQEENLTRKETPSAPAKGVEELESLCEVYR 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KE9 QSLEKLEEKMESQGIMKNKEIQELEQLLSSERQELDCLRKQYLSENEQWQQKLTSVTLEM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 QSLEKLEEKMESQGIMKNKEIQELEQLLSSERQELDCLRKQYLSENEQWQQKLTSVTLEM 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KE9 ESKLAAEKKQTEQLSLELEVARLQLQGLDLSSRSLLGIDTEDAIQGRNESCDISKEHTSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ESKLAAEKKQTEQLSLELEVARLQLQGLDLSSRSLLGIDTEDAIQGRNESCDISKEHTSE 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KE9 TTERTPKHDVHQICDKDAQQDLNLDIEKITETGAVKPTGECSGEQSPDTNYEPPGEDKTQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 TTERTPKHDVHQICDKDAQQDLNLDIEKITETGAVKPTGECSGEQSPDTNYEPPGEDKTQ 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KE9 GSSECISELSFSGPNALVPMDFLGNQEDIHNLQLRVKETSNENLRLLHVIEDRDRKVESL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GSSECISELSFSGPNALVPMDFLGNQEDIHNLQLRVKETSNENLRLLHVIEDRDRKVESL 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KE9 LNEMKELDSKLHLQEVQLMTKIEACIELEKIVGELKKENSDLSEKLEYFSCDHQELLQRV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LNEMKELDSKLHLQEVQLMTKIEACIELEKIVGELKKENSDLSEKLEYFSCDHQELLQRV 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KE9 ETSEGLNSDLEMHADKSSREDIGDNVAKVNDSWKERFLDVENELSRIRSEKASIEHEALY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ETSEGLNSDLEMHADKSSREDIGDNVAKVNDSWKERFLDVENELSRIRSEKASIEHEALY 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KE9 LEADLEVVQTEKLCLEKDNENKQKVIVCLEEELSVVTSERNQLRGELDTMSKKTTALDQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LEADLEVVQTEKLCLEKDNENKQKVIVCLEEELSVVTSERNQLRGELDTMSKKTTALDQL 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KE9 SEKMKEKTQELESHQSECLHCIQVAEAEVKEKTELLQTLSSDVSELLKDKTHLQEKLQSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SEKMKEKTQELESHQSECLHCIQVAEAEVKEKTELLQTLSSDVSELLKDKTHLQEKLQSL 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 pF1KE9 EKDSQALSLTKCELENQIAQLNKEKELLVKESESLQARLSESDYEKLNVSKALEAALVEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 EKDSQALSLTKCELENQIAQLNKEKELLVKESESLQARLSESDYEKLNVSKALEAALVEK 2050 2060 2070 2080 2090 2100 2110 2120 2130 2140 2150 2160 pF1KE9 GEFALRLSSTQEEVHQLRRGIEKLRVRIEADEKKQLHIAEKLKERERENDSLKDKVENLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GEFALRLSSTQEEVHQLRRGIEKLRVRIEADEKKQLHIAEKLKERERENDSLKDKVENLE 2110 2120 2130 2140 2150 2160 2170 2180 2190 2200 2210 2220 pF1KE9 RELQMSEENQELVILDAENSKAEVETLKTQIEEMARSLKVFELDLVTLRSEKENLTKQIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RELQMSEENQELVILDAENSKAEVETLKTQIEEMARSLKVFELDLVTLRSEKENLTKQIQ 2170 2180 2190 2200 2210 2220 2230 2240 2250 2260 2270 2280 pF1KE9 EKQGQLSELDKLLSSFKSLLEEKEQAEIQIKEESKTAVEMLQNQLKELNEAVAALCGDQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 EKQGQLSELDKLLSSFKSLLEEKEQAEIQIKEESKTAVEMLQNQLKELNEAVAALCGDQE 2230 2240 2250 2260 2270 2280 2290 2300 2310 2320 2330 2340 pF1KE9 IMKATEQSLDPPIEEEHQLRNSIEKLRARLEADEKKQLCVLQQLKESEHHADLLKGRVEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 IMKATEQSLDPPIEEEHQLRNSIEKLRARLEADEKKQLCVLQQLKESEHHADLLKGRVEN 2290 2300 2310 2320 2330 2340 2350 2360 2370 2380 2390 2400 pF1KE9 LERELEIARTNQEHAALEAENSKGEVETLKAKIEGMTQSLRGLELDVVTIRSEKENLTNE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LERELEIARTNQEHAALEAENSKGEVETLKAKIEGMTQSLRGLELDVVTIRSEKENLTNE 2350 2360 2370 2380 2390 2400 2410 2420 2430 2440 2450 2460 pF1KE9 LQKEQERISELEIINSSFENILQEKEQEKVQMKEKSSTAMEMLQTQLKELNERVAALHND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LQKEQERISELEIINSSFENILQEKEQEKVQMKEKSSTAMEMLQTQLKELNERVAALHND 2410 2420 2430 2440 2450 2460 2470 2480 2490 2500 2510 2520 pF1KE9 QEACKAKEQNLSSQVECLELEKAQLLQGLDEAKNNYIVLQSSVNGLIQEVEDGKQKLEKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 QEACKAKEQNLSSQVECLELEKAQLLQGLDEAKNNYIVLQSSVNGLIQEVEDGKQKLEKK 2470 2480 2490 2500 2510 2520 2530 2540 2550 2560 2570 2580 pF1KE9 DEEISRLKNQIQDQEQLVSKLSQVEGEHQLWKEQNLELRNLTVELEQKIQVLQSKNASLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 DEEISRLKNQIQDQEQLVSKLSQVEGEHQLWKEQNLELRNLTVELEQKIQVLQSKNASLQ 2530 2540 2550 2560 2570 2580 2590 2600 2610 2620 2630 2640 pF1KE9 DTLEVLQSSYKNLENELELTKMDKMSFVEKVNKMTAKETELQREMHEMAQKTAELQEELS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 DTLEVLQSSYKNLENELELTKMDKMSFVEKVNKMTAKETELQREMHEMAQKTAELQEELS 2590 2600 2610 2620 2630 2640 2650 2660 2670 2680 2690 2700 pF1KE9 GEKNRLAGELQLLLEEIKSSKDQLKELTLENSELKKSLDCMHKDQVEKEGKVREEIAEYQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GEKNRLAGELQLLLEEIKSSKDQLKELTLENSELKKSLDCMHKDQVEKEGKVREEIAEYQ 2650 2660 2670 2680 2690 2700 2710 2720 2730 2740 2750 2760 pF1KE9 LRLHEAEKKHQALLLDTNKQYEVEIQTYREKLTSKEECLSSQKLEIDLLKSSKEELNNSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LRLHEAEKKHQALLLDTNKQYEVEIQTYREKLTSKEECLSSQKLEIDLLKSSKEELNNSL 2710 2720 2730 2740 2750 2760 2770 2780 2790 2800 2810 2820 pF1KE9 KATTQILEELKKTKMDNLKYVNQLKKENERAQGKMKLLIKSCKQLEEEKEILQKELSQLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 KATTQILEELKKTKMDNLKYVNQLKKENERAQGKMKLLIKSCKQLEEEKEILQKELSQLQ 2770 2780 2790 2800 2810 2820 2830 2840 2850 2860 2870 2880 pF1KE9 AAQEKQKTGTVMDTKVDELTTEIKELKETLEEKTKEADEYLDKYCSLLISHEKLEKAKEM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 AAQEKQKTGTVMDTKVDELTTEIKELKETLEEKTKEADEYLDKYCSLLISHEKLEKAKEM 2830 2840 2850 2860 2870 2880 2890 2900 2910 2920 2930 2940 pF1KE9 LETQVAHLCSQQSKQDSRGSPLLGPVVPGPSPIPSVTEKRLSSGQNKASGKRQRSSGIWE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LETQVAHLCSQQSKQDSRGSPLLGPVVPGPSPIPSVTEKRLSSGQNKASGKRQRSSGIWE 2890 2900 2910 2920 2930 2940 2950 2960 2970 2980 2990 3000 pF1KE9 NGRGPTPATPESFSKKSKKAVMSGIHPAEDTEGTEFEPEGLPEVVKKGFADIPTGKTSPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 NGRGPTPATPESFSKKSKKAVMSGIHPAEDTEGTEFEPEGLPEVVKKGFADIPTGKTSPY 2950 2960 2970 2980 2990 3000 3010 3020 3030 3040 3050 3060 pF1KE9 ILRRTTMATRTSPRLAAQKLALSPLSLGKENLAESSKPTAGGSRSQKVKVAQRSPVDSGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ILRRTTMATRTSPRLAAQKLALSPLSLGKENLAESSKPTAGGSRSQKVKVAQRSPVDSGT 3010 3020 3030 3040 3050 3060 3070 3080 3090 3100 3110 pF1KE9 ILREPTTKSVPVNNLPERSPTDSPREGLRVKRGRLVPSPKAGLESNGSENCKVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ILREPTTKSVPVNNLPERSPTDSPREGLRVKRGRLVPSPKAGLESNGSENCKVQ 3070 3080 3090 3100 3110 >>CCDS74989.1 GOLGB1 gene_id:2804|Hs108|chr3 (3184 aa) initn: 205 init1: 106 opt: 969 Z-score: 426.9 bits: 93.8 E(32554): 1.8e-17 Smith-Waterman score: 1294; 22.1% identity (56.1% similar) in 3013 aa overlap (18-2857:13-2791) 10 20 30 40 50 60 pF1KE9 MSWALEEWKEGLPTRALQKIQELEGQLDKLKKEKQQRQFQLDSLEAALQKQKQKVENEKT ... : . .:: .:.. ::.. . :::.... ..: : CCDS74 MEFNNTTQEDVQERLAYAEQLVVELKDIIRQKDVQLQQKDEALQEERKAADN-KI 10 20 30 40 50 70 80 90 100 110 120 pF1KE9 EGTNLKRENQRLMEICESLEKTKQKISHELQVKESQVNFQEGQLNSGKKQIEKLEQELKR . .:. . .: . . .:. : . . : . : : .: ::.. :. . :.:... CCDS74 KKLKLHAKA-KLTSLNKYIEEMKAQGGTVLPT-EPQ---SEEQLSKHDKSSTEEEMEIEK 60 70 80 90 100 130 140 150 160 170 pF1KE9 CKSELERSQQAAQSADVSLNPCNTPQKIFTTPLTPSQYYSGSKYED---LKEKYNKEVEE : .:..... .. ...:. .. : :.: :....:. .:.. ... : CCDS74 IKHKLQEKEELISTLQAQLTQAQAEQ--------PAQ--SSTEMEEFVMMKQQLQEKEEF 110 120 130 140 150 180 190 200 210 220 pF1KE9 RKRLEAEVKALQAKKASQTLPQATMNHRDIARHQAS----SSVFSW-QQEKTPSH----- . :.:... ::..:.: : . .: . .:. : ..: . ::: : .. CCDS74 ISTLQAQLSQTQAEQAAQKL---RVLQRKLEEHEESLVGRAQVVDLLQQELTAAEQRNQI 160 170 180 190 200 210 230 240 250 260 270 280 pF1KE9 LSSNSQRTPIRRDFSASYFSGEQE---VTPSRSTLQIGKRDANSSFFD-NSSSPHLLDQL ::.. :. ... . :.: . . :....: :: . . :::.:. CCDS74 LSQQLQQMEAEHNTLRNTVETEREESKILLEKMELEVAERKL--SFHNLQEEMHHLLEQF 220 230 240 250 260 270 290 300 310 320 330 340 pF1KE9 KAQNQ---ELRNKINELELRLQGHEKEMKGQVNKFQELQLQLEKAKVELIEKEKVLNKCR . .: ::... . :: . ... .: ... ..:. .:..: : .... : . . CCDS74 EQAGQAQAELESRYSALEQKHKAEMEEKTSHILSLQKTGQELQSACDALKDQNSKLLQDK 280 290 300 310 320 330 350 360 370 380 390 pF1KE9 DELVRTTAQYDQASTKYTALEQKLKKLTEDLSCQ--RQNAESARCSLEQKIKEKEKEFQE .: . .:: : :.:: :.... :. .:. ... :. . .: . : CCDS74 NEQAVQSAQTIQQLEDQ--LQQKSKEISQFLNRLPLQQHETASQTSFPDVYNEGTQAVTE 340 350 360 370 380 390 400 410 420 430 440 pF1KE9 E--LSRQQRSFQTLDQECIQMKARLTQELQQAKNMH-----NVLQA-----ELDKLTS-- : : :.: . ... . . . : .:.: . ..:.: : :. .: CCDS74 ENIASLQKRVVELENEKGALLLSSIELEELKAENEKLSSQITLLEAQNRTGEADREVSEI 400 410 420 430 440 450 450 460 470 480 490 pF1KE9 ----VKQQLENNLEEFKQKLCRAEQAFQASQIKENELRRSMEEMKKENNLLKSHSE-QKA . .. .. :: : . :..:. .. . . : :.: ..: .:: . . ..: CCDS74 SIVDIANKRSSSAEESGQDV--LENTFSQKHKELSVLLLEMKEAQEEIAFLKLQLQGKRA 460 470 480 490 500 510 500 510 520 530 540 pF1KE9 REVCHLEAELKNIKQCLNQSQNFAE-EMKA--KNTSQ--------ETMLRDLQ-EKINQQ .:. : . :..:: .....: .::. ..:.: :. : .. :. . . CCDS74 EEADHEVLDQKEMKQM--EGEGIAPIKMKVFLEDTGQDFPLMPNEESSLPAVEKEQASTE 520 530 540 550 560 550 560 570 580 590 pF1KE9 ENSLTLEKLKLAVADLE----KQR------------DCSQDLLKKREHHIEQLNDKLSKT ..: : :...: : .: :: .: :: :.. . .: .:. .. :. CCDS74 HQSRTSEEISLNDAGVELKSTKQDGDKSLSAVPDIGQCHQDELERLKSQILELELNFHKA 570 580 590 600 610 620 600 610 620 630 640 pF1KE9 EK--ESKALLSALELKK--KEYEELKEE----KTLFSCWKSENEKLLTQME--SEKENLQ .. :.. .: :... . ::.:.. .. :. . : ..::.:.. : .:. CCDS74 QEIYEKNLDEKAKEISNLNQLIEEFKKNADNNSSAFTALSEERDQLLSQVKELSMVTELR 630 640 650 660 670 680 650 660 670 680 690 pF1KE9 SKINHLETCL-----------KTQQIKSHEYNERVRTLEMDRENLSVEIRNLHNVLDSKS .....:: : ..: ... .:....: .. .. .:.:. :.: ::. . CCDS74 AQVKQLEMNLAEAERQRRLDYESQTAHDNLLTEQIHSLSIEAKSKDVKIEVLQNELDDVQ 690 700 710 720 730 740 700 710 720 730 740 750 pF1KE9 VEVETQKLAYMELQQKAEFSDQKHQKEIENMCLKTSQLTGQVEDLEHKLQLLSNEIMDKD .. :. ::.. :....:. . .. .....::.: . :. :: : CCDS74 LQFSEQSTLIRSLQSQL----QNKESEVLEGAERVRHISSKVEELSQALSQKELEITKMD 750 760 770 780 790 800 760 770 780 790 800 pF1KE9 RCYQDLHAEYESLRDLLKSKDASLVT-NEDHQRSLLAFDQQPAMHHSFANIIGEQGSMPS . . . . :.:.. .. :: ... . . .... .... . . :: .. : CCDS74 QLLLEKKRDVETLQQTIEEKDQQVTEISFSMTEKMVQLNEEKFSLGVEIKTLKEQLNLLS 810 820 830 840 850 860 810 820 830 840 850 860 pF1KE9 ERSECRLE-ADQSPKNSAILQNRVDSLEFSLESQKQMNSDLQKQCEELVQIKGEIEENLM . : . : .... . :. :.. : . . . .:. .::.. . :.. ..: .. . CCDS74 RAEEAKKEQVEEDNEVSSGLKQNYDEMSPAGQISKE---ELQHEFD-LLKKENEQRKRKL 870 880 890 900 910 920 870 880 890 900 910 920 pF1KE9 KAEQMHQSFVAETSQRISKLQEDTSAHQNVVAETLSALENKEKELQLLNDKVETEQAEIQ .: .... : ::.:.:.:. . .. :.: ::. : :::..:.. CCDS74 QAALINRK---ELLQRVSRLEEELANLKD---------ESK-KEIPL----SETERGEVE 930 940 950 960 930 940 950 960 970 980 pF1KE9 ELKKSNHLLEDSL----KELQL-LSETLSLEKKEMSSIISLNKREIEE-LTQENGTLKEI : :.... : . .:... :..:.: .. :.. : ....:: :. : ... CCDS74 EDKENKEYSEKCVTSKCQEIEIYLKQTISEKEVELQHI----RKDLEEKLAAE----EQF 970 980 990 1000 1010 990 1000 1010 1020 1030 1040 pF1KE9 NASLNQEKMNLIQKSESFANYIDEREKSISELSDQYKQEKLILLQRCEETGNAYEDLSQK .: ..: ...: .:. : :: . ::: .: .::: :.:. : :. CCDS74 QALVKQMNQTLQDKT----NQIDLLQAEISE--NQAIIQKLI-------TSNT--DASDG 1020 1030 1040 1050 1060 1050 1060 1070 1080 1090 1100 pF1KE9 YKAAQEKNSKLECLLNECTSLCENRKNELEQLKEAFAKEHQEFLTKLAFAEERNQNLMLE ..: :.. . . ::. :. : :::. :. ::.... :: : . .. . CCDS74 DSVALVKETVV--ISPPCTGSSEHWKPELEEKILALEKEKEQLQKKLQEALTSRKAILKK 1070 1080 1090 1100 1110 1110 1120 1130 1140 1150 pF1KE9 LETVQQALRSEMT---DNQNNSKSEAGGLKQEIMTLKEEQNKMQKEVNDLLQENEQLMKV . .. :: :. :. : . . ..: .. .. ..: .: . .. . CCDS74 AQEKERHLREELKQQKDDYNRLQEQFDEQSKENENIGDQLRQLQIQVRESIDGKLPSTDQ 1120 1130 1140 1150 1160 1170 1160 1170 1180 1190 1200 1210 pF1KE9 MKTKHECQNLESEPIRNSVKERESERN-QCNFKPQMDLEVKEISLDSYNAQLVQLEAMLR ... .:: ::. ......... . :. :. . .. : . .....:..:.: CCDS74 QESCSSTPGLE-EPLFKATEQHHTQPVLESNLCPDWPSHSEDASALQGGTSVAQIKAQL- 1180 1190 1200 1210 1220 1230 1220 1230 1240 1250 1260 1270 pF1KE9 NKELKLQESEKEKECLQHELQTIRGDLETSNLQDM---QSQEISGLKDCEIDAEEKYISG ::.. .. : : . . . . . :. .::.. :. :: .:: .:: . : CCDS74 -KEIEAEKVELELKVSSTTSELTKKSEEVFQLQEQINKQGLEIESLKTVSHEAEVHAESL 1240 1250 1260 1270 1280 1290 1280 1290 1300 1310 1320 1330 pF1KE9 PHELSTSQNDNAHLQCSLQTTMNKLNELEKICEILQAEKYELVTELNDSRSECITATRKM ..: .:: . : :. :. . ::.::.: : ..: : :. :. . :: .: :. CCDS74 QQKLESSQLQIAGLE-HLRELQPKLDELQK----LISKKEEDVSYLSGQLSEKEAALTKI 1300 1310 1320 1330 1340 1350 1340 1350 1360 1370 1380 1390 pF1KE9 AEEVGKLLNEVKILNDDSGLLHGELVEDIPGGEFGEQPNEQHPVSLAPLDESNSYEHLTL :. . . .: :. . . : : : . .:.: .. .:: . ... CCDS74 QTEIIEQEDLIKALHTQLEMQAKEHDERIKQLQVELCEMKQKPEEIG--EESRAKQQIQR 1360 1370 1380 1390 1400 1400 1410 1420 1430 1440 1450 pF1KE9 SDKEVQMHFAELQEKFLSLQSEHKILHDQHCQMSSKMSELQTYVDSL-KAENLVLS--TN . . . . : .. ::: : .. . ........... :.. : .. ::. . CCDS74 KLQAALISRKEALKENKSLQEELSLARGTIERLTKSLADVESQVSAQNKEKDTVLGRLAL 1410 1420 1430 1440 1450 1460 1460 1470 1480 1490 1500 1510 pF1KE9 LRNFQGDLVKEMQLGLEEGLVPSLSSSCVPDSSSLSSLGDSSFYRALLEQTGDMSLLSNL :.. . :. ::. .: :. :::::: .: .:. : . . :... . .: CCDS74 LQEERDKLITEMDRSLLEN--QSLSSSC--ESLKLALEGLTEDKEKLVKE------IESL 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 1570 pF1KE9 EGTVSANQCSVDEVFCSSLQEENLTRKETPSAPAKGVEELESLCEVYRQSLEKLEEKMES ... :.. .: . ::.: .. .. .:... . :. :: ::.: CCDS74 KSSKIAESTEWQEKH-KELQKEYEILLQSYENVSNEAERIQHVVEAVRQ------EKQEL 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 1630 pF1KE9 QGIMKNKEI--QELEQLLSSERQELDCLRKQYLSENEQWQQKLTSVTLEMESKLAAEKKQ : ... : .: :. :. .::.. ..... . .. :::. . : ...: :: . CCDS74 YGKLRSTEANKKETEKQLQEAEQEMEEMKEKMRKFAKSKQQKILELE-EENDRLRAEVHP 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 1690 pF1KE9 TEQLSLELEVARLQLQGLDLSSRSLLGIDTEDAIQGRNESCDISKEHTSETTERTPKHDV . ..:. .. : ::: . . . : . . : .::. : .:. CCDS74 AG------DTAKECMETL-LSSNASMKEELERV---KMEYETLSKKFQSLMSEKDSL--- 1640 1650 1660 1670 1700 1710 1720 1730 1740 1750 pF1KE9 HQICDKDAQQDLNLDIEKITETGAVKPTGECSGEQSPDTNYEPPGEDKTQGSSECISELS .. :::. .:: :. : ..: : . .: ..... : . CCDS74 -----SEEVQDLKHQIE---------------GNVSKQANLE--ATEKHDNQTNVTEEGT 1680 1690 1700 1710 1760 1770 1780 1790 1800 1810 pF1KE9 FSGPNALVPMDFLGNQEDIHNLQLRVKETSNENLRLLHVIEDRDRKVESLLNEMKELDSK : : :. :. .:.. .. : .:. . .. . : . .. :... CCDS74 QSIP---------GETEEQDSLSMSTRPTCSES---VPSAKSANPAVSKDFSSHDEINN- 1720 1730 1740 1750 1760 1820 1830 1840 1850 1860 pF1KE9 LHLQEVQLMTKIEACIELEKIVG--ELKKENSDLSEKLEYFSCDHQELLQRVETSEGLNS .::... . :.:.: : :..:...:. :: ... ::... :..: CCDS74 -YLQQIDQLK--------ERIAGLEEEKQKNKEFSQTLEN---EKNTLLSQISTKDG--- 1770 1780 1790 1800 1870 1880 1890 1900 1910 1920 pF1KE9 DLEMHADKSSREDIGDNVAKVNDSWKERFLDVENELSRIRSEKASIEHEALYLEADLEVV .:.: . ..:.:.: .. ...::::. . : . :.: . ::: CCDS74 ELKM---------LQEEVTKMNLLNQQ----IQEELSRVTKLKETAEEE----KDDLE-- 1810 1820 1830 1840 1930 1940 1950 1960 1970 1980 pF1KE9 QTEKLCLEKDNENKQKVIVCLEEELSVVTSERNQLRGELDTMSKKTTALDQLSEKM-KEK :.: . . : . : . . . .: :..:. ...: .. :.. .... ::: CCDS74 --ERLMNQLAELNGSIGNYCQDVTDAQIKNE--LLESEMKNLKKCVSELEEEKQQLVKEK 1850 1860 1870 1880 1890 1900 1990 2000 2010 2020 2030 2040 pF1KE9 TQELESH-QSECLHCIQVAEAE------VKEKTELLQTLSSDVSELLKDKTHLQEKLQSL :. .::. ..: :. :: :. : .:: :::. ...:..: :: . :::...: CCDS74 TK-VESEIRKEYLEKIQGAQKEPGNKSHAKELQELLKEKQQEVKQLQKDCIRYQEKISAL 1910 1920 1930 1940 1950 1960 2050 2060 2070 2080 2090 2100 pF1KE9 EKDSQALSLTKCELENQIAQLNKEKELLVKESESLQARLSESDYEKLNVSKALEAALVEK :. .:: ... : .... ... :.. .. ::.:. ... : . ::: : CCDS74 ERTVKALEFVQTESQKDLEITKENLAQAVEHRKKAQAELA--SFKVLLDDTQSEAARVLA 1970 1980 1990 2000 2010 2020 2110 2120 2130 2140 2150 pF1KE9 GEFALR--LSSTQEEVH-QLRRGIEKLRVRIEADEKKQLHIAEKLKERERENDSLKDKVE .. :. :.:..: :. :... : :. :.: :.:.: .:..: ...:.. CCDS74 DNLKLKKELQSNKESVKSQMKQKDEDLERRLEQAEEKHL--------KEKKN--MQEKLD 2030 2040 2050 2060 2070 2160 2170 2180 2190 2200 2210 pF1KE9 NLERELQMSEENQELVILDAENSKAEVETLKTQIEEMARSLKVFELDLVTLRSEKENLTK :.:: ::. . . ... ::. :. ... . .: .: .. .:..... . CCDS74 ALRREKVHLEETIGEIQVTLNKKDKEVQQLQENLDSTVTQLAAFTKSMSSLQDDRDRV-- 2080 2090 2100 2110 2120 2220 2230 2240 2250 2260 2270 pF1KE9 QIQEKQGQLSELDKLLSSFKSLLEEKEQAEIQIKEES----KTAVEMLQNQLKELNEAVA ..: : .:.. .. ::. ::..::.. : ..... ...::. .. CCDS74 --------IDEAKKWERKFSDAIQSKEE-EIRLKEDNCSVLKDQLRQMSIHMEELKINIS 2130 2140 2150 2160 2170 2180 2280 2290 2300 2310 pF1KE9 ALCGDQEIMKATEQS------------------LDPPIEEEHQLRNSIEKLRARLEADEK : :..: .. :. : .:: ..: .: .. :.::.. : CCDS74 RLEHDKQIWESKAQTEVQLQQKVCDTLQGENKELLSQLEETRHLYHSSQNELAKLESELK 2190 2200 2210 2220 2230 2240 2320 2330 2340 2350 2360 2370 pF1KE9 KQLCVLQQLKESEHHADLLKGRVENLERELEIARTNQEHAALEAENSKGEVETLKAKIEG . : .:..: .. :: .:.. :. : :.. . . :.. . : .... CCDS74 SLKDQLTDLSNSLEKCKEQKGNLEGIIRQQEADIQNSKFSYEQLETDLQASRELTSRLH- 2250 2260 2270 2280 2290 2380 2390 2400 2410 2420 pF1KE9 MTQSLRGLELDVVTIRSEKENLTN----ELQKEQER-ISELEIINSSFE--NILQEKEQE . . : .... : ::. . ::...... :.::: . :. : ::. :.:.. CCDS74 --EEINMKEQKIISLLSGKEEAIQVAIAELRQQHDKEIKELENLLSQEEEENIVLEEENK 2300 2310 2320 2330 2340 2350 2430 2440 2450 2460 2470 pF1KE9 KVQMKEKSSTAMEMLQT----------QLKELNERVAALHNDQEACKAKEQNLSSQVECL :. .:.. :: :.: :: . . ...:.::.. . :.: . . CCDS74 KA--VDKTNQLMETLKTIKKENIQQKAQLDSFVKSMSSLQNDRDRIVGDYQQLEERHLSI 2360 2370 2380 2390 2400 2410 2480 2490 2500 2510 2520 2530 pF1KE9 ELEKAQLLQGLDEAKNNYIVLQSSVNGLIQEVEDGKQKLEKKDEEISRLKNQIQDQEQLV ::: ::.: :.:: :. . :: ....: ... : : :. . . .: .:.. CCDS74 ILEKDQLIQEA-AAENNK--LKEEIRGLRSHMDDLNSENAKLDAELIQYR---EDLNQVI 2420 2430 2440 2450 2460 2540 2550 2560 2570 2580 2590 pF1KE9 S-KLSQVEGEHQLWKEQNLELRNLTVELEQKIQVLQSKNASLQDTLEVLQSSYKNLENEL . : :: . .. .:: ::.: ..::.:.. . : .:. ....:: ..: .:. CCDS74 TIKDSQQKQLLEVQLQQNKELENKYAKLEEKLKESEEANEDLRRSFNALQEEKQDLSKEI 2470 2480 2490 2500 2510 2520 2600 2610 2620 2630 2640 2650 pF1KE9 ELTKMDKMSFVEKVNKMTAKETE--LQREMHEMAQKTAELQEELSGEKNRLAGELQLLLE : :.. .....:. . . : . ... ... .:. .:. ..:.: .: : CCDS74 ESLKVSISQLTRQVTALQEEGTLGLYHAQLKVKEEEVHRLSALFSSSQKRIA---ELEEE 2530 2540 2550 2560 2570 2580 2660 2670 2680 2690 2700 2710 pF1KE9 EIKSSKDQLKELTLENSELKKSLDCMHKDQ--VEKEGKVREE-IAEYQLRLHEAEKKHQA . .:. :.. ...::: : .:.: ...: .. :: .:: : : :.: CCDS74 LVCVQKEAAKKVGEIEDKLKKELKHLHHDAGIMRNETETAEERVAELARDLVEMEQK-LL 2590 2600 2610 2620 2630 2640 2720 2730 2740 2750 2760 2770 pF1KE9 LLLDTNKQYEVEIQTYREKLTSKEECLSSQKLEIDLLKSSKEELNNSLKATTQILEE-LK .. :: ..::.. ....: .. . . :.: :: .. . ::: .:. :. : CCDS74 MVTKENKGLTAQIQSFGRSMSSLQNSRDHANEELDELK---RKYDASLKELAQLKEQGLL 2650 2660 2670 2680 2690 2700 2780 2790 2800 2810 2820 pF1KE9 KTKMDNLKYVNQLKKENERAQGKMKLLIKSCKQLEEEKEILQKELSQLQAA----QEKQK . . : : . .. : ..... : : .:: . : : . :::. . : .: CCDS74 NRERDALLSETAFSM-NSTEENSLSHLEKLNQQLLSKDEQLLHLSSQLEDSYNQVQSFSK 2710 2720 2730 2740 2750 2760 2830 2840 2850 2860 2870 2880 pF1KE9 TGTVMDTKVDELTTEIKELKETLEEKTKEADEYLDKYCSLLISHEKLEKAKEMLETQVAH . . .... :.: .:....... : : . : CCDS74 AMASLQNERDHLWNELEKFRKSEEGKQRSAAQPSTSPAEVQSLKKAMSSLQNDRDRLLKE 2770 2780 2790 2800 2810 2820 >>CCDS3004.1 GOLGB1 gene_id:2804|Hs108|chr3 (3259 aa) initn: 205 init1: 106 opt: 948 Z-score: 417.9 bits: 92.2 E(32554): 5.9e-17 Smith-Waterman score: 1289; 22.4% identity (56.2% similar) in 3038 aa overlap (18-2857:52-2866) 10 20 30 40 pF1KE9 MSWALEEWKEGLPTRALQKIQELEGQLDKLKKEKQQRQFQLDSLEAA ... : . .:: .:.. ::.. . : CCDS30 TDQNMRAPLDPELHQESDMEFNNTTQEDVQERLAYAEQLVVELKDIIRQKDVQLQQKDEA 30 40 50 60 70 80 50 60 70 80 90 100 pF1KE9 LQKQKQKVENEKTEGTNLKRENQRLMEICESLEKTKQKISHELQVKESQVNFQEGQLNSG ::.... ..: : . .:. . .: . . .:. : . . : . : : .: ::.. CCDS30 LQEERKAADN-KIKKLKLHAKA-KLTSLNKYIEEMKAQGGTVLPT-EPQ---SEEQLSKH 90 100 110 120 130 110 120 130 140 150 160 pF1KE9 KKQIEKLEQELKRCKSELERSQQAAQSADVSLNPCNTPQKIFTTPLTPSQYYSGSKYED- :. . :.:... : .:..... .. ...:. .. : :.: :....:. CCDS30 DKSSTEEEMEIEKIKHKLQEKEELISTLQAQLTQAQAEQ--------PAQ--SSTEMEEF 140 150 160 170 180 170 180 190 200 210 220 pF1KE9 --LKEKYNKEVEERKRLEAEVKALQAKKASQTLPQATMNHRDIARHQASSSVFSWQQEKT .:.. ... : . :.:... ::..:.: . . ..: :: ... . . . CCDS30 VMMKQQLQEKEEFISTLQAQLSQTQAEQAAQQV----VREKD-ARFETQVRLHEDELLQL 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE9 PSHLSSNSQRTPIRRDFSASYFSGEQEVTPSRSTLQIGKRDANSSFFDNSSSPHLLDQLK .. . ... : .. . :. .. ..... ... ... :. . :.:.. CCDS30 VTQADVETEMQQKLRVLQRKLEEHEESLVGRAQVVDLLQQELTAAEQRNQILSQQLQQME 250 260 270 280 290 300 290 300 310 320 330 340 pF1KE9 AQNQELRNKINELELRLQGHEKEMKGQVNKFQELQLQLEKAKVELIEKEKVLNKCRDELV :... ::: .. :.: : .. ::: ..:. :.. ... ..:. CCDS30 AEHNTLRNTVET--------ERE---------ESKILLEKMELEVAERKLSFHNLQEEMH 310 320 330 340 350 360 370 380 390 400 pF1KE9 RTTAQYDQASTKYTALEQKLKKLTEDLSCQRQNAESARCSLEQKIKEKEKEFQEELSRQQ . :..::. . ::.. . .:::: : . .: .. : CCDS30 HLLEQFEQAGQAQAELESRYS------------------ALEQKHKAEMEEKTSHILSLQ 350 360 370 380 410 420 430 440 450 460 pF1KE9 RSFQTLDQECIQMKARLTQELQQAKNMHNVLQAELDKLTSVKQQLENNLEEFKQKLCRA- .. : :.. : .: . ...: : :: . : .:. . ....::... .:..: : : CCDS30 KTGQELQSACDALKDQ-NSKLLQDKNEQAVQSAQT--IQQLEDQLQQKSKEISQFLNRLP 390 400 410 420 430 440 470 480 490 500 510 520 pF1KE9 -EQAFQASQIKENELRRSMEEMKKENNLLKSHSEQKAREVCHLEAELKNIKQCLNQSQNF .: ::: . .. . :.:. : :: : : ::.: : : :. CCDS30 LQQHETASQTSFPDVYNEGTQAVTEENI---ASLQK-RVV-----ELENEKGALLLSSIE 450 460 470 480 490 530 540 550 560 570 pF1KE9 AEEMKAKN---TSQETMLRDLQEKINQQENSLTLEKLKLAVADLEKQRDCSQDLLKKREH ::.::.: .:: :.: . :.. .. . .. .....:. ..:. : . : CCDS30 LEELKAENEKLSSQITLL-EAQNRTGEADREVS----EISIVDIANKRSSSAE-----ES 500 510 520 530 540 580 590 600 610 620 630 pF1KE9 HIEQLNDKLSKTEKESKALLSALELKKKEYEELKEEKTLFSCWKSE-------NEKLLTQ . :.. .:. .:: ..:: ::.:. . ::. : .. ..: ..: . : CCDS30 GQDVLENTFSQKHKELSVLL--LEMKEAQ-EEIAFLKLQLQGKRAEEADHEVLDQKEMKQ 550 560 570 580 590 600 640 650 660 670 680 pF1KE9 MESEK-ENLQSKINHLETCLKTQQIKSHEYNERVRTLEMDRENLSVE--IRNLHNV-LDS ::.: .. :. :: : : ::. ...:. :.: :. ... :.. CCDS30 MEGEGIAPIKMKV-FLED---TGQDFPLMPNEESSLPAVEKEQASTEHQSRTSEEISLND 610 620 630 640 650 690 700 710 720 730 740 pF1KE9 KSVEVETQKLAYMELQQKAEFSDQKHQKEIENMCLKTSQLTGQVEDLE---HKLQLLSNE .::... : . . . : :: :.: .: .:. .:: :: : . .. CCDS30 AGVELKSTKQDGDKSLSAVPDIGQCHQDELE-------RLKSQILELELNFHKAQEIYEK 660 670 680 690 700 750 760 770 780 pF1KE9 IMD-KDRCYQDLHAEYESL-----------------RDLLKS--KDASLVTNEDHQRSLL .: : . ..:. : . :: : : :. :.::. : . : CCDS30 NLDEKAKEISNLNQLIEEFKKNADNNSSAFTALSEERDQLLSQVKELSMVTELRAQVKQL 710 720 730 740 750 760 790 800 810 820 830 840 pF1KE9 AFDQQPAMHH---SFANIIGEQGSMPSERSECRLEADQSPKNSAILQNRVDS--LEFSLE .. : .. .. . .... . . .:: .. . .:::..:. :.:: . CCDS30 EMNLAEAERQRRLDYESQTAHDNLLTEQIHSLSIEAKSKDVKIEVLQNELDDVQLQFSEQ 770 780 790 800 810 820 850 860 870 880 890 pF1KE9 SQ--KQMNSDLQKQCEELVQIKGEIEENLMKAEQMHQSFVAETSQRISKLQEDTSAHQNV : ....:.::.. :... .... :.:.. :.. .. .:.:... .. CCDS30 STLIRSLQSQLQNKESEVLEGAERVRHISSKVEELSQAL-SQKELEITKMDQLLLEKKRD 830 840 850 860 870 880 900 910 920 930 940 950 pF1KE9 VAETLSALENKEKELQLLNDKVETEQAEIQELKKSNHLLEDSLKE-LQLLSETLSLEKK- : ...:.:.... .. .. ......: : : . .::: :.:::.. .:. CCDS30 VETLQQTIEEKDQQVTEISFSMTEKMVQLNEEKFSLGVEIKTLKEQLNLLSRAEEAKKEQ 890 900 910 920 930 940 960 970 980 990 1000 pF1KE9 -----EMSSIISLNKREI--------EELTQENGTLKEINASLNQE-KMNLIQKSESFAN :.:: .. : :. ::: .: ::. : . ... . ::...: . . CCDS30 VEEDNEVSSGLKQNYDEMSPAGQISKEELQHEFDLLKKENEQRKRKLQAALINRKE-LLQ 950 960 970 980 990 1000 1010 1020 1030 1040 1050 pF1KE9 YIDEREKSISELSDQYKQEKLILLQRCEETGNAYEDLSQKY---KAAQEKNSKLECLLNE ... :. ...:.:. :.: : :.. :. :.. :: .: : . : ...: :.. CCDS30 RVSRLEEELANLKDESKKE--IPLSETER-GEVEEDKENKEYSEKCVTSKCQEIEIYLKQ 1010 1020 1030 1040 1050 1060 1060 1070 1080 1090 1100 1110 pF1KE9 CTSLCENRKNELEQ-LKEAFAKEHQ-EFLTKL---AFAEERNQNLMLELETV--QQALRS : : . ..... :.: .: :.: . :.: .. .. :: .:. : : ... CCDS30 TISEKEVELQHIRKDLEEKLAAEEQFQALVKQMNQTLQDKTNQIDLLQAEISENQAIIQK 1070 1080 1090 1100 1110 1120 1120 1130 1140 1150 1160 1170 pF1KE9 EMTDNQNNSKSEAGGLKQEIMTLKEEQNKMQKEVNDLLQENEQLMKVMKTKHECQNLESE .:.: . : ... .: .: .... . ... . :. :... . : :.. :. .: CCDS30 LITSNTDASDGDSVALVKETVVISPPCTGSSEHWKPELE--EKILALEKEKEQLQKKLQE 1130 1140 1150 1160 1170 1180 1180 1190 1200 1210 1220 1230 pF1KE9 PI--RNSVKERESERNQCNFKPQMDLEVKEISLDSYNAQLVQLEAMLRNKELKLQESEKE . :... .. .:... .. :.:. . :.:: :.. . ...: .. .. .. CCDS30 ALTSRKAILKKAQEKER-----HLREELKQ-QKDDYNRLQEQFDEQSKENE-NIGDQLRQ 1190 1200 1210 1220 1230 1240 1250 1260 1270 1280 pF1KE9 KECLQHEL-QTIRGDLETSNLQDMQSQEISGLKDCEIDAEEKYISGP---HELSTSQNDN :: .. ..: : : ... :. :. ::.. . : :.. . : .: . .. CCDS30 ---LQIQVRESIDGKLPSTDQQESCSST-PGLEEPLFKATEQHHTQPVLESNLCPDWPSH 1240 1250 1260 1270 1280 1290 1290 1300 1310 1320 1330 1340 pF1KE9 AHLQCSLQTTMNKLNELEKICEILQAEKYELVTELNDSRSECITATR---KMAEEVGKLL .. .:: . . .. :: .::: :: ..... :: .. .. :...: CCDS30 SEDASALQGGTSVAQIKAQLKEI-EAEKVELELKVSSTTSELTKKSEEVFQLQEQINKQG 1300 1310 1320 1330 1340 1350 1350 1360 1370 1380 1390 pF1KE9 NEVKILNDDS--GLLHGELVED--------IPGGEFGE--QPN-EQHPVSLAPLDESNSY :.. :. : . .:.: ... : : : . ::. .. .. .:. :: CCDS30 LEIESLKTVSHEAEVHAESLQQKLESSQLQIAGLEHLRELQPKLDELQKLISKKEEDVSY 1360 1370 1380 1390 1400 1410 1400 1410 1420 1430 1440 pF1KE9 EHLTLSDKE-----VQMHFAELQEKFLSLQSEHKIL---HDQHC-QMSSKMSELQTYVDS ::.:: .: .. : .. . .:... .. ::.. :.. .. :.. . CCDS30 LSGQLSEKEAALTKIQTEIIEQEDLIKALHTQLEMQAKEHDERIKQLQVELCEMKQKPEE 1420 1430 1440 1450 1460 1470 1450 1460 1470 1480 1490 pF1KE9 LKAENLVLSTNLRNFQGDLV---------KEMQ--LGLEEGLVPSLSSSCVPDSSSLSSL . :. . . :..:. :. : .: :.: .: . :..: . :..:. CCDS30 IGEESRAKQQIQRKLQAALISRKEALKENKSLQEELSLARGTIERLTKSLADVESQVSAQ 1480 1490 1500 1510 1520 1530 1500 1510 1520 1530 1540 pF1KE9 G---DSSFYR-ALLEQTGDMSLLSNLEGTVSANQCSVDEVFCSSLQE--ENLTRKETPSA . :. . : :::.. : .:..... .. :: . : ::. :.::. . CCDS30 NKEKDTVLGRLALLQEERD-KLITEMDRSLLENQSLSSS--CESLKLALEGLTEDKE--- 1540 1550 1560 1570 1580 1550 1560 1570 1580 1590 1600 pF1KE9 PAKGVEELESLCEVYRQSLEKLEEKMESQGIMKNKEIQ-ELEQLLSS-ERQELDCLRKQY : :.:.::: ..: :. :. : : :.::.: : : ::.: : . : :. CCDS30 --KLVKEIESL----KSS--KIAESTEWQ--EKHKELQKEYEILLQSYENVSNEAERIQH 1590 1600 1610 1620 1630 1610 1620 1630 1640 1650 1660 pF1KE9 LSEN-EQWQQKLTSVTLEMESKLAAEKKQTEQLSLELEVARLQLQGLDLSSRS-LLGIDT . : .: .:.: . :.. .:: .. :.: . ... . :... .: .. CCDS30 VVEAVRQEKQELYGKLRSTEANKKETEKQLQEAEQEMEEMKEKMRKFAKSKQQKILELEE 1640 1650 1660 1670 1680 1690 1670 1680 1690 1700 1710 pF1KE9 E-DAIQGR-NESCDISKE--HTSETTERTPKHDVHQIC---DKDAQQDLNLDIEKITETG : : .... . . : .:: .: ... . :...... . ... .: :: . . CCDS30 ENDRLRAEVHPAGDTAKECMETLLSSNASMKEELERVKMEYETLSKKFQSLMSEKDSLSE 1700 1710 1720 1730 1740 1750 1720 1730 1740 1750 1760 1770 pF1KE9 AVKPTG-ECSGEQSPDTNYEPPGEDKTQGSSECISELSFSGPNALVPMDFLGNQEDIHNL :. . :. : ..: : . .: ..... : . : : :. :. .: CCDS30 EVQDLKHQIEGNVSKQANLE--ATEKHDNQTNVTEEGTQSIP---------GETEEQDSL 1760 1770 1780 1790 1800 1780 1790 1800 1810 1820 1830 pF1KE9 QLRVKETSNENLRLLHVIEDRDRKVESLLNEMKELDSKLHLQEVQLMTKIEACIELEKIV .. .. : .:. . .. . : . .. :... .::... . :.:. CCDS30 SMSTRPTCSES---VPSAKSANPAVSKDFSSHDEINN--YLQQIDQLK--------ERIA 1810 1820 1830 1840 1850 1840 1850 1860 1870 1880 1890 pF1KE9 G--ELKKENSDLSEKLEYFSCDHQELLQRVETSEGLNSDLEMHADKSSREDIGDNVAKVN : : :..:...:. :: ... ::... :..: .:.: . ..:.:.: CCDS30 GLEEEKQKNKEFSQTLEN---EKNTLLSQISTKDG---ELKM---------LQEEVTKMN 1860 1870 1880 1890 1900 1910 1920 1930 1940 1950 pF1KE9 DSWKERFLDVENELSRIRSEKASIEHEALYLEADLEVVQTEKLCLEKDNENKQKVIVCLE .. ...::::. . : . :.: . ::: :.: . . : . : . CCDS30 LLNQQ----IQEELSRVTKLKETAEEE----KDDLE----ERLMNQLAELNGSIGNYCQD 1900 1910 1920 1930 1940 1960 1970 1980 1990 2000 pF1KE9 EELSVVTSERNQLRGELDTMSKKTTALDQLSEKM-KEKTQELESH-QSECLHCIQVAEAE . . .: :..:. ...: .. :.. .... ::::. .::. ..: :. :: :. : CCDS30 VTDAQIKNE--LLESEMKNLKKCVSELEEEKQQLVKEKTK-VESEIRKEYLEKIQGAQKE 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 2050 2060 pF1KE9 ------VKEKTELLQTLSSDVSELLKDKTHLQEKLQSLEKDSQALSLTKCELENQIAQLN .:: :::. ...:..: :: . :::...::. .:: ... : .... . CCDS30 PGNKSHAKELQELLKEKQQEVKQLQKDCIRYQEKISALERTVKALEFVQTESQKDLEITK 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 2110 pF1KE9 KEKELLVKESESLQARLSESDYEKLNVSKALEAALVEKGEFALR--LSSTQEEVH-QLRR .. :.. .. ::.:. ... : . ::: : .. :. :.:..: :. :... CCDS30 ENLAQAVEHRKKAQAELA--SFKVLLDDTQSEAARVLADNLKLKKELQSNKESVKSQMKQ 2070 2080 2090 2100 2110 2120 2130 2140 2150 2160 2170 pF1KE9 GIEKLRVRIEADEKKQLHIAEKLKERERENDSLKDKVENLERELQMSEENQELVILDAEN : :. :.: :.:.: .:..: ...:.. :.:: ::. . . .. CCDS30 KDEDLERRLEQAEEKHL--------KEKKN--MQEKLDALRREKVHLEETIGEIQVTLNK 2120 2130 2140 2150 2160 2180 2190 2200 2210 2220 2230 pF1KE9 SKAEVETLKTQIEEMARSLKVFELDLVTLRSEKENLTKQIQEKQGQLSELDKLLSSFKSL . ::. :. ... . .: .: .. .:..... . ..: : .:.. CCDS30 KDKEVQQLQENLDSTVTQLAAFTKSMSSLQDDRDRV----------IDEAKKWERKFSDA 2170 2180 2190 2200 2210 2240 2250 2260 2270 2280 pF1KE9 LEEKEQAEIQIKEES----KTAVEMLQNQLKELNEAVAALCGDQEIMKATEQS------- .. ::. ::..::.. : ..... ...::. .. : :..: .. :. CCDS30 IQSKEE-EIRLKEDNCSVLKDQLRQMSIHMEELKINISRLEHDKQIWESKAQTEVQLQQK 2220 2230 2240 2250 2260 2270 2290 2300 2310 2320 2330 pF1KE9 -----------LDPPIEEEHQLRNSIEKLRARLEADEKKQLCVLQQLKESEHHADLLKGR : .:: ..: .: .. :.::.. :. : .:..: .. :: CCDS30 VCDTLQGENKELLSQLEETRHLYHSSQNELAKLESELKSLKDQLTDLSNSLEKCKEQKGN 2280 2290 2300 2310 2320 2330 2340 2350 2360 2370 2380 2390 pF1KE9 VENLERELEIARTNQEHAALEAENSKGEVETLKAKIEGMTQSLRGLELDVVTIRSEKENL .:.. :. : :.. . . :.. . : .... . . : .... : ::. CCDS30 LEGIIRQQEADIQNSKFSYEQLETDLQASRELTSRLH---EEINMKEQKIISLLSGKEEA 2340 2350 2360 2370 2380 2390 2400 2410 2420 2430 2440 pF1KE9 TN----ELQKEQER-ISELEIINSSFE--NILQEKEQEKVQMKEKSSTAMEMLQT----- . ::...... :.::: . :. : ::. :.:..:. .:.. :: :.: CCDS30 IQVAIAELRQQHDKEIKELENLLSQEEEENIVLEEENKKA--VDKTNQLMETLKTIKKEN 2400 2410 2420 2430 2440 2450 2450 2460 2470 2480 2490 2500 pF1KE9 -----QLKELNERVAALHNDQEACKAKEQNLSSQVECLELEKAQLLQGLDEAKNNYIVLQ :: . . ...:.::.. . :.: . . ::: ::.: :.:: :. CCDS30 IQQKAQLDSFVKSMSSLQNDRDRIVGDYQQLEERHLSIILEKDQLIQEA-AAENNK--LK 2460 2470 2480 2490 2500 2510 2520 2530 2540 2550 pF1KE9 SSVNGLIQEVEDGKQKLEKKDEEISRLKNQIQDQEQLVS-KLSQVEGEHQLWKEQNLELR . :: ....: ... : : :. . . .: .:... : :: . .. .:: ::. CCDS30 EEIRGLRSHMDDLNSENAKLDAELIQYR---EDLNQVITIKDSQQKQLLEVQLQQNKELE 2510 2520 2530 2540 2550 2560 2560 2570 2580 2590 2600 2610 pF1KE9 NLTVELEQKIQVLQSKNASLQDTLEVLQSSYKNLENELELTKMDKMSFVEKVNKMTAKET : ..::.:.. . : .:. ....:: ..: .:.: :.. .....:. . . : CCDS30 NKYAKLEEKLKESEEANEDLRRSFNALQEEKQDLSKEIESLKVSISQLTRQVTALQEEGT 2570 2580 2590 2600 2610 2620 2620 2630 2640 2650 2660 2670 pF1KE9 E--LQREMHEMAQKTAELQEELSGEKNRLAGELQLLLEEIKSSKDQLKELTLENSELKKS . ... ... .:. .:. ..:.: .: : . .:. :.. ...::: CCDS30 LGLYHAQLKVKEEEVHRLSALFSSSQKRIA---ELEEELVCVQKEAAKKVGEIEDKLKKE 2630 2640 2650 2660 2670 2680 2680 2690 2700 2710 2720 2730 pF1KE9 LDCMHKDQ--VEKEGKVREE-IAEYQLRLHEAEKKHQALLLDTNKQYEVEIQTYREKLTS : .:.: ...: .. :: .:: : : :.: .. :: ..::.. ....: CCDS30 LKHLHHDAGIMRNETETAEERVAELARDLVEMEQK-LLMVTKENKGLTAQIQSFGRSMSS 2690 2700 2710 2720 2730 2740 2740 2750 2760 2770 2780 2790 pF1KE9 KEECLSSQKLEIDLLKSSKEELNNSLKATTQILEE-LKKTKMDNLKYVNQLKKENERAQG .. . . :.: :: .. . ::: .:. :. : . . : : . .. : .. CCDS30 LQNSRDHANEELDELK---RKYDASLKELAQLKEQGLLNRERDALLSETAFSM-NSTEEN 2750 2760 2770 2780 2790 2800 2810 2820 2830 2840 pF1KE9 KMKLLIKSCKQLEEEKEILQKELSQLQAA----QEKQKTGTVMDTKVDELTTEIKELKET ... : : .:: . : : . :::. . : .:. . .... :.: .:....... CCDS30 SLSHLEKLNQQLLSKDEQLLHLSSQLEDSYNQVQSFSKAMASLQNERDHLWNELEKFRKS 2800 2810 2820 2830 2840 2850 2850 2860 2870 2880 2890 2900 pF1KE9 LEEKTKEADEYLDKYCSLLISHEKLEKAKEMLETQVAHLCSQQSKQDSRGSPLLGPVVPG : : . : CCDS30 EEGKQRSAAQPSTSPAEVQSLKKAMSSLQNDRDRLLKELKNLQQQYLQINQEITELHPLK 2860 2870 2880 2890 2900 2910 >>CCDS58847.1 GOLGB1 gene_id:2804|Hs108|chr3 (3269 aa) initn: 205 init1: 106 opt: 948 Z-score: 417.9 bits: 92.2 E(32554): 5.9e-17 Smith-Waterman score: 1297; 22.5% identity (56.2% similar) in 3039 aa overlap (18-2857:52-2871) 10 20 30 40 pF1KE9 MSWALEEWKEGLPTRALQKIQELEGQLDKLKKEKQQRQFQLDSLEAA ... : . .:: .:.. ::.. . : CCDS58 TDQNMRAPLDPELHQESDMEFNNTTQEDVQERLAYAEQLVVELKDIIRQKDVQLQQKDEA 30 40 50 60 70 80 50 60 70 80 90 100 pF1KE9 LQKQKQKVENEKTEGTNLKRENQRLMEICESLEKTKQKISHELQVKESQVNFQEGQLNSG ::.... ..: : . .:. . .: . . .:. : . . : . : : .: ::.. CCDS58 LQEERKAADN-KIKKLKLHAKA-KLTSLNKYIEEMKAQGGTVLPT-EPQ---SEEQLSKH 90 100 110 120 130 110 120 130 140 150 160 pF1KE9 KKQIEKLEQELKRCKSELERSQQAAQSADVSLNPCNTPQKIFTTPLTPSQYYSGSKYED- :. . :.:... : .:..... .. ...:. .. : :.: :....:. CCDS58 DKSSTEEEMEIEKIKHKLQEKEELISTLQAQLTQAQAEQ--------PAQ--SSTEMEEF 140 150 160 170 180 170 180 190 200 210 220 pF1KE9 --LKEKYNKEVEERKRLEAEVKALQAKKASQ-TLPQATMNHRDIARHQASSSVFSWQQEK .:.. ... : . :.:... ::..:.: . : .. ..: :: ... . . . CCDS58 VMMKQQLQEKEEFISTLQAQLSQTQAEQAAQLSSMQQVVREKD-ARFETQVRLHEDELLQ 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE9 TPSHLSSNSQRTPIRRDFSASYFSGEQEVTPSRSTLQIGKRDANSSFFDNSSSPHLLDQL .. . ... : .. . :. .. ..... ... ... :. . :.:. CCDS58 LVTQADVETEMQQKLRVLQRKLEEHEESLVGRAQVVDLLQQELTAAEQRNQILSQQLQQM 250 260 270 280 290 300 290 300 310 320 330 340 pF1KE9 KAQNQELRNKINELELRLQGHEKEMKGQVNKFQELQLQLEKAKVELIEKEKVLNKCRDEL .:... ::: .. :.: : .. ::: ..:. :.. ... ..:. CCDS58 EAEHNTLRNTVET--------ERE---------ESKILLEKMELEVAERKLSFHNLQEEM 310 320 330 340 350 360 370 380 390 400 pF1KE9 VRTTAQYDQASTKYTALEQKLKKLTEDLSCQRQNAESARCSLEQKIKEKEKEFQEELSRQ . :..::. . ::.. . .:::: : . .: .. CCDS58 HHLLEQFEQAGQAQAELESRYS------------------ALEQKHKAEMEEKTSHILSL 350 360 370 380 410 420 430 440 450 460 pF1KE9 QRSFQTLDQECIQMKARLTQELQQAKNMHNVLQAELDKLTSVKQQLENNLEEFKQKLCRA :.. : :.. : .: . ...: : :: . : .:. . ....::... .:..: : : CCDS58 QKTGQELQSACDALKDQ-NSKLLQDKNEQAVQSAQT--IQQLEDQLQQKSKEISQFLNRL 390 400 410 420 430 440 470 480 490 500 510 520 pF1KE9 --EQAFQASQIKENELRRSMEEMKKENNLLKSHSEQKAREVCHLEAELKNIKQCLNQSQN .: ::: . .. . :.:. : :: : : ::.: : : :. CCDS58 PLQQHETASQTSFPDVYNEGTQAVTEENI---ASLQK-RVV-----ELENEKGALLLSSI 450 460 470 480 490 530 540 550 560 570 pF1KE9 FAEEMKAKN---TSQETMLRDLQEKINQQENSLTLEKLKLAVADLEKQRDCSQDLLKKRE ::.::.: .:: :.: . :.. .. . .. .....:. ..:. : . : CCDS58 ELEELKAENEKLSSQITLL-EAQNRTGEADREVS----EISIVDIANKRSSSAE-----E 500 510 520 530 540 580 590 600 610 620 630 pF1KE9 HHIEQLNDKLSKTEKESKALLSALELKKKEYEELKEEKTLFSCWKSE-------NEKLLT . :.. .:. .:: ..:: ::.:. . ::. : .. ..: ..: . CCDS58 SGQDVLENTFSQKHKELSVLL--LEMKEAQ-EEIAFLKLQLQGKRAEEADHEVLDQKEMK 550 560 570 580 590 600 640 650 660 670 680 pF1KE9 QMESEK-ENLQSKINHLETCLKTQQIKSHEYNERVRTLEMDRENLSVE--IRNLHNV-LD :::.: .. :. :: : : ::. ...:. :.: :. ... :. CCDS58 QMEGEGIAPIKMKV-FLED---TGQDFPLMPNEESSLPAVEKEQASTEHQSRTSEEISLN 610 620 630 640 650 660 690 700 710 720 730 740 pF1KE9 SKSVEVETQKLAYMELQQKAEFSDQKHQKEIENMCLKTSQLTGQVEDLE---HKLQLLSN . .::... : . . . : :: :.: .: .:. .:: :: : . . CCDS58 DAGVELKSTKQDGDKSLSAVPDIGQCHQDELE-------RLKSQILELELNFHKAQEIYE 670 680 690 700 710 750 760 770 780 pF1KE9 EIMD-KDRCYQDLHAEYESL-----------------RDLLKS--KDASLVTNEDHQRSL . .: : . ..:. : . :: : : :. :.::. : . CCDS58 KNLDEKAKEISNLNQLIEEFKKNADNNSSAFTALSEERDQLLSQVKELSMVTELRAQVKQ 720 730 740 750 760 770 790 800 810 820 830 pF1KE9 LAFDQQPAMHH---SFANIIGEQGSMPSERSECRLEADQSPKNSAILQNRVDS--LEFSL : .. : .. .. . .... . . .:: .. . .:::..:. :.:: CCDS58 LEMNLAEAERQRRLDYESQTAHDNLLTEQIHSLSIEAKSKDVKIEVLQNELDDVQLQFSE 780 790 800 810 820 830 840 850 860 870 880 890 pF1KE9 ESQ--KQMNSDLQKQCEELVQIKGEIEENLMKAEQMHQSFVAETSQRISKLQEDTSAHQN .: ....:.::.. :... .... :.:.. :.. .. .:.:... .. CCDS58 QSTLIRSLQSQLQNKESEVLEGAERVRHISSKVEELSQAL-SQKELEITKMDQLLLEKKR 840 850 860 870 880 890 900 910 920 930 940 950 pF1KE9 VVAETLSALENKEKELQLLNDKVETEQAEIQELKKSNHLLEDSLKE-LQLLSETLSLEKK : ...:.:.... .. .. ......: : : . .::: :.:::.. .:. CCDS58 DVETLQQTIEEKDQQVTEISFSMTEKMVQLNEEKFSLGVEIKTLKEQLNLLSRAEEAKKE 900 910 920 930 940 950 960 970 980 990 1000 pF1KE9 ------EMSSIISLNKREI--------EELTQENGTLKEINASLNQE-KMNLIQKSESFA :.:: .. : :. ::: .: ::. : . ... . ::...: . CCDS58 QVEEDNEVSSGLKQNYDEMSPAGQISKEELQHEFDLLKKENEQRKRKLQAALINRKE-LL 960 970 980 990 1000 1010 1010 1020 1030 1040 1050 pF1KE9 NYIDEREKSISELSDQYKQEKLILLQRCEETGNAYEDLSQKY---KAAQEKNSKLECLLN . ... :. ...:.:. :.: : :.. :. :.. :: .: : . : ...: :. CCDS58 QRVSRLEEELANLKDESKKE--IPLSETER-GEVEEDKENKEYSEKCVTSKCQEIEIYLK 1020 1030 1040 1050 1060 1060 1070 1080 1090 1100 1110 pF1KE9 ECTSLCENRKNELEQ-LKEAFAKEHQ-EFLTKL---AFAEERNQNLMLELETV--QQALR . : : . ..... :.: .: :.: . :.: .. .. :: .:. : : .. CCDS58 QTISEKEVELQHIRKDLEEKLAAEEQFQALVKQMNQTLQDKTNQIDLLQAEISENQAIIQ 1070 1080 1090 1100 1110 1120 1120 1130 1140 1150 1160 1170 pF1KE9 SEMTDNQNNSKSEAGGLKQEIMTLKEEQNKMQKEVNDLLQENEQLMKVMKTKHECQNLES . .:.: . : ... .: .: .... . ... . :. :... . : :.. :. . CCDS58 KLITSNTDASDGDSVALVKETVVISPPCTGSSEHWKPELE--EKILALEKEKEQLQKKLQ 1130 1140 1150 1160 1170 1180 1180 1190 1200 1210 1220 pF1KE9 EPI--RNSVKERESERNQCNFKPQMDLEVKEISLDSYNAQLVQLEAMLRNKELKLQESEK : . :... .. .:... .. :.:. . :.:: :.. . ...: .. .. . CCDS58 EALTSRKAILKKAQEKER-----HLREELKQ-QKDDYNRLQEQFDEQSKENE-NIGDQLR 1190 1200 1210 1220 1230 1230 1240 1250 1260 1270 1280 pF1KE9 EKECLQHEL-QTIRGDLETSNLQDMQSQEISGLKDCEIDAEEKYISGP---HELSTSQND . :: .. ..: : : ... :. :. ::.. . : :.. . : .: . . CCDS58 Q---LQIQVRESIDGKLPSTDQQESCSST-PGLEEPLFKATEQHHTQPVLESNLCPDWPS 1240 1250 1260 1270 1280 1290 1290 1300 1310 1320 1330 1340 pF1KE9 NAHLQCSLQTTMNKLNELEKICEILQAEKYELVTELNDSRSECITATR---KMAEEVGKL ... .:: . . .. :: .::: :: ..... :: .. .. :...: CCDS58 HSEDASALQGGTSVAQIKAQLKEI-EAEKVELELKVSSTTSELTKKSEEVFQLQEQINKQ 1300 1310 1320 1330 1340 1350 1350 1360 1370 1380 pF1KE9 LNEVKILNDDS--GLLHGELVED--------IPGGEFGE--QPN-EQHPVSLAPLDESNS :.. :. : . .:.: ... : : : . ::. .. .. .:. : CCDS58 GLEIESLKTVSHEAEVHAESLQQKLESSQLQIAGLEHLRELQPKLDELQKLISKKEEDVS 1360 1370 1380 1390 1400 1410 1390 1400 1410 1420 1430 1440 pF1KE9 YEHLTLSDKE-----VQMHFAELQEKFLSLQSEHKIL---HDQHC-QMSSKMSELQTYVD : ::.:: .: .. : .. . .:... .. ::.. :.. .. :.. . CCDS58 YLSGQLSEKEAALTKIQTEIIEQEDLIKALHTQLEMQAKEHDERIKQLQVELCEMKQKPE 1420 1430 1440 1450 1460 1470 1450 1460 1470 1480 pF1KE9 SLKAENLVLSTNLRNFQGDLV---------KEMQ--LGLEEGLVPSLSSSCVPDSSSLSS . :. . . :..:. :. : .: :.: .: . :..: . :..:. CCDS58 EIGEESRAKQQIQRKLQAALISRKEALKENKSLQEELSLARGTIERLTKSLADVESQVSA 1480 1490 1500 1510 1520 1530 1490 1500 1510 1520 1530 1540 pF1KE9 LG---DSSFYR-ALLEQTGDMSLLSNLEGTVSANQCSVDEVFCSSLQE--ENLTRKETPS . :. . : :::.. : .:..... .. :: . : ::. :.::. . CCDS58 QNKEKDTVLGRLALLQEERD-KLITEMDRSLLENQSLSSS--CESLKLALEGLTEDKE-- 1540 1550 1560 1570 1580 1550 1560 1570 1580 1590 1600 pF1KE9 APAKGVEELESLCEVYRQSLEKLEEKMESQGIMKNKEIQ-ELEQLLSS-ERQELDCLRKQ : :.:.::: ..: :. :. : : :.::.: : : ::.: : . : : CCDS58 ---KLVKEIESL----KSS--KIAESTEWQ--EKHKELQKEYEILLQSYENVSNEAERIQ 1590 1600 1610 1620 1630 1610 1620 1630 1640 1650 pF1KE9 YLSEN-EQWQQKLTSVTLEMESKLAAEKKQTEQLSLELEVARLQLQGLDLSSRS-LLGID .. : .: .:.: . :.. .:: .. :.: . ... . :... .: .. CCDS58 HVVEAVRQEKQELYGKLRSTEANKKETEKQLQEAEQEMEEMKEKMRKFAKSKQQKILELE 1640 1650 1660 1670 1680 1690 1660 1670 1680 1690 1700 1710 pF1KE9 TE-DAIQGR-NESCDISKE--HTSETTERTPKHDVHQIC---DKDAQQDLNLDIEKITET : : .... . . : .:: .: ... . :...... . ... .: :: . . CCDS58 EENDRLRAEVHPAGDTAKECMETLLSSNASMKEELERVKMEYETLSKKFQSLMSEKDSLS 1700 1710 1720 1730 1740 1750 1720 1730 1740 1750 1760 1770 pF1KE9 GAVKPTG-ECSGEQSPDTNYEPPGEDKTQGSSECISELSFSGPNALVPMDFLGNQEDIHN :. . :. : ..: : . .: ..... : . : : :. :. . CCDS58 EEVQDLKHQIEGNVSKQANLE--ATEKHDNQTNVTEEGTQSIP---------GETEEQDS 1760 1770 1780 1790 1800 1780 1790 1800 1810 1820 1830 pF1KE9 LQLRVKETSNENLRLLHVIEDRDRKVESLLNEMKELDSKLHLQEVQLMTKIEACIELEKI :.. .. : .:. . .. . : . .. :... .::... . :.: CCDS58 LSMSTRPTCSES---VPSAKSANPAVSKDFSSHDEINN--YLQQIDQLK--------ERI 1810 1820 1830 1840 1850 1840 1850 1860 1870 1880 pF1KE9 VG--ELKKENSDLSEKLEYFSCDHQELLQRVETSEGLNSDLEMHADKSSREDIGDNVAKV .: : :..:...:. :: ... ::... :..: .:.: . ..:.:. CCDS58 AGLEEEKQKNKEFSQTLEN---EKNTLLSQISTKDG---ELKM---------LQEEVTKM 1860 1870 1880 1890 1890 1900 1910 1920 1930 1940 pF1KE9 NDSWKERFLDVENELSRIRSEKASIEHEALYLEADLEVVQTEKLCLEKDNENKQKVIVCL : .. ...::::. . : . :.: . ::: :.: . . : . : CCDS58 NLLNQQ----IQEELSRVTKLKETAEEE----KDDLE----ERLMNQLAELNGSIGNYCQ 1900 1910 1920 1930 1940 1950 1960 1970 1980 1990 2000 pF1KE9 EEELSVVTSERNQLRGELDTMSKKTTALDQLSEKM-KEKTQELESH-QSECLHCIQVAEA . . . .: :..:. ...: .. :.. .... ::::. .::. ..: :. :: :. CCDS58 DVTDAQIKNE--LLESEMKNLKKCVSELEEEKQQLVKEKTK-VESEIRKEYLEKIQGAQK 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 2050 2060 pF1KE9 E------VKEKTELLQTLSSDVSELLKDKTHLQEKLQSLEKDSQALSLTKCELENQIAQL : .:: :::. ...:..: :: . :::...::. .:: ... : .... CCDS58 EPGNKSHAKELQELLKEKQQEVKQLQKDCIRYQEKISALERTVKALEFVQTESQKDLEIT 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 2110 pF1KE9 NKEKELLVKESESLQARLSESDYEKLNVSKALEAALVEKGEFALR--LSSTQEEVH-QLR ... :.. .. ::.:. ... : . ::: : .. :. :.:..: :. :.. CCDS58 KENLAQAVEHRKKAQAELA--SFKVLLDDTQSEAARVLADNLKLKKELQSNKESVKSQMK 2070 2080 2090 2100 2110 2120 2120 2130 2140 2150 2160 2170 pF1KE9 RGIEKLRVRIEADEKKQLHIAEKLKERERENDSLKDKVENLERELQMSEENQELVILDAE . : :. :.: :.:.: .:..: ...:.. :.:: ::. . . . CCDS58 QKDEDLERRLEQAEEKHL--------KEKKN--MQEKLDALRREKVHLEETIGEIQVTLN 2130 2140 2150 2160 2170 2180 2190 2200 2210 2220 2230 pF1KE9 NSKAEVETLKTQIEEMARSLKVFELDLVTLRSEKENLTKQIQEKQGQLSELDKLLSSFKS .. ::. :. ... . .: .: .. .:..... . ..: : .:.. CCDS58 KKDKEVQQLQENLDSTVTQLAAFTKSMSSLQDDRDRV----------IDEAKKWERKFSD 2180 2190 2200 2210 2220 2240 2250 2260 2270 2280 pF1KE9 LLEEKEQAEIQIKEES----KTAVEMLQNQLKELNEAVAALCGDQEIMKATEQS------ .. ::. ::..::.. : ..... ...::. .. : :..: .. :. CCDS58 AIQSKEE-EIRLKEDNCSVLKDQLRQMSIHMEELKINISRLEHDKQIWESKAQTEVQLQQ 2230 2240 2250 2260 2270 2280 2290 2300 2310 2320 2330 pF1KE9 ------------LDPPIEEEHQLRNSIEKLRARLEADEKKQLCVLQQLKESEHHADLLKG : .:: ..: .: .. :.::.. :. : .:..: .. :: CCDS58 KVCDTLQGENKELLSQLEETRHLYHSSQNELAKLESELKSLKDQLTDLSNSLEKCKEQKG 2290 2300 2310 2320 2330 2340 2340 2350 2360 2370 2380 2390 pF1KE9 RVENLERELEIARTNQEHAALEAENSKGEVETLKAKIEGMTQSLRGLELDVVTIRSEKEN .:.. :. : :.. . . :.. . : .... . . : .... : ::. CCDS58 NLEGIIRQQEADIQNSKFSYEQLETDLQASRELTSRLH---EEINMKEQKIISLLSGKEE 2350 2360 2370 2380 2390 2400 2410 2420 2430 2440 pF1KE9 LTN----ELQKEQER-ISELEIINSSFE--NILQEKEQEKVQMKEKSSTAMEMLQT---- . ::...... :.::: . :. : ::. :.:..:. .:.. :: :.: CCDS58 AIQVAIAELRQQHDKEIKELENLLSQEEEENIVLEEENKKA--VDKTNQLMETLKTIKKE 2400 2410 2420 2430 2440 2450 2450 2460 2470 2480 2490 pF1KE9 ------QLKELNERVAALHNDQEACKAKEQNLSSQVECLELEKAQLLQGLDEAKNNYIVL :: . . ...:.::.. . :.: . . ::: ::.: :.:: : CCDS58 NIQQKAQLDSFVKSMSSLQNDRDRIVGDYQQLEERHLSIILEKDQLIQEA-AAENNK--L 2460 2470 2480 2490 2500 2510 2500 2510 2520 2530 2540 2550 pF1KE9 QSSVNGLIQEVEDGKQKLEKKDEEISRLKNQIQDQEQLVS-KLSQVEGEHQLWKEQNLEL . . :: ....: ... : : :. . . .: .:... : :: . .. .:: :: CCDS58 KEEIRGLRSHMDDLNSENAKLDAELIQYR---EDLNQVITIKDSQQKQLLEVQLQQNKEL 2520 2530 2540 2550 2560 2570 2560 2570 2580 2590 2600 2610 pF1KE9 RNLTVELEQKIQVLQSKNASLQDTLEVLQSSYKNLENELELTKMDKMSFVEKVNKMTAKE .: ..::.:.. . : .:. ....:: ..: .:.: :.. .....:. . . CCDS58 ENKYAKLEEKLKESEEANEDLRRSFNALQEEKQDLSKEIESLKVSISQLTRQVTALQEEG 2580 2590 2600 2610 2620 2630 2620 2630 2640 2650 2660 2670 pF1KE9 TE--LQREMHEMAQKTAELQEELSGEKNRLAGELQLLLEEIKSSKDQLKELTLENSELKK : . ... ... .:. .:. ..:.: .: : . .:. :.. ...::: CCDS58 TLGLYHAQLKVKEEEVHRLSALFSSSQKRIA---ELEEELVCVQKEAAKKVGEIEDKLKK 2640 2650 2660 2670 2680 2680 2690 2700 2710 2720 2730 pF1KE9 SLDCMHKDQ--VEKEGKVREE-IAEYQLRLHEAEKKHQALLLDTNKQYEVEIQTYREKLT : .:.: ...: .. :: .:: : : :.: .. :: ..::.. .... CCDS58 ELKHLHHDAGIMRNETETAEERVAELARDLVEMEQK-LLMVTKENKGLTAQIQSFGRSMS 2690 2700 2710 2720 2730 2740 2740 2750 2760 2770 2780 2790 pF1KE9 SKEECLSSQKLEIDLLKSSKEELNNSLKATTQILEE-LKKTKMDNLKYVNQLKKENERAQ : .. . . :.: :: .. . ::: .:. :. : . . : : . .. : . CCDS58 SLQNSRDHANEELDELK---RKYDASLKELAQLKEQGLLNRERDALLSETAFSM-NSTEE 2750 2760 2770 2780 2790 2800 2800 2810 2820 2830 2840 pF1KE9 GKMKLLIKSCKQLEEEKEILQKELSQLQAA----QEKQKTGTVMDTKVDELTTEIKELKE .... : : .:: . : : . :::. . : .:. . .... :.: .:...... CCDS58 NSLSHLEKLNQQLLSKDEQLLHLSSQLEDSYNQVQSFSKAMASLQNERDHLWNELEKFRK 2810 2820 2830 2840 2850 2860 2850 2860 2870 2880 2890 2900 pF1KE9 TLEEKTKEADEYLDKYCSLLISHEKLEKAKEMLETQVAHLCSQQSKQDSRGSPLLGPVVP . : : . : CCDS58 SEEGKQRSAAQPSTSPAEVQSLKKAMSSLQNDRDRLLKELKNLQQQYLQINQEITELHPL 2870 2880 2890 2900 2910 2920 3114 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 10:56:02 2016 done: Tue Nov 8 10:56:03 2016 Total Scan time: 7.550 Total Display time: 1.650 Function used was FASTA [36.3.4 Apr, 2011]