Result of FASTA (ccds) for pF1KE0298
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KE0298, 2718 aa
  1>>>pF1KE0298 2718 - 2718 aa - 2718 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 15.1988+/-0.0017; mu= -19.9777+/- 0.099
 mean_var=784.8906+/-206.708, 0's: 0 Z-trim(110.0): 9  B-trim: 614 in 1/51
 Lambda= 0.045779
 statistics sampled from 11298 (11303) to 11298 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.663), E-opt: 0.2 (0.347), width:  16
 Scan time:  8.760

The best scores are:                                      opt bits E(32554)
CCDS43426.1 HIVEP1 gene_id:3096|Hs108|chr6         (2718) 17896 1200.5       0
CCDS44124.1 HIVEP3 gene_id:59269|Hs108|chr1        (2405) 1059 88.4   5e-16
CCDS463.1 HIVEP3 gene_id:59269|Hs108|chr1          (2406) 1059 88.4   5e-16
CCDS43510.1 HIVEP2 gene_id:3097|Hs108|chr6         (2446)  934 80.2 1.6e-13


>>CCDS43426.1 HIVEP1 gene_id:3096|Hs108|chr6              (2718 aa)
 initn: 17896 init1: 17896 opt: 17896  Z-score: 6410.3  bits: 1200.5 E(32554):    0
Smith-Waterman score: 17896; 99.9% identity (100.0% similar) in 2718 aa overlap (1-2718:1-2718)

               10        20        30        40        50        60
pF1KE0 MPRTKQIHPRNLRDKIEEAQKELNGAEVSKKEILQAGVKGTSESLKGVKRKKIVAENHLK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MPRTKQIHPRNLRDKIEEAQKELNGAEVSKKEILQAGVKGTSESLKGVKRKKIVAENHLK
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KE0 KIPKSPLRNPLQAKHKQNTEESSFAVLHSASESHKKQNYIPVKNGKQFTKQNGETPGIIA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KIPKSPLRNPLQAKHKQNTEESSFAVLHSASESHKKQNYIPVKNGKQFTKQNGETPGIIA
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KE0 EASKSEESVSPKKPLFLQQPSELRRWRSEGADPAKFSDLDEQCDSSSLSSKTRTDNSECI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EASKSEESVSPKKPLFLQQPSELRRWRSEGADPAKFSDLDEQCDSSSLSSKTRTDNSECI
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KE0 SSHCGTMSPSYTNTAFDVLLKAMEPELSTLSQKGSPCAIKTEKLRPNKTARSPPKLKNSS
       :::::: :::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SSHCGTTSPSYTNTAFDVLLKAMEPELSTLSQKGSPCAIKTEKLRPNKTARSPPKLKNSS
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KE0 MDAPNQTSQELVAESQSSCTSYTVHMSAAQKNEQGAMQSASHLYHQHEHFVPKSNQHNQQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MDAPNQTSQELVAESQSSCTSYTVHMSAAQKNEQGAMQSASHLYHQHEHFVPKSNQHNQQ
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KE0 LPGCSGFTGSLTNLQNQENAKLEQVYNIAVTSSVGLTSPSSRSQVTPQNQQMDSASPLSI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LPGCSGFTGSLTNLQNQENAKLEQVYNIAVTSSVGLTSPSSRSQVTPQNQQMDSASPLSI
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KE0 SPANSTQSPPMPIYNSTHVASVVNQSVEQMCNLLLKDQKPKKQGKYICEYCNRACAKPSV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SPANSTQSPPMPIYNSTHVASVVNQSVEQMCNLLLKDQKPKKQGKYICEYCNRACAKPSV
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KE0 LLKHIRSHTGERPYPCVTCGFSFKTKSNLYKHKKSHAHTIKLGLVLQPDAGGLFLSHESP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LLKHIRSHTGERPYPCVTCGFSFKTKSNLYKHKKSHAHTIKLGLVLQPDAGGLFLSHESP
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KE0 KALSIHSDVEDSGESEEEGATDERQHDLGAMELQPVHIIKRMSNAETLLKSSFTPSSPEN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KALSIHSDVEDSGESEEEGATDERQHDLGAMELQPVHIIKRMSNAETLLKSSFTPSSPEN
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KE0 VIGDFLLQDRSAESQAVTELPKVVVHHVTVSPLRTDSPKAMDPKPELSSAQKQKDLQVTN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VIGDFLLQDRSAESQAVTELPKVVVHHVTVSPLRTDSPKAMDPKPELSSAQKQKDLQVTN
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KE0 VQPLSANMSQGGVSRLETNENSHQKGDMNPLEGKQDSHVGTVHAQLQRQQATDYSQEQQG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VQPLSANMSQGGVSRLETNENSHQKGDMNPLEGKQDSHVGTVHAQLQRQQATDYSQEQQG
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KE0 KLLSPRSLGSTDSGYFSRSESADQTVSPPTPFARRLPSTEQDSGRSNGPSAALVTASTPS
       :::::::::::::::::::::::::::::::::::::::::::::::::::::::.::::
CCDS43 KLLSPRSLGSTDSGYFSRSESADQTVSPPTPFARRLPSTEQDSGRSNGPSAALVTTSTPS
              670       680       690       700       710       720

              730       740       750       760       770       780
pF1KE0 ALPTGEKALLLPGQMRPPLATKTLEERISKLISDNEALVDDKQLDSVKPRRTSLSRRGSI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ALPTGEKALLLPGQMRPPLATKTLEERISKLISDNEALVDDKQLDSVKPRRTSLSRRGSI
              730       740       750       760       770       780

              790       800       810       820       830       840
pF1KE0 DSPKSYIFKDSFQFDLKPVGRRTSSSSDIPKSPFTPTEKSKQVFLLSVPSLDCLPITRSN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 DSPKSYIFKDSFQFDLKPVGRRTSSSSDIPKSPFTPTEKSKQVFLLSVPSLDCLPITRSN
              790       800       810       820       830       840

              850       860       870       880       890       900
pF1KE0 SMPTTGYSAVPANIIPPPHPLRGSQSFDDKIGAFYDDVFVSGPNAPVPQSGHPRTLVRQA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SMPTTGYSAVPANIIPPPHPLRGSQSFDDKIGAFYDDVFVSGPNAPVPQSGHPRTLVRQA
              850       860       870       880       890       900

              910       920       930       940       950       960
pF1KE0 AIEDSSANESHVLGTGQSLDESHQGCHAAGEAMSVRSKALAQGPHIEKKKSHQGRGTMFE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 AIEDSSANESHVLGTGQSLDESHQGCHAAGEAMSVRSKALAQGPHIEKKKSHQGRGTMFE
              910       920       930       940       950       960

              970       980       990      1000      1010      1020
pF1KE0 CETCRNRYRKLENFENHKKFYCSELHGPKTKVAMREPEHSPVPGGLQPQILHYRVAGSSG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 CETCRNRYRKLENFENHKKFYCSELHGPKTKVAMREPEHSPVPGGLQPQILHYRVAGSSG
              970       980       990      1000      1010      1020

             1030      1040      1050      1060      1070      1080
pF1KE0 IWEQTPQIRKRRKMKSVGDDEELQQNESGTSPKSSEGLQFQNALGCNPSLPKHNVTIRSD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 IWEQTPQIRKRRKMKSVGDDEELQQNESGTSPKSSEGLQFQNALGCNPSLPKHNVTIRSD
             1030      1040      1050      1060      1070      1080

             1090      1100      1110      1120      1130      1140
pF1KE0 QQHKNIQLQNSHIHLVARGPEQTMDPKLSTIMEQQISSAAQDKIELQRHGTGISVIQHTN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QQHKNIQLQNSHIHLVARGPEQTMDPKLSTIMEQQISSAAQDKIELQRHGTGISVIQHTN
             1090      1100      1110      1120      1130      1140

             1150      1160      1170      1180      1190      1200
pF1KE0 SLSRPNSFDKPEPFERASPVSFQELNRTGKSGSLKVIGISQEESHPSRDGSHPHQLALSD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SLSRPNSFDKPEPFERASPVSFQELNRTGKSGSLKVIGISQEESHPSRDGSHPHQLALSD
             1150      1160      1170      1180      1190      1200

             1210      1220      1230      1240      1250      1260
pF1KE0 ALRGELQESSRKSPSERHVLGQPSRLVRQHNIQVPEILVTEEPDRDLEAQCHDQEKSEKF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ALRGELQESSRKSPSERHVLGQPSRLVRQHNIQVPEILVTEEPDRDLEAQCHDQEKSEKF
             1210      1220      1230      1240      1250      1260

             1270      1280      1290      1300      1310      1320
pF1KE0 SWPQRSETLSKLPTEKLPPKKKRLRLAEIEHSSTESSFDSTLSRSLSRESSLSHTSSFSA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SWPQRSETLSKLPTEKLPPKKKRLRLAEIEHSSTESSFDSTLSRSLSRESSLSHTSSFSA
             1270      1280      1290      1300      1310      1320

             1330      1340      1350      1360      1370      1380
pF1KE0 SLDIEDVSKTEASPKIDFLNKAEFLMIPAGLNTLNVPGCHREMRRTASEQINCTQTSMEV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SLDIEDVSKTEASPKIDFLNKAEFLMIPAGLNTLNVPGCHREMRRTASEQINCTQTSMEV
             1330      1340      1350      1360      1370      1380

             1390      1400      1410      1420      1430      1440
pF1KE0 SDLRSKSFDCGSITPPQTTPLTELQPPSSPSRVGVTGHVPLLERRRGPLVRQISLNIAPD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SDLRSKSFDCGSITPPQTTPLTELQPPSSPSRVGVTGHVPLLERRRGPLVRQISLNIAPD
             1390      1400      1410      1420      1430      1440

             1450      1460      1470      1480      1490      1500
pF1KE0 SHLSPVHPTSFQNTALPSVNAVPYQGPQLTSTSLAEFSANTLHSQTQVKDLQAETSNSSS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SHLSPVHPTSFQNTALPSVNAVPYQGPQLTSTSLAEFSANTLHSQTQVKDLQAETSNSSS
             1450      1460      1470      1480      1490      1500

             1510      1520      1530      1540      1550      1560
pF1KE0 TNVFPVQQLCDINLLNQIHAPPSHQSTQLSLQVSTQGSKPDKNSVLSGSSKSEDCFAPKY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 TNVFPVQQLCDINLLNQIHAPPSHQSTQLSLQVSTQGSKPDKNSVLSGSSKSEDCFAPKY
             1510      1520      1530      1540      1550      1560

             1570      1580      1590      1600      1610      1620
pF1KE0 QLHCQVFTSGPSCSSNPVHSLPNQVISDPVGTDHCVTSATLPTKLIDSISNSHPLLPPEL
       ::::::::::::::::::::::::::::::::::::::::::::::::.:::::::::::
CCDS43 QLHCQVFTSGPSCSSNPVHSLPNQVISDPVGTDHCVTSATLPTKLIDSMSNSHPLLPPEL
             1570      1580      1590      1600      1610      1620

             1630      1640      1650      1660      1670      1680
pF1KE0 RPLGSQVQKVPSSFMLPIRLQSSVPAYCFATLTSLPQILVTQDLPNQPICQTNHSVVPIS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 RPLGSQVQKVPSSFMLPIRLQSSVPAYCFATLTSLPQILVTQDLPNQPICQTNHSVVPIS
             1630      1640      1650      1660      1670      1680

             1690      1700      1710      1720      1730      1740
pF1KE0 EEQNSVPTLQKGHQNALPNPEKEFLCENVFSEMSQNSSLSESLPITQKISVGRLSPQQES
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EEQNSVPTLQKGHQNALPNPEKEFLCENVFSEMSQNSSLSESLPITQKISVGRLSPQQES
             1690      1700      1710      1720      1730      1740

             1750      1760      1770      1780      1790      1800
pF1KE0 SASSKRMLSPANSLDIAMEKHQKRAKDENGAVCATDVRPLEALSSRVNEASKQKKPILVR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SASSKRMLSPANSLDIAMEKHQKRAKDENGAVCATDVRPLEALSSRVNEASKQKKPILVR
             1750      1760      1770      1780      1790      1800

             1810      1820      1830      1840      1850      1860
pF1KE0 QVCTTEPLDGVMLEKDVFSQPEISNEAVNLTNVLPADNSSTGCSKFVVIEPISELQEFEN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QVCTTEPLDGVMLEKDVFSQPEISNEAVNLTNVLPADNSSTGCSKFVVIEPISELQEFEN
             1810      1820      1830      1840      1850      1860

             1870      1880      1890      1900      1910      1920
pF1KE0 IKSSTSLTLTVRSSPAPSENTHISPLKCTDNNQERKSPGVKNQGDKVNIQEQSQQPVTSL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 IKSSTSLTLTVRSSPAPSENTHISPLKCTDNNQERKSPGVKNQGDKVNIQEQSQQPVTSL
             1870      1880      1890      1900      1910      1920

             1930      1940      1950      1960      1970      1980
pF1KE0 SLFNIKDTQQLAFPSLKTTTNFTWCYLLRQKSLHLPQKDQKTSAYTDWTVSASNPNPLGL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SLFNIKDTQQLAFPSLKTTTNFTWCYLLRQKSLHLPQKDQKTSAYTDWTVSASNPNPLGL
             1930      1940      1950      1960      1970      1980

             1990      2000      2010      2020      2030      2040
pF1KE0 PTKVALALLNSKQNTGKSLYCQAITTHSKSDLLVYSSKWKSSLSKRALGNQKSTVVEFSN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PTKVALALLNSKQNTGKSLYCQAITTHSKSDLLVYSSKWKSSLSKRALGNQKSTVVEFSN
             1990      2000      2010      2020      2030      2040

             2050      2060      2070      2080      2090      2100
pF1KE0 KDASEINSEQDKENSLIKSEPRRIKIFDGGYKSNEEYVYVRGRGRGKYICEECGIRCKKP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KDASEINSEQDKENSLIKSEPRRIKIFDGGYKSNEEYVYVRGRGRGKYICEECGIRCKKP
             2050      2060      2070      2080      2090      2100

             2110      2120      2130      2140      2150      2160
pF1KE0 SMLKKHIRTHTDVRPYHCTYCNFSFKTKGNLTKHMKSKAHSKKCVDLGVSVGLIDEQDTE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SMLKKHIRTHTDVRPYHCTYCNFSFKTKGNLTKHMKSKAHSKKCVDLGVSVGLIDEQDTE
             2110      2120      2130      2140      2150      2160

             2170      2180      2190      2200      2210      2220
pF1KE0 ESDEKQRFSYERSGYDLEESDGPDEDDNENEDDDEDSQAESVLSATPSVTASPQHLPSRS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ESDEKQRFSYERSGYDLEESDGPDEDDNENEDDDEDSQAESVLSATPSVTASPQHLPSRS
             2170      2180      2190      2200      2210      2220

             2230      2240      2250      2260      2270      2280
pF1KE0 SLQDPVSTDEDVRITDCFSGVHTDPMDVLPRALLTRMTVLSTAQSDYNRKTLSPGKARQR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SLQDPVSTDEDVRITDCFSGVHTDPMDVLPRALLTRMTVLSTAQSDYNRKTLSPGKARQR
             2230      2240      2250      2260      2270      2280

             2290      2300      2310      2320      2330      2340
pF1KE0 AARDENDTIPSVDTSRSPCHQMSVDYPESEEILRSSMAGKAVAITQSPSSVRLPPAAAEH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 AARDENDTIPSVDTSRSPCHQMSVDYPESEEILRSSMAGKAVAITQSPSSVRLPPAAAEH
             2290      2300      2310      2320      2330      2340

             2350      2360      2370      2380      2390      2400
pF1KE0 SPQTAAGMPSVASPHPDPQEQKQQITLQPTPGLPSPHTHLFSHLPLHSQQQSRTPYNMVP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SPQTAAGMPSVASPHPDPQEQKQQITLQPTPGLPSPHTHLFSHLPLHSQQQSRTPYNMVP
             2350      2360      2370      2380      2390      2400

             2410      2420      2430      2440      2450      2460
pF1KE0 VGGIHVVPAGLTYSTFVPLQAGPVQLTIPAVSVVHRTLGTHRNTVTEVSGTTNPAGVAEL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VGGIHVVPAGLTYSTFVPLQAGPVQLTIPAVSVVHRTLGTHRNTVTEVSGTTNPAGVAEL
             2410      2420      2430      2440      2450      2460

             2470      2480      2490      2500      2510      2520
pF1KE0 SSVVPCIPIGQIRVPGLQNLSTPGLQSLPSLSMETVNIVGLANTNMAPQVHPPGLALNAV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SSVVPCIPIGQIRVPGLQNLSTPGLQSLPSLSMETVNIVGLANTNMAPQVHPPGLALNAV
             2470      2480      2490      2500      2510      2520

             2530      2540      2550      2560      2570      2580
pF1KE0 GLQVLTANPSSQSSPAPQAHIPGLQILNIALPTLIPSVSQVAVDAQGAPEMPASQSKACE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GLQVLTANPSSQSSPAPQAHIPGLQILNIALPTLIPSVSQVAVDAQGAPEMPASQSKACE
             2530      2540      2550      2560      2570      2580

             2590      2600      2610      2620      2630      2640
pF1KE0 TQPKQTSVASANQVSRTESPQGLPTVQRENAKKVLNPPAPAGDHARLDGLSKMDTEKAAS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 TQPKQTSVASANQVSRTESPQGLPTVQRENAKKVLNPPAPAGDHARLDGLSKMDTEKAAS
             2590      2600      2610      2620      2630      2640

             2650      2660      2670      2680      2690      2700
pF1KE0 ANHVKPKPELTSIQGQPASTSQPLLKAHSEVFTKPSGQQTLSPDRQVPRPTALPRRQPTV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ANHVKPKPELTSIQGQPASTSQPLLKAHSEVFTKPSGQQTLSPDRQVPRPTALPRRQPTV
             2650      2660      2670      2680      2690      2700

             2710        
pF1KE0 HFSDVSSDDDEDRLVIAT
       ::::::::::::::::::
CCDS43 HFSDVSSDDDEDRLVIAT
             2710        

>>CCDS44124.1 HIVEP3 gene_id:59269|Hs108|chr1             (2405 aa)
 initn: 1987 init1: 601 opt: 1059  Z-score: 401.1  bits: 88.4 E(32554): 5e-16
Smith-Waterman score: 2640; 31.0% identity (53.5% similar) in 2676 aa overlap (203-2707:1-2353)

            180       190       200       210            220       
pF1KE0 RTDNSECISSHCGTMSPSYTNTAFDVLLKAMEPELSTLSQK---GSPCA--IKTEKLRPN
                                     :.:: :. . :   :::     : : .. .
CCDS44                               MDPEQSVKGTKKAEGSPRKRLTKGEAIQ-T
                                             10        20          

       230       240       250       260       270       280       
pF1KE0 KTARSPPKLKNSSMDAPNQTSQELVAESQSSCTSYTVHMSAAQKNEQGAMQSASHLYHQH
       ... : :   ...  . .. .:::.: .     : ... .. .:. :          .  
CCDS44 SVSSSVPYPGSGTAATQESPAQELLAPQPFPGPSSVLREGSQEKTGQQQKPPKRPPIEAS
      30        40        50        60        70        80         

       290       300       310       320       330       340       
pF1KE0 EHFVPKSNQHNQQLPGCSGFTGSLTNLQNQENAKLEQVYNIAVTSSVGLTSPSSRSQVTP
        : . .  ::    :   .: .     .  :..  . :  .    : ....:.    . :
CCDS44 VH-ISQLPQH----PLTPAFMSPGKPEHLLEGSTWQLVDPMRPGPSGSFVAPG----LHP
      90            100       110       120       130           140

       350       360       370       380       390       400       
pF1KE0 QNQQMDSASPLSISPANSTQSPPMPIYNSTHVASVVNQSVEQMCNLLLKDQKPKKQGKYI
       :.: . : . . : : .    : . .   ..:.   .. ...      :..::.: ::::
CCDS44 QSQLLPSHASI-IPPEDLPGVPKVFVPRPSQVSLKPTEEAHK------KERKPQKPGKYI
              150        160       170       180             190   

       410       420       430       440       450       460       
pF1KE0 CEYCNRACAKPSVLLKHIRSHTGERPYPCVTCGFSFKTKSNLYKHKKSHAHTIKLGLVLQ
       :.::.: ::::::: ::::::::::::::  ::::::::::::::.::::: :: ::.  
CCDS44 CQYCSRPCAKPSVLQKHIRSHTGERPYPCGPCGFSFKTKSNLYKHRKSHAHRIKAGLA--
           200       210       220       230       240       250   

       470       480       490       500       510       520       
pF1KE0 PDAGGLFLSHESPKALSIHSDVEDSGESEEEGATDERQHDLGAMELQPVHIIKRMSNAET
          :: .     :..: ..    .  :   :: . . ... .:   .:...  :    . 
CCDS44 SGMGGEMY----PHGLEMERIPGEEFEEPTEGESTDSEEETSATSGHPAELSPR--PKQP
                 260       270       280       290       300       

       530       540       550       560       570       580       
pF1KE0 LLKSSFTPSSPENVIGDFLLQDRSAESQAVTELPKVVVHHVTVSPLRTDSPKAMDPKPEL
       ::.:..  :. ..   .    ..:. .:.. . :  :         . .: . .. ::: 
CCDS44 LLSSGLYSSGSHSSSHERCSLSQSSTAQSLEDPPPFV---------EPSSEHPLSHKPED
         310       320       330       340                350      

       590       600       610       620       630       640       
pF1KE0 SSAQKQKDLQVTNVQPLSANMSQGGVSRLETNENSHQKGDMNPLEGKQDSHVGTVHAQLQ
       . . :::         :.  .:.                                     
CCDS44 THTIKQK---------LALRLSE-------------------------------------
        360                370                                     

       650       660       670       680       690        700      
pF1KE0 RQQATDYSQEQQGKLLSPRSLGSTDSGYFSRSESADQTVSPPTPFARRLPST-EQDSGRS
       :... :   ::   .::: : :::.::::::::::.: ::::.  :.          :: 
CCDS44 RKKVID---EQA--FLSPGSKGSTESGYFSRSESAEQQVSPPNTNAKSYAEIIFGKCGRI
                   380       390       400       410       420     

        710       720         730       740       750       760    
pF1KE0 NGPSAALVTASTPSALP--TGEKALLLPGQMRPPLATKTLEERISKLISDNEALVDDKQL
       .  .: :...::   ::  : .:  :.:  .  :  :...:. :.:::. :::.:: ...
CCDS44 GQRTAMLTATSTQPLLPLSTEDKPSLVP--LSVP-RTQVIEH-ITKLITINEAVVDTSEI
         430       440       450          460        470       480 

          770       780       790       800       810       820    
pF1KE0 DSVKPRRTSLSRRGSIDSPKSYIFKDSFQFDLKPVGRRTSSSSDIPKSPFTPTEKSKQVF
       :::::::.:::::.:..:::: ....       :.    :: :.  : :    :.:  . 
CCDS44 DSVKPRRSSLSRRSSMESPKSSLYRE-------PL----SSHSEKTK-P----EQS-LLS
             490       500                  510            520     

          830        840       850       860       870       880   
pF1KE0 LLSVPSL-DCLPITRSNSMPTTGYSAVPANIIPPPHPLRGSQSFDDKIGAFYDDVFVSGP
       :   ::    .:. ::.:::... .     :  : ::.::: ::::.:     :  . . 
CCDS44 LQHPPSTAPPVPLLRSHSMPSAACT-----ISTPHHPFRGSYSFDDHI----TDSEALSH
          530       540            550       560           570     

           890       900       910       920       930       940   
pF1KE0 NAPVPQSGHPRTLVRQAAIEDSSANESHVLGTGQSLDESHQGCHAAGEAMSVRSKALAQG
       .. :  : ::: : :: :::   ..:      : :   :..     .. .  . . :.. 
CCDS44 SSHVFTS-HPRMLKRQPAIELPLGGEYSSEEPGPS---SKDTASKPSDEVEPKESELTK-
         580        590       600          610       620       630 

           950       960       970       980       990             
pF1KE0 PHIEKKKSHQGRGTMFECETCRNRYRKLENFENHKKFYCSELHGPKTKVAMR----EPEH
          . ::. . .:...::. :  ::.: .:.: :::.:::::.  :   :      : :.
CCDS44 ---KTKKGLKTKGVIYECNICGARYKKRDNYEAHKKYYCSELQIAKPISAGTHTSPEAEK
                 640       650       660       670       680       

    1000      1010      1020      1030      1040      1050         
pF1KE0 SPVPGGLQPQILHYRVAGSSGIWEQTPQIRKRRKMKSVGDDEELQQNESGTSPKSSEGLQ
       : .      :..::.. :..   : :: .::::: ::.::.::    ::  :  .: :  
CCDS44 SQIEHEPWSQMMHYKL-GTT--LELTP-LRKRRKEKSLGDEEEPPAFESTKSQFGSPG--
       690       700          710        720       730       740   

    1060      1070      1080      1090      1100      1110         
pF1KE0 FQNALGCNPSLPKHNVTIRSDQQHKNIQLQNSHIHLVARGPEQTMDPKLSTIMEQQISSA
               ::   .:. ..: ..  . . .   .    .::   ..:.       . .:.
CCDS44 --------PSDAARNLPLESTKSPAEPSKSVPSL----EGPTG-FQPRTP-----KPGSG
                     750       760           770             780   

    1120      1130      1140      1150      1160      1170         
pF1KE0 AQDKIELQRHGTGISVIQHTNSLSRPNSFDKPEPFERASPVSFQELNRTGKSGSLKVIGI
       ...  : .  .  :::::::.:. . .:...:  .:             :..  :     
CCDS44 SESGKERRTTSKEISVIQHTSSFEKSDSLEQPSGLE-------------GEDKPL-----
           790       800       810                    820          

    1180      1190      1200      1210      1220      1230         
pF1KE0 SQEESHPSRDGSHPHQLALSDALRGELQESSRKSPSERHVLGQPSRLVRQHNIQVPEILV
       .:  : :      ::               .:..    : : :: .:::: :::::::::
CCDS44 AQFPSPPPA----PH---------------GRSA----HSL-QP-KLVRQPNIQVPEILV
         830                          840             850       860

    1240       1250        1260      1270      1280      1290      
pF1KE0 TEEPDR-DLEAQC--HDQEKSEKFSWPQRSETLSKLPTEKLPPKKKRLRLAEIEHSSTES
       :::::: : : .   .. ::.:.:.:::::.::..::.::::::::::::::. .:: ::
CCDS44 TEEPDRPDTEPEPPPKEPEKTEEFQWPQRSQTLAQLPAEKLPPKKKRLRLAEMAQSSGES
              870       880       890       900       910       920

       1300        1310       1320      1330       1340      1350  
pF1KE0 SFDST--LSRSLSRESSLSHT-SSFSASLDIEDVSKTEA-SPKIDFLNKAEFLMIPAGLN
       ::.:.  :::: :.::..: . :: :::.. .: .:.:: ::. :.  :      : : .
CCDS44 SFESSVPLSRSPSQESNVSLSGSSRSASFERDDHGKAEAPSPSSDMRPK------PLGTH
              930       940       950       960             970    

           1360         1370      1380      1390      1400         
pF1KE0 TLNVPGCH---REMRRTASEQINCTQTSMEVSDLRSKSFDCGSITPPQTTPLTELQPPSS
        :.::. :   :::::.::::   .. : .... :::::: ::..         :  ::.
CCDS44 MLTVPSHHPHAREMRRSASEQSPNVSHSAHMTETRSKSFDYGSLS---------LTGPSA
          980       990      1000      1010               1020     

    1410      1420      1430      1440      1450      1460         
pF1KE0 PSRVGVTGHVPLLERRRGPLVRQISLNIAPDSHLSPVHPTSFQNTALPSVNAVPYQGPQL
       :. :.  ..:   :::.  :::: ::.  :.:.:  : : . :..  :.    : ..   
CCDS44 PAPVAPPARVAPPERRKCFLVRQASLSRPPESELE-VAPKGRQESEEPQ----PSSSKPS
        1030      1040      1050      1060       1070          1080

    1470       1480           1490         1500        1510        
pF1KE0 TSTSLAEFS-ANTLHS-----QTQVKD---LQAETSNSSSTNVF--PVQQLCDINLLNQI
       ...::...: : : :.     .   .:   :   .  . . .::  :: :     : .. 
CCDS44 AKSSLSQISSAATSHGGPPGGKGPGQDRPPLGPTVPYTEALQVFHHPVAQT---PLHEKP
             1090      1100      1110      1120      1130          

     1520                 1530      1540      1550       1560      
pF1KE0 HAPP-----------SHQSTQLSLQVSTQGSKPDKNSVLSGSSKSEDCF-APKYQLHCQV
       . ::           .:.  :     :::. .   .:  :      . : ::   :.  :
CCDS44 YLPPPVSLFSFQHLVQHEPGQSPEFFSTQAMSSLLSSPYSMPPLPPSLFQAPPLPLQPTV
      1140      1150      1160      1170      1180      1190       

       1570             1580      1590      1600            1610   
pF1KE0 FTSG----PSCSSNPVH---SLPNQVISDPVGTDHCVTSAT-LPTK-----LIDSISNSH
       .  :    :.   .:..     : . .  :  :.  ..:.  :: .      . .  .::
CCDS44 LHPGQLHLPQLMPHPANIPFRQPPSFLPMPYPTSSALSSGFFLPLQSQFALQLPGDVESH
      1200      1210      1220      1230      1240      1250       

                                     1620            1630          
pF1KE0 ---------PL------------------LPPELRPLGSQVQK------VPS------SF
                ::                  :::   : .:..        .:.      :.
CCDS44 LPQIKTSLAPLATGSAGLSPSTEYSSDIRLPPVAPPASSSAPTSAPPLALPACPDTMVSL
      1260      1270      1280      1290      1300      1310       

         1640      1650      1660                1670      1680    
pF1KE0 MLPIRLQSSVPAYCFATLTSLPQILVTQD--------LPN--QPICQTNHSVVPISEEQN
       ..:.:.:...:.:  :  :.: ::::::.        ::.  .:  . .       .: .
CCDS44 VVPVRVQTNMPSYGSAMYTTLSQILVTQSQGSSATVALPKFEEPPSKGTTVCGADVHEVG
      1320      1330      1340      1350      1360      1370       

          1690      1700      1710      1720      1730      1740   
pF1KE0 SVPT-LQKGHQNALPNPEKEFLCENVFSEMSQNSSLSESLPITQKISVGRLSPQQESSAS
         :. :.. .. :.:.:   .:   :     ...:::         :.  :  .. ....
CCDS44 PGPSGLSEEQSRAFPTP---YLRVPVTLPERKGTSLSSE-------SILSLEGSSSTAGG
      1380      1390         1400      1410             1420       

          1750       1760      1770      1780      1790      1800  
pF1KE0 SKRMLSPANSLDIAME-KHQKRAKDENGAVCATDVRPLEALSSRVNEASKQKKPILVRQV
       :::.::::.::...:: ..:::.:.:.              .:...:  .  ::    .:
CCDS44 SKRVLSPAGSLELTMETQQQKRVKEEE--------------ASKADEKLELVKPC---SV
      1430      1440      1450                    1460         1470

           1810      1820      1830      1840      1850      1860  
pF1KE0 CTTEPLDGVMLEKDVFSQPEISNEAVNLTNVLPADNSSTGCSKFVVIEPISELQEFENIK
         :   ::   ::. ...   . . ... . : .: :.:   : .   :   :..     
CCDS44 VLTSTEDGKRPEKSHLGNQGQGRRELEMLSSLSSDPSDT---KEIPPLPHPALSH-----
             1480      1490      1500         1510      1520       

           1870      1880           1890      1900      1910       
pF1KE0 SSTSLTLTVRSSPAPSENTH---ISPL--KCTDNNQERKSPGVKNQGDKVNIQEQSQQPV
       ...  . ...  : :: . :   ..::  :  :....   :..   .. . ..: :..:.
CCDS44 GTAPGSEALKEYPQPSGKPHRRGLTPLSVKKEDSKEQPDLPSLAPPSS-LPLSETSSRPA
           1530      1540      1550      1560      1570       1580 

      1920      1930      1940      1950      1960      1970       
pF1KE0 TSLSLFNIKDTQQLAFPSLKTTTNFTWCYLLRQKSLHLPQKDQKTSAYTDWTVSASNPNP
        :    . : . :  ::::.:::: .::::   :  :. . :...:.:. : .:  ::: 
CCDS44 KSQEGTDSKKVLQ--FPSLHTTTNVSWCYLNYIKPNHIQHADRRSSVYAGWCISLYNPNL
            1590        1600      1610      1620      1630         

      1980      1990      2000      2010      2020      2030       
pF1KE0 LGLPTKVALALLNSKQNTGKSLYCQAITTHSKSDLLVYSSKWKSSLSKRALGNQKSTVVE
        :. ::.::.:: :::...:  : .: . : ..  :: ::. :  ...  :    : :  
CCDS44 PGVSTKAALSLLRSKQKVSKETYTMATAPHPEAGRLVPSSSRKPRMTEVHL---PSLVSP
    1640      1650      1660      1670      1680      1690         

      2040      2050             2060      2070      2080      2090
pF1KE0 FSNKDASEINSEQDKEN-------SLIKSEPRRIKIFDGGYKSNEEYVYVRGRGRGKYIC
        ..:: .....:.....       .  ..:: :::::.::::::::::::::::::::.:
CCDS44 EGQKDLARVEKEEERRGEPEEDAPASQRGEPARIKIFEGGYKSNEEYVYVRGRGRGKYVC
       1700      1710      1720      1730      1740      1750      

             2100      2110      2120      2130      2140          
pF1KE0 EECGIRCKKPSMLKKHIRTHTDVRPYHCTYCNFSFKTKGNLTKHMKSKAHSKKCVDLGV-
       :::::::::::::::::::::::::: : .:.:.:::::::::::::::::::: . :: 
CCDS44 EECGIRCKKPSMLKKHIRTHTDVRPYVCKHCHFAFKTKGNLTKHMKSKAHSKKCQETGVL
       1760      1770      1780      1790      1800      1810      

         2150        2160      2170      2180      2190      2200  
pF1KE0 -----SVGLIDE--QDTEESDEKQRFSYERSGYDLEESDGPDEDDNENEDDDEDSQAESV
              :  :.  ::.: . : ..   :..  :::.::. : : .:.::.::. .... 
CCDS44 EELEAEEGTSDDLFQDSE-GREGSEAVEEHQFSDLEDSDS-DSDLDEDEDEDEE-ESQDE
       1820      1830       1840      1850       1860       1870   

           2210           2220      2230      2240      2250       
pF1KE0 LSATPSVTASPQHLP-----SRSSLQDPVSTDEDVRITDCFSGVHTDPMDVLPRALLTRM
       ::  ::  : :   :     . : .  :   :  .  :.   :  ..  .        :.
CCDS44 LS-RPSSEAPPPGPPHALRADSSPILGPQPPDAPASGTEATRGSSVSEAE--------RL
           1880      1890      1900      1910      1920            

      2260      2270      2280      2290      2300      2310       
pF1KE0 TVLSTAQSDYNRKTLSPGKARQRAARDENDTIPSVDTSRSPCHQMSVDYPESEEILRSSM
       :. : ..:. .   : :  .    .  :.::  ..  : .:        : .:   :  .
CCDS44 TASSCSMSSQSMPGL-PWLGPAPLGSVEKDTGSAL--SYKPVSPRRPWSPSKEAGSRPPL
         1930       1940      1950        1960      1970      1980 

      2320      2330            2340        2350      2360         
pF1KE0 AGKAVAITQSPSS------VRLPPAAAEHSP--QTAAGMPSVASPHPDPQEQKQQITLQP
       : :  ..:.. ::      .: : :.:   :  ..  :    : :  .:. : . .:: :
CCDS44 ARKH-SLTKNDSSPQRCSPAREPQASAPSPPGLHVDPGRGMGALPCGSPRLQLSPLTLCP
             1990      2000      2010      2020      2030      2040

    2370      2380              2390            2400       2410    
pF1KE0 TPGLPSPHTHLFSHL--------PLHSQQ------QSRTPYNMVPVGGIHVV-PAGLTYS
            .:..:..:.:        : .:        :...:   .: :   .. :.. . .
CCDS44 LGRELAPRAHVLSKLEGTTDPGLPRYSPTRRWSPGQAESPPRSAPPGKWALAGPGSPSAG
             2050      2060      2070      2080      2090      2100

         2420      2430      2440      2450      2460      2470    
pF1KE0 TFVPLQAGPVQLTIPAVSVVHRTLGTHRNTVTEVSGTTNPAGVAELSSVVPCIPIGQIRV
          :  .   .. .: . . :. :.  :.  : .:    :   :: :    : : :    
CCDS44 EHGPGLGLDPRVLFPPAPLPHKLLS--RSPETCAS----PWK-AE-SRSPSCSP-G----
             2110      2120        2130            2140            

         2480      2490      2500      2510      2520      2530    
pF1KE0 PGLQNLSTPGLQSLPSLSMETVNIVGLANTNMAPQVHPPGLALNAVGLQVLTANPSSQSS
       :     . : :.: :  ...  .   :: :.     : :   :..   : ::       .
CCDS44 P-----AHP-LSSRPFSALHDFHGHILARTEENIFSHLP---LHS---QHLT------RA
           2150       2160      2170      2180                     

         2540         2550      2560        2570      2580         
pF1KE0 PAPQAHIPGLQILNI---ALPTLIPSVSQVAVD--AQGAPEMPASQSKACET---QPKQT
       : :   : :.:...    : :::.:. . . :.  . :. .. ... .: :    .: ..
CCDS44 PCPLIPIGGIQMVQARPGAHPTLLPGPTAAWVSGFSGGGSDLTGAR-EAQERGRWSPTES
    2190      2200      2210      2220      2230       2240        

       2590      2600      2610      2620      2630      2640      
pF1KE0 SVASANQVSRTESPQGLPTVQRENAKKVLNPPAPAGDHARLDGLSKMDTEKAASANHVKP
       : ::.. :...             .: .:.    .::. .       . :.....    :
CCDS44 SSASVSPVAKV-------------SKFTLSSELEGGDYPK-------ERERTGGGPGRPP
     2250                   2260      2270             2280        

         2650      2660      2670         2680      2690      2700 
pF1KE0 K--PELTSIQGQPASTSQPLLKAHSEVFTKPSGQ---QTLSPDRQVPRPTALPRRQPTVH
          :. :.  ..:. : .:     . .   :.:.   :. ::  . ::  . :. . :  
CCDS44 DWTPHGTGAPAEPTPTHSPCTPPDT-LPRPPQGRRAAQSWSPRLESPRAPTNPEPSATPP
     2290      2300      2310       2320      2330      2340       

            2710                                                 
pF1KE0 FSDVSSDDDEDRLVIAT                                         
       ..  ::                                                    
CCDS44 LDRSSSVGCLAEASARFPARTRNLSGEPRTRQDSPKPSGSGEPRAHPHQPEDRVPPNA
      2350      2360      2370      2380      2390      2400     

>>CCDS463.1 HIVEP3 gene_id:59269|Hs108|chr1               (2406 aa)
 initn: 1987 init1: 601 opt: 1059  Z-score: 401.1  bits: 88.4 E(32554): 5e-16
Smith-Waterman score: 2649; 31.0% identity (53.5% similar) in 2676 aa overlap (203-2707:1-2354)

            180       190       200       210            220       
pF1KE0 RTDNSECISSHCGTMSPSYTNTAFDVLLKAMEPELSTLSQK---GSPCA--IKTEKLRPN
                                     :.:: :. . :   :::     : : .. .
CCDS46                               MDPEQSVKGTKKAEGSPRKRLTKGEAIQ-T
                                             10        20          

       230       240       250       260       270       280       
pF1KE0 KTARSPPKLKNSSMDAPNQTSQELVAESQSSCTSYTVHMSAAQKNEQGAMQSASHLYHQH
       ... : :   ...  . .. .:::.: .     : ... .. .:. :          .  
CCDS46 SVSSSVPYPGSGTAATQESPAQELLAPQPFPGPSSVLREGSQEKTGQQQKPPKRPPIEAS
      30        40        50        60        70        80         

       290       300       310       320       330       340       
pF1KE0 EHFVPKSNQHNQQLPGCSGFTGSLTNLQNQENAKLEQVYNIAVTSSVGLTSPSSRSQVTP
        : . .  ::    :   .: .     .  :..  . :  .    : ....:.    . :
CCDS46 VH-ISQLPQH----PLTPAFMSPGKPEHLLEGSTWQLVDPMRPGPSGSFVAPG----LHP
      90            100       110       120       130           140

       350       360       370       380       390       400       
pF1KE0 QNQQMDSASPLSISPANSTQSPPMPIYNSTHVASVVNQSVEQMCNLLLKDQKPKKQGKYI
       :.: . : . . : : .    : . .   ..:.   .. ...      :..::.: ::::
CCDS46 QSQLLPSHASI-IPPEDLPGVPKVFVPRPSQVSLKPTEEAHK------KERKPQKPGKYI
              150        160       170       180             190   

       410       420       430       440       450       460       
pF1KE0 CEYCNRACAKPSVLLKHIRSHTGERPYPCVTCGFSFKTKSNLYKHKKSHAHTIKLGLVLQ
       :.::.: ::::::: ::::::::::::::  ::::::::::::::.::::: :: ::.  
CCDS46 CQYCSRPCAKPSVLQKHIRSHTGERPYPCGPCGFSFKTKSNLYKHRKSHAHRIKAGLA--
           200       210       220       230       240       250   

       470       480       490       500       510       520       
pF1KE0 PDAGGLFLSHESPKALSIHSDVEDSGESEEEGATDERQHDLGAMELQPVHIIKRMSNAET
          :: .     :..: ..    .  :   :: . . ... .:   .:...  :    . 
CCDS46 SGMGGEMY----PHGLEMERIPGEEFEEPTEGESTDSEEETSATSGHPAELSPR--PKQP
                 260       270       280       290       300       

       530       540       550       560       570       580       
pF1KE0 LLKSSFTPSSPENVIGDFLLQDRSAESQAVTELPKVVVHHVTVSPLRTDSPKAMDPKPEL
       ::.:..  :. ..   .    ..:. .:.. . :  :         . .: . .. ::: 
CCDS46 LLSSGLYSSGSHSSSHERCSLSQSSTAQSLEDPPPFV---------EPSSEHPLSHKPED
         310       320       330       340                350      

       590       600       610       620       630       640       
pF1KE0 SSAQKQKDLQVTNVQPLSANMSQGGVSRLETNENSHQKGDMNPLEGKQDSHVGTVHAQLQ
       . . :::         :.  .:.                                     
CCDS46 THTIKQK---------LALRLSE-------------------------------------
        360                370                                     

       650       660       670       680       690        700      
pF1KE0 RQQATDYSQEQQGKLLSPRSLGSTDSGYFSRSESADQTVSPPTPFARRLPST-EQDSGRS
       :... :   ::   .::: : :::.::::::::::.: ::::.  :.          :: 
CCDS46 RKKVID---EQA--FLSPGSKGSTESGYFSRSESAEQQVSPPNTNAKSYAEIIFGKCGRI
                   380       390       400       410       420     

        710       720         730       740       750       760    
pF1KE0 NGPSAALVTASTPSALP--TGEKALLLPGQMRPPLATKTLEERISKLISDNEALVDDKQL
       .  .: :...::   ::  : .:  :.:  .  :  :...:. :.:::. :::.:: ...
CCDS46 GQRTAMLTATSTQPLLPLSTEDKPSLVP--LSVP-RTQVIEH-ITKLITINEAVVDTSEI
         430       440       450          460        470       480 

          770       780       790       800       810       820    
pF1KE0 DSVKPRRTSLSRRGSIDSPKSYIFKDSFQFDLKPVGRRTSSSSDIPKSPFTPTEKSKQVF
       :::::::.:::::.:..:::: ....       :.    :: :.  : :    :.:  . 
CCDS46 DSVKPRRSSLSRRSSMESPKSSLYRE-------PL----SSHSEKTK-P----EQS-LLS
             490       500                  510            520     

          830        840       850       860       870       880   
pF1KE0 LLSVPSL-DCLPITRSNSMPTTGYSAVPANIIPPPHPLRGSQSFDDKIGAFYDDVFVSGP
       :   ::    .:. ::.:::... .     :  : ::.::: ::::.:     :  . . 
CCDS46 LQHPPSTAPPVPLLRSHSMPSAACT-----ISTPHHPFRGSYSFDDHI----TDSEALSH
          530       540            550       560           570     

           890       900       910       920       930       940   
pF1KE0 NAPVPQSGHPRTLVRQAAIEDSSANESHVLGTGQSLDESHQGCHAAGEAMSVRSKALAQG
       .. :  : ::: : :: :::   ..:      : :   :..     .. .  . . :.. 
CCDS46 SSHVFTS-HPRMLKRQPAIELPLGGEYSSEEPGPS---SKDTASKPSDEVEPKESELTK-
         580        590       600          610       620       630 

           950       960       970       980       990             
pF1KE0 PHIEKKKSHQGRGTMFECETCRNRYRKLENFENHKKFYCSELHGPKTKVAMR----EPEH
          . ::. . .:...::. :  ::.: .:.: :::.:::::.  :   :      : :.
CCDS46 ---KTKKGLKTKGVIYECNICGARYKKRDNYEAHKKYYCSELQIAKPISAGTHTSPEAEK
                 640       650       660       670       680       

    1000      1010      1020      1030      1040      1050         
pF1KE0 SPVPGGLQPQILHYRVAGSSGIWEQTPQIRKRRKMKSVGDDEELQQNESGTSPKSSEGLQ
       : .      :..::.. :..   : :: .::::: ::.::.::    ::  :  .: :  
CCDS46 SQIEHEPWSQMMHYKL-GTT--LELTP-LRKRRKEKSLGDEEEPPAFESTKSQFGSPG--
       690       700          710        720       730       740   

    1060      1070      1080      1090      1100      1110         
pF1KE0 FQNALGCNPSLPKHNVTIRSDQQHKNIQLQNSHIHLVARGPEQTMDPKLSTIMEQQISSA
               ::   .:. ..: ..  . . .   .    .::   ..:.       . .:.
CCDS46 --------PSDAARNLPLESTKSPAEPSKSVPSL----EGPTG-FQPRTP-----KPGSG
                     750       760           770             780   

    1120      1130      1140      1150      1160      1170         
pF1KE0 AQDKIELQRHGTGISVIQHTNSLSRPNSFDKPEPFERASPVSFQELNRTGKSGSLKVIGI
       ...  : .  .  :::::::.:. . .:...:  .:             :..  :     
CCDS46 SESGKERRTTSKEISVIQHTSSFEKSDSLEQPSGLE-------------GEDKPL-----
           790       800       810                    820          

    1180      1190      1200      1210      1220      1230         
pF1KE0 SQEESHPSRDGSHPHQLALSDALRGELQESSRKSPSERHVLGQPSRLVRQHNIQVPEILV
       .:  : :      ::               .:..    : : :: .:::: :::::::::
CCDS46 AQFPSPPPA----PH---------------GRSA----HSL-QP-KLVRQPNIQVPEILV
         830                          840             850       860

    1240       1250        1260      1270      1280      1290      
pF1KE0 TEEPDR-DLEAQC--HDQEKSEKFSWPQRSETLSKLPTEKLPPKKKRLRLAEIEHSSTES
       :::::: : : .   .. ::.:.:.:::::.::..::.::::::::::::::. .:: ::
CCDS46 TEEPDRPDTEPEPPPKEPEKTEEFQWPQRSQTLAQLPAEKLPPKKKRLRLAEMAQSSGES
              870       880       890       900       910       920

       1300        1310       1320      1330       1340      1350  
pF1KE0 SFDST--LSRSLSRESSLSHT-SSFSASLDIEDVSKTEA-SPKIDFLNKAEFLMIPAGLN
       ::.:.  :::: :.::..: . :: :::.. .: .:.:: ::. :.  :      : : .
CCDS46 SFESSVPLSRSPSQESNVSLSGSSRSASFERDDHGKAEAPSPSSDMRPK------PLGTH
              930       940       950       960             970    

           1360         1370      1380      1390      1400         
pF1KE0 TLNVPGCH---REMRRTASEQINCTQTSMEVSDLRSKSFDCGSITPPQTTPLTELQPPSS
        :.::. :   :::::.::::   .. : .... :::::: ::..         :  ::.
CCDS46 MLTVPSHHPHAREMRRSASEQSPNVSHSAHMTETRSKSFDYGSLS---------LTGPSA
          980       990      1000      1010               1020     

    1410      1420      1430      1440      1450      1460         
pF1KE0 PSRVGVTGHVPLLERRRGPLVRQISLNIAPDSHLSPVHPTSFQNTALPSVNAVPYQGPQL
       :. :.  ..:   :::.  :::: ::.  :.:.:  : : . :..  :.    : ..   
CCDS46 PAPVAPPARVAPPERRKCFLVRQASLSRPPESELE-VAPKGRQESEEPQ----PSSSKPS
        1030      1040      1050      1060       1070          1080

    1470       1480           1490         1500        1510        
pF1KE0 TSTSLAEFS-ANTLHS-----QTQVKD---LQAETSNSSSTNVF--PVQQLCDINLLNQI
       ...::...: : : :.     .   .:   :   .  . . .::  :: :     : .. 
CCDS46 AKSSLSQISSAATSHGGPPGGKGPGQDRPPLGPTVPYTEALQVFHHPVAQT---PLHEKP
             1090      1100      1110      1120      1130          

     1520                 1530      1540      1550       1560      
pF1KE0 HAPP-----------SHQSTQLSLQVSTQGSKPDKNSVLSGSSKSEDCF-APKYQLHCQV
       . ::           .:.  :     :::. .   .:  :      . : ::   :.  :
CCDS46 YLPPPVSLFSFQHLVQHEPGQSPEFFSTQAMSSLLSSPYSMPPLPPSLFQAPPLPLQPTV
      1140      1150      1160      1170      1180      1190       

       1570             1580      1590      1600            1610   
pF1KE0 FTSG----PSCSSNPVH---SLPNQVISDPVGTDHCVTSAT-LPTK-----LIDSISNSH
       .  :    :.   .:..     : . .  :  :.  ..:.  :: .      . .  .::
CCDS46 LHPGQLHLPQLMPHPANIPFRQPPSFLPMPYPTSSALSSGFFLPLQSQFALQLPGDVESH
      1200      1210      1220      1230      1240      1250       

                                     1620            1630          
pF1KE0 ---------PL------------------LPPELRPLGSQVQK------VPS------SF
                ::                  :::   : .:..        .:.      :.
CCDS46 LPQIKTSLAPLATGSAGLSPSTEYSSDIRLPPVAPPASSSAPTSAPPLALPACPDTMVSL
      1260      1270      1280      1290      1300      1310       

         1640      1650      1660                1670      1680    
pF1KE0 MLPIRLQSSVPAYCFATLTSLPQILVTQD--------LPN--QPICQTNHSVVPISEEQN
       ..:.:.:...:.:  :  :.: ::::::.        ::.  .:  . .       .: .
CCDS46 VVPVRVQTNMPSYGSAMYTTLSQILVTQSQGSSATVALPKFEEPPSKGTTVCGADVHEVG
      1320      1330      1340      1350      1360      1370       

          1690      1700      1710      1720      1730      1740   
pF1KE0 SVPT-LQKGHQNALPNPEKEFLCENVFSEMSQNSSLSESLPITQKISVGRLSPQQESSAS
         :. :.. .. :.:.:   .:   :     ...:::         :.  :  .. ....
CCDS46 PGPSGLSEEQSRAFPTP---YLRVPVTLPERKGTSLSSE-------SILSLEGSSSTAGG
      1380      1390         1400      1410             1420       

          1750       1760      1770      1780      1790      1800  
pF1KE0 SKRMLSPANSLDIAME-KHQKRAKDENGAVCATDVRPLEALSSRVNEASKQKKPILVRQV
       :::.::::.::...:: ..:::.:.:.              .:...:  .  ::    .:
CCDS46 SKRVLSPAGSLELTMETQQQKRVKEEE--------------ASKADEKLELVKPC---SV
      1430      1440      1450                    1460         1470

           1810      1820      1830      1840      1850      1860  
pF1KE0 CTTEPLDGVMLEKDVFSQPEISNEAVNLTNVLPADNSSTGCSKFVVIEPISELQEFENIK
         :   ::   ::. ...   . . ... . : .: :.:   : .   :   :..     
CCDS46 VLTSTEDGKRPEKSHLGNQGQGRRELEMLSSLSSDPSDT---KEIPPLPHPALSH-----
             1480      1490      1500         1510      1520       

           1870      1880           1890      1900      1910       
pF1KE0 SSTSLTLTVRSSPAPSENTH---ISPL--KCTDNNQERKSPGVKNQGDKVNIQEQSQQPV
       ...  . ...  : :: . :   ..::  :  :....   :..   .. . ..: :..:.
CCDS46 GTAPGSEALKEYPQPSGKPHRRGLTPLSVKKEDSKEQPDLPSLAPPSS-LPLSETSSRPA
           1530      1540      1550      1560      1570       1580 

      1920      1930      1940      1950      1960      1970       
pF1KE0 TSLSLFNIKDTQQLAFPSLKTTTNFTWCYLLRQKSLHLPQKDQKTSAYTDWTVSASNPNP
        :    . : . :  ::::.:::: .::::   :  :. . :...:.:. : .:  ::: 
CCDS46 KSQEGTDSKKVLQ--FPSLHTTTNVSWCYLNYIKPNHIQHADRRSSVYAGWCISLYNPNL
            1590        1600      1610      1620      1630         

      1980      1990      2000      2010      2020      2030       
pF1KE0 LGLPTKVALALLNSKQNTGKSLYCQAITTHSKSDLLVYSSKWKSSLSKRALGNQKSTVVE
        :. ::.::.:: :::...:  : .: . : ..  :: ::. :  ...  :    : :  
CCDS46 PGVSTKAALSLLRSKQKVSKETYTMATAPHPEAGRLVPSSSRKPRMTEVHL---PSLVSP
    1640      1650      1660      1670      1680      1690         

      2040      2050             2060      2070      2080      2090
pF1KE0 FSNKDASEINSEQDKEN-------SLIKSEPRRIKIFDGGYKSNEEYVYVRGRGRGKYIC
        ..:: .....:.....       .  ..:: :::::.::::::::::::::::::::.:
CCDS46 EGQKDLARVEKEEERRGEPEEDAPASQRGEPARIKIFEGGYKSNEEYVYVRGRGRGKYVC
       1700      1710      1720      1730      1740      1750      

             2100      2110      2120      2130      2140          
pF1KE0 EECGIRCKKPSMLKKHIRTHTDVRPYHCTYCNFSFKTKGNLTKHMKSKAHSKKCVDLGV-
       :::::::::::::::::::::::::: : .:.:.:::::::::::::::::::: . :: 
CCDS46 EECGIRCKKPSMLKKHIRTHTDVRPYVCKHCHFAFKTKGNLTKHMKSKAHSKKCQETGVL
       1760      1770      1780      1790      1800      1810      

         2150        2160      2170      2180      2190      2200  
pF1KE0 -----SVGLIDE--QDTEESDEKQRFSYERSGYDLEESDGPDEDDNENEDDDEDSQAESV
              :  :.  ::.: . : ..   :..  :::.::. : : .:.::.::. .... 
CCDS46 EELEAEEGTSDDLFQDSE-GREGSEAVEEHQFSDLEDSDS-DSDLDEDEDEDEE-ESQDE
       1820      1830       1840      1850       1860       1870   

           2210           2220      2230      2240      2250       
pF1KE0 LSATPSVTASPQHLP-----SRSSLQDPVSTDEDVRITDCFSGVHTDPMDVLPRALLTRM
       ::  ::  : :   :     . : .  :   :  .  :.   :  ..  .        :.
CCDS46 LS-RPSSEAPPPGPPHALRADSSPILGPQPPDAPASGTEATRGSSVSEAE--------RL
           1880      1890      1900      1910      1920            

      2260      2270      2280      2290      2300      2310       
pF1KE0 TVLSTAQSDYNRKTLSPGKARQRAARDENDTIPSVDTSRSPCHQMSVDYPESEEILRSSM
       :. : ..:. .   : :  .    .  :.::  ..  : .:        : .:   :  .
CCDS46 TASSCSMSSQSMPGL-PWLGPAPLGSVEKDTGSAL--SYKPVSPRRPWSPSKEAGSRPPL
         1930       1940      1950        1960      1970      1980 

      2320      2330            2340        2350      2360         
pF1KE0 AGKAVAITQSPSS------VRLPPAAAEHSP--QTAAGMPSVASPHPDPQEQKQQITLQP
       : :  ..:.. ::      .: : :.:   :  ..  :    : :  .:. : . .:: :
CCDS46 ARKH-SLTKNDSSPQRCSPAREPQASAPSPPGLHVDPGRGMGALPCGSPRLQLSPLTLCP
             1990      2000      2010      2020      2030      2040

    2370      2380              2390            2400       2410    
pF1KE0 TPGLPSPHTHLFSHL--------PLHSQQ------QSRTPYNMVPVGGIHVV-PAGLTYS
            .:..:..:.:        : .:        :...:   .: :   .. :.. . .
CCDS46 LGRELAPRAHVLSKLEGTTDPGLPRYSPTRRWSPGQAESPPRSAPPGKWALAGPGSPSAG
             2050      2060      2070      2080      2090      2100

         2420      2430      2440      2450      2460      2470    
pF1KE0 TFVPLQAGPVQLTIPAVSVVHRTLGTHRNTVTEVSGTTNPAGVAELSSVVPCIPIGQIRV
          :  .   .. .: . . :. :.  :.  : .:    :   :: :    : : :    
CCDS46 EHGPGLGLDPRVLFPPAPLPHKLLS--RSPETCAS----PWQKAE-SRSPSCSP-G----
             2110      2120        2130           2140             

         2480      2490      2500      2510      2520      2530    
pF1KE0 PGLQNLSTPGLQSLPSLSMETVNIVGLANTNMAPQVHPPGLALNAVGLQVLTANPSSQSS
       :     . : :.: :  ...  .   :: :.     : :   :..   : ::       .
CCDS46 P-----AHP-LSSRPFSALHDFHGHILARTEENIFSHLP---LHS---QHLT------RA
          2150       2160      2170      2180                  2190

         2540         2550      2560        2570      2580         
pF1KE0 PAPQAHIPGLQILNI---ALPTLIPSVSQVAVD--AQGAPEMPASQSKACET---QPKQT
       : :   : :.:...    : :::.:. . . :.  . :. .. ... .: :    .: ..
CCDS46 PCPLIPIGGIQMVQARPGAHPTLLPGPTAAWVSGFSGGGSDLTGAR-EAQERGRWSPTES
             2200      2210      2220      2230       2240         

       2590      2600      2610      2620      2630      2640      
pF1KE0 SVASANQVSRTESPQGLPTVQRENAKKVLNPPAPAGDHARLDGLSKMDTEKAASANHVKP
       : ::.. :...             .: .:.    .::. .       . :.....    :
CCDS46 SSASVSPVAKV-------------SKFTLSSELEGGDYPK-------ERERTGGGPGRPP
    2250      2260                   2270             2280         

         2650      2660      2670         2680      2690      2700 
pF1KE0 K--PELTSIQGQPASTSQPLLKAHSEVFTKPSGQ---QTLSPDRQVPRPTALPRRQPTVH
          :. :.  ..:. : .:     . .   :.:.   :. ::  . ::  . :. . :  
CCDS46 DWTPHGTGAPAEPTPTHSPCTPPDT-LPRPPQGRRAAQSWSPRLESPRAPTNPEPSATPP
    2290      2300      2310       2320      2330      2340        

            2710                                                 
pF1KE0 FSDVSSDDDEDRLVIAT                                         
       ..  ::                                                    
CCDS46 LDRSSSVGCLAEASARFPARTRNLSGEPRTRQDSPKPSGSGEPRAHPHQPEDRVPPNA
     2350      2360      2370      2380      2390      2400      

>>CCDS43510.1 HIVEP2 gene_id:3097|Hs108|chr6              (2446 aa)
 initn: 1923 init1: 629 opt: 934  Z-score: 356.4  bits: 80.2 E(32554): 1.6e-13
Smith-Waterman score: 2750; 32.5% identity (55.1% similar) in 2437 aa overlap (247-2426:3-2257)

        220       230       240       250       260       270      
pF1KE0 CAIKTEKLRPNKTARSPPKLKNSSMDAPNQTSQELVAESQSSCTSYTVHMSAAQKNEQGA
                                     :..  .... .: .. : . :.  ..::.:
CCDS43                             MDTGDTALGQKATSRSGETDKASGRWRQEQSA
                                           10        20        30  

            280       290         300       310       320          
pF1KE0 ---MQS-ASHLYHQHEHFVPKS--NQHNQQLPGCSGFTGSLTNLQNQENAKL-----EQV
          :.. .::  ... .. :..  :  . :: : ::  .: ... .:   :       . 
CCDS43 VIKMSTFGSHEGQRQPQIEPEQIGNTASAQLFG-SGKLASPSEVVQQVAEKQYPPHRPSP
             40        50        60         70        80        90 

         330        340       350       360          370           
pF1KE0 YNIAVTSSVGLTS-PSSRSQVTPQNQQMDSASPLSISPANSTQSP---PMPI------YN
       :.   . :    : :..  . :  .:....   :  .:  :. :    :.::      : 
CCDS43 YSCQHSLSFPQHSLPQGVMHSTKPHQSLEGPPWLFPGPLPSVASEDLFPFPIHGHSGGYP
             100       110       120       130       140       150 

         380              390       400       410       420        
pF1KE0 STHVASV-------VNQSVEQMCNLLLKDQKPKKQGKYICEYCNRACAKPSVLLKHIRSH
         ...:.        ..:.::  .   :..:::: ::::: ::.::::::::: ::::::
CCDS43 RKKISSLNPAYSQYSQKSIEQAEEAHKKEHKPKKPGKYICPYCSRACAKPSVLKKHIRSH
             160       170       180       190       200       210 

      430       440       450       460       470          480     
pF1KE0 TGERPYPCVTCGFSFKTKSNLYKHKKSHAHTIKLGLVLQPDAGGLFLSHES---PKALSI
       ::::::::. ::::::::::::::.:::::.:: :::   ...   :. :.        :
CCDS43 TGERPYPCIPCGFSFKTKSNLYKHRKSHAHAIKAGLVPFTESAVSKLDLEAGFIDVEAEI
             220       230       240       250       260       270 

         490       500        510       520       530       540    
pF1KE0 HSDVEDSGESEEEGATDERQHD-LGAMELQPVHIIKRMSNAETLLKSSFTPSSPENVIGD
       ::: :.: ...::..   .  : ..     :. : .:         ...  :  :.. : 
CCDS43 HSDGEQSTDTDEESSLFAEASDKMSPGPPIPLDIASR---------GGYHGSLEESLGGP
             280       290       300                310       320  

          550       560       570       580       590       600    
pF1KE0 FLLQDRSAESQAVTELPKVVVHHVTVSPLRTDSPKAMDPKPELSSAQKQKDLQVTNVQPL
       .             ..: ...            ::.  : :. ::     :.      : 
CCDS43 M-------------KVPILII------------PKSGIPLPNESSQYIGPDML-----P-
                         330                   340       350       

          610       620       630       640       650       660    
pF1KE0 SANMSQGGVSRLETNENSHQKGDMNPLEGKQDSHVGTVHAQLQRQQATDYSQEQQGKLLS
                     : . . :.:        :::.   .  :. ..    ..: . .:::
CCDS43 --------------NPSLNTKAD--------DSHTVKQKLALRLSEKKGQDSEPSLNLLS
                           360               370       380         

          670       680       690       700       710        720   
pF1KE0 PRSLGSTDSGYFSRSESADQTVSPPTPFARRLPSTEQDSGRSNGPSAAL-VTASTPSALP
       :.: ::::::::::::::.: .:::.  :.        .    .:  :: ::...     
CCDS43 PHSKGSTDSGYFSRSESAEQQISPPNTNAKSYEEIIFGKYCRLSPRNALSVTTTSQERAA
     390       400       410       420       430       440         

           730        740       750       760       770       780  
pF1KE0 TGEKALLLP-GQMRPPLATKTLEERISKLISDNEALVDDKQLDSVKPRRTSLSRRGSIDS
        :.:... :  ..   : .: .:. .:.:: ..          .: : .::. .  ...:
CCDS43 MGRKGIMEPLPHVNTRLDVKMFEDPVSQLIPSK---------GDVDPSQTSMLKSTKFNS
     450       460       470       480                490       500

            790       800       810       820       830       840  
pF1KE0 PKSYIFKDSFQFDLKPVGRRTSSSSDIPKSPFTPTEKSKQVFLLSVPSLDCLPITRSNSM
              .: : .. : . :. ..  .  . :   . :. : :: .: .:  :. ::::.
CCDS43 -------ESRQPQIIPSSIRNEGK--LYPANF---QGSNPV-LLEAP-VDSSPLIRSNSV
                     510         520           530        540      

            850       860       870       880       890       900  
pF1KE0 PTTGYSAVPANIIPPPHPLRGSQSFDDKIGAFYDDVFVSGPNAPVPQSGHPRTLVRQAAI
       ::.  ::.  :.  ::  ::::.:::... .  ::::  :  .  ::    : : ::::.
CCDS43 PTS--SAT--NLTIPPS-LRGSHSFDERMTG-SDDVFYPGTVGIPPQ----RMLRRQAAF
          550          560       570        580           590      

            910       920       930       940       950       960  
pF1KE0 EDSSANESHVLGTGQSLDESHQGCHAAGEAMSVRSKALAQGPHIEKKKSHQGRGTMFECE
       :  :..:.::       .  :.:    :    . :..:      ..::   :  . .. .
CCDS43 ELPSVQEGHV-------EVEHHGRMLKG----ISSSSL------KEKKLSPGDRVGYDYD
        600              610           620             630         

            970       980       990      1000         1010         
pF1KE0 TCRNRYRKLENFENHKKFYCSELHGPKTKVAMREPEHSPVPGG---LQPQILHYRVAGSS
       .::. :.: :. :. :. :       .    .   .:    ::   ..: .    . :  
CCDS43 VCRKPYKKWEDSETPKQNY-------RDISCLSSLKH----GGEYFMDPVV---PLQGVP
     640       650              660           670          680     

    1020      1030      1040      1050      1060      1070         
pF1KE0 GIWEQTPQIRKRRKMKSVGDDEELQQNESGTSPKSSEGLQFQNALGCNPSLPKHNVTIRS
       ...  : . ::::: :::::.:.  .  :.   ..  :..   :   .:.: . .  .::
CCDS43 SMFGTTCENRKRRKEKSVGDEEDTPMICSSIV-STPVGIM---ASDYDPKL-QMQEGVRS
         690       700       710        720          730        740

    1080         1090      1100        1110      1120          1130
pF1KE0 D---QQHKNIQLQNSHIHLVARGP--EQTMDPKLSTIMEQQISSAAQDKI-EL---QRHG
             :.:.    :: :     :   : .  . : . :.. :.  .::. .:   .  :
CCDS43 GFAMAGHENL----SHGHTERFDPCRPQLQPGSPSLVSEESPSAIDSDKMSDLGGRKPPG
              750           760       770       780       790      

             1140      1150      1160      1170       1180         
pF1KE0 TGISVIQHTNSLSRPNSFDKPEPFERASPVSFQELNRTGKSGS-LKVIGISQEESHPSRD
       . ::::::::::::::::.. :  : .. .. .  . .    : ..   .: : . :. :
CCDS43 NVISVIQHTNSLSRPNSFERSESAELVACTQDKAPSPSETCDSEISEAPVSPEWAPPG-D
        800       810       820       830       840       850      

    1190      1200      1210      1220      1230      1240         
pF1KE0 GSHPHQLALSDALRGELQESSRKSPSERHVLGQPSRLVRQHNIQVPEILVTEEPDR---D
       :..           :. . :.. . .  :.  :: ::::::::::::: ::::::.   .
CCDS43 GAESG---------GKPSPSQQVQQQSYHT--QP-RLVRQHNIQVPEIRVTEEPDKPEKE
         860                870          880       890       900   

       1250       1260      1270      1280      1290      1300     
pF1KE0 LEAQCHDQEKS-EKFSWPQRSETLSKLPTEKLPPKKKRLRLAEIEHSSTESSFDST---L
        ::: .. ::  :.:.:::::::::.::.:::::::::::::..:::: ::::.::   :
CCDS43 KEAQSKEPEKPVEEFQWPQRSETLSQLPAEKLPPKKKRLRLADMEHSSGESSFESTGTGL
           910       920       930       940       950       960   

           1310      1320      1330      1340       1350      1360 
pF1KE0 SRSLSRESSLSHTSSFSASLDIEDVSKTEASPKIDFLNK-AEFLMIPAGLNTLNVPGCH-
       ::: :.::.:::.:::: :.. :..::  : :: : ..: .::: .:::  .:.::: : 
CCDS43 SRSPSQESNLSHSSSFSMSFEREETSKLSALPKQDEFGKHSEFLTVPAGSYSLSVPGHHH
           970       980       990      1000      1010      1020   

              1370      1380      1390      1400       1410        
pF1KE0 -REMRRTASEQINCTQTSMEVSDLRSKSFDCGSITPPQTTPLTELQPPS-SPSRVGVTGH
        .:::: .:::. : . . :: ..:::::: :...    .:..     . ::::      
CCDS43 QKEMRRCSSEQMPCPHPA-EVPEVRSKSFDYGNLSH---APVSGAAASTVSPSR------
          1030      1040       1050         1060      1070         

     1420      1430      1440       1450      1460          1470   
pF1KE0 VPLLERRRGPLVRQISLNIAPDSHLSPV-HPTSFQNTALPSVNAVP----YQGPQLTSTS
           ::..  :::: :.. .:.   . :    : ..  :  ..:      ..::  .   
CCDS43 ----ERKKCFLVRQASFSGSPEISQGEVGMDQSVKQEQLEHLHAGLRSGWHHGPPAVLPP
              1080      1090      1100      1110      1120         

                       1480       1490      1500      1510         
pF1KE0 LAE-------------FSANTLH-SQTQVKDLQAETSNSSSTNVFPVQQLCDINLLNQIH
       : .             .:.. :: .: :.  .... :  .   . :.. . . .: .: :
CCDS43 LQQEDPGKQVAGPCPPLSSGPLHLAQPQIMHMDSQESLRNPL-IQPTSYMTSKHLPEQPH
    1130      1140      1150      1160      1170       1180        

    1520      1530        1540      1550         1560      1570    
pF1KE0 APPSHQSTQLS-LQVST-QGSKPDKNSVLSGSSKS---EDCFAPKYQLHCQVFTSGPSC-
         : ...  .: .: .  : . :    :   ...    .  :   .  : :   . ::  
CCDS43 LFPHQETIPFSPIQNALFQFQYPTVCMVHLPAQQPPWWQAHFPHPFAQHPQKSYGKPSFQ
     1190      1200      1210      1220      1230      1240        

              1580      1590             1600           1610       
pF1KE0 ----SSNPVHSLPNQVISDPVGTDH-------CVTSAT--LPTKLID---SISNSHPLLP
           :: :.. . ... . :.   :       : ..:.   : .:.    : ..:.    
CCDS43 TEIHSSYPLEHVAEHTGKKPAEYAHTKEQTYPCYSGASGLHPKNLLPKFPSDQSSKSTET
     1250      1260      1270      1280      1290      1300        

      1620              1630      1640      1650      1660         
pF1KE0 PELRPL--------GSQVQKVPSSFMLPIRLQSSVPAYCFATLTSLPQILVTQDLPNQPI
       :  . :        ....:..:.. ..:.:.:. ::.:  .  ::. :::  :. :   :
CCDS43 PSEQVLQEDFASANAGSLQSLPGT-VVPVRIQTHVPSYGSVMYTSISQIL-GQNSPAIVI
     1310      1320      1330       1340      1350       1360      

    1670      1680      1690      1700      1710      1720         
pF1KE0 CQTNHSVVPISEEQNSVPTLQKGHQNALPNPEKEFLCENVFSEMSQNSSLSESLPITQKI
       :.......  .   :..  .:    :       . : ...  :     .  ..::.  . 
CCDS43 CKVDENMTQRTLVTNAA--MQGIGFNI-----AQVLGQHAGLEKYPIWKAPQTLPLGLES
       1370      1380        1390           1400      1410         

    1730      1740          1750       1760        1770      1780  
pF1KE0 SVGRLSPQQESSAS----SKRMLSPANSLDIAME-KHQKRAKDEN--GAVCATDVRPLEA
       :.    :.  .:..    ::::::::.::.. :: :.:::.:.:.  : . . ..  .: 
CCDS43 SIPLCLPSTSDSVATLGGSKRMLSPASSLELFMETKQQKRVKEEKMYGQI-VEELSAVEL
    1420      1430      1440      1450      1460       1470        

            1790      1800      1810      1820        1830         
pF1KE0 LSSRVN-EASKQKKPILVRQVCTTEPLDGVMLEKDVFSQ--PEISNEAVNLTN-----VL
        .: .. . :. .:: :::: :..:: ::..  .. ::.  :  :..  ...       :
CCDS43 TNSDIKKDLSRPQKPQLVRQGCASEPKDGLQSGSSSFSSLSPSSSQDYPSVSPSSREPFL
     1480      1490      1500      1510      1520      1530        

         1840      1850      1860      1870      1880      1890    
pF1KE0 PADNSSTGCSKFVVIEPISELQEFENIKSSTSLTLTVRSSPAPSENTHISPLKCTDNNQE
       :. .  .:    .  .  :     :. .::  : .   .:   : . . : :   :.. :
CCDS43 PSKEMLSGSRAPLPGQKSS--GPSESKESSDELDIDETASDM-SMSPQSSSLPAGDGQLE
     1540      1550        1560      1570       1580      1590     

         1900       1910        1920      1930       1940      1950
pF1KE0 RKSPGVKNQ-GDKVNIQEQSQQPV--TSLSLFNIKDTQQ-LAFPSLKTTTNFTWCYLLRQ
       ... : :   :  : .    .  :  ..: : .. : :: : ::::.:::. .::.:   
CCDS43 EEGKGHKRPVGMLVRMASAPSGNVADSTLLLTDMADFQQILQFPSLRTTTTVSWCFLNYT
        1600      1610      1620      1630      1640      1650     

             1960      1970      1980      1990      2000      2010
pF1KE0 KSLHLPQKDQKTSAYTDWTVSASNPNPLGLPTKVALALLNSKQNTGKSLYCQAITTHSKS
       :  .. :   :.:.:..: .:. :::: :: ::..:::: :::.    .:  :   .  .
CCDS43 KPNYVQQATFKSSVYASWCISSCNPNPSGLNTKTTLALLRSKQKITAEIYTLAAMHRPGT
        1660      1670      1680      1690      1700      1710     

             2020           2030       2040      2050      2060    
pF1KE0 DLLVYSSKWK--SSLSKRA---LGNQ-KSTVVEFSNKDASEINSEQDKENSLIKSEPRRI
         :. :: ::  ....  :   .:.. .  .:    :. .. . . ::. .  ..:: ::
CCDS43 GKLTSSSAWKQFTQMKPDASFLFGSKLERKLVGNILKERGKGDIHGDKDIGSKQTEPIRI
        1720      1730      1740      1750      1760      1770     

         2070      2080      2090      2100      2110      2120    
pF1KE0 KIFDGGYKSNEEYVYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYHCTYCNFS
       :::.:::::::.:::::::::::::::::::::::::::::::::::::::: :  :::.
CCDS43 KIFEGGYKSNEDYVYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYVCKLCNFA
        1780      1790      1800      1810      1820      1830     

         2130      2140      2150      2160               2170     
pF1KE0 FKTKGNLTKHMKSKAHSKKCVDLGVSVGLIDEQDTEESD---------EKQRFSYERSGY
       :::::::::::::::: :::..::::.  .:. .:::..         ::. .:   . .
CCDS43 FKTKGNLTKHMKSKAHMKKCLELGVSMTSVDDTETEEAENLEDLHKAAEKHSMSSISTDH
        1840      1850      1860      1870      1880      1890     

           2180      2190                 2200             2210    
pF1KE0 ---DLEESDGPDEDDNENEDDDED-----------SQAESV------LSATP-SVTASPQ
          : ::::: : :::...:.:::           ....:.      .:. : .: : :.
CCDS43 QFSDAEESDGEDGDDNDDDDEDEDDFDDQGDLTPKTRSRSTSPQPPRFSSLPVNVGAVPH
        1900      1910      1920      1930      1940      1950     

         2220                          2230         2240           
pF1KE0 HLPSRSSL--------------------QDPVSTDEDVRITD---CFSGVHTD--P----
        .:: :::                    . : .. ::...:.    :..  ::  :    
CCDS43 GVPSDSSLGHSSLISYLVTLPSIRVTQLMTPSDSCEDTQMTEYQRLFQSKSTDSEPDKDR
        1960      1970      1980      1990      2000      2010     

        2250      2260         2270        2280         2290       
pF1KE0 MDVLPRALLTRMTVLSTAQS---DYNRKTL--SPGKARQRAARDENDT---IPSVDTSR-
       .:. :  .  .  . :  .:   :.. ..   :::   .   ::..     ::. : :  
CCDS43 LDI-PSCMDEECMLPSEPSSSPRDFSPSSHHSSPGYD-SSPCRDNSPKRYLIPKGDLSPR
         2020      2030      2040      2050       2060      2070   

          2300         2310                        2320            
pF1KE0 ---SPCHQMSVDY---PESEEILRSSMA------------------GKAVAITQ--SP--
          :: ...:      :..:  ::  :.                  :: ..  .  ::  
CCDS43 RHLSPRRDLSPMRHLSPRKEAALRREMSQRDVSPRRHLSPRRPVSPGKDITARRDLSPRR
          2080      2090      2100      2110      2120      2130   

          2330        2340           2350      2360                
pF1KE0 -----SSVRLPPA--AAEHSPQTAAGM-----PSVASPHPDPQEQKQQITL---------
            ...: :    :  :.:  . :.     : : .: :. ..   :.           
CCDS43 ERRYMTTIRAPSPRRALYHNPPLSMGQYLQAEPIVLGP-PNLRRGLPQVPYFSLYGDQEG
          2140      2150      2160      2170       2180      2190  

       2370          2380      2390      2400         2410         
pF1KE0 -QPTPG---LP-SPHTHLFSHLPLHSQQQSRTPYNMVPVGGI---HVVPAGLTYSTFVPL
           ::   .: .:. ..::::::::::: :.:  :::::::   : .: .:  :.. : 
CCDS43 AYEHPGSSLFPEGPNDYVFSHLPLHSQQQVRAPIPMVPVGGIQMVHSMPPAL--SSLHPS
           2200      2210      2220      2230      2240        2250

    2420      2430      2440      2450      2460      2470         
pF1KE0 QAGPVQLTIPAVSVVHRTLGTHRNTVTEVSGTTNPAGVAELSSVVPCIPIGQIRVPGLQN
        . :. .                                                     
CCDS43 PTLPLPMEGFEEKKGASGESFSKDPYVLSKQHEKRGPHALQSSGPPSTPSSPRLLMKQST
             2260      2270      2280      2290      2300      2310




2718 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Sat Nov  5 07:02:21 2016 done: Sat Nov  5 07:02:22 2016
 Total Scan time:  8.760 Total Display time:  1.210

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com