Result of FASTA (omim) for pF1KB0056
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB0056, 1533 aa
  1>>>pF1KB0056 1533 - 1533 aa - 1533 aa
Library: /omim/omim.rfq.tfa
  60827320 residues in 85289 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 17.4126+/-0.000504; mu= -31.4118+/- 0.031
 mean_var=852.4858+/-176.494, 0's: 0 Z-trim(125.9): 197  B-trim: 0 in 0/58
 Lambda= 0.043927
 statistics sampled from 50388 (50710) to 50388 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.82), E-opt: 0.2 (0.595), width:  16
 Scan time: 22.420

The best scores are:                                      opt bits E(85289)
XP_016866763 (OMIM: 142580) PREDICTED: protein PRR (2086) 6038 399.4 1.6e-109
NP_542417 (OMIM: 142580) protein PRRC2A [Homo sapi (2157) 6038 399.4 1.6e-109
NP_004629 (OMIM: 142580) protein PRRC2A [Homo sapi (2157) 6038 399.4 1.6e-109
XP_011536691 (OMIM: 601234) PREDICTED: nascent pol (2078)  585 53.8 1.7e-05
XP_006719475 (OMIM: 601234) PREDICTED: nascent pol (2082)  585 53.8 1.7e-05
XP_006719476 (OMIM: 601234) PREDICTED: nascent pol (2082)  585 53.8 1.7e-05
XP_006719477 (OMIM: 601234) PREDICTED: nascent pol (2082)  585 53.8 1.7e-05
XP_011529151 (OMIM: 301050,303630) PREDICTED: coll (1696)  531 50.3 0.00016
XP_016884752 (OMIM: 301050,303630) PREDICTED: coll (1136)  492 47.7 0.00064
NP_203699 (OMIM: 301050,303630) collagen alpha-5(I (1691)  496 48.1 0.00073
NP_000486 (OMIM: 301050,303630) collagen alpha-5(I (1685)  481 47.2  0.0014
XP_016884749 (OMIM: 301050,303630) PREDICTED: coll (1690)  481 47.2  0.0014
XP_016884748 (OMIM: 301050,303630) PREDICTED: coll (1693)  478 47.0  0.0016
XP_011508875 (OMIM: 120190,130000) PREDICTED: coll (1453)  465 46.1  0.0025
NP_000384 (OMIM: 120190,130000) collagen alpha-2(V (1499)  465 46.1  0.0026
NP_002448 (OMIM: 158370) mucin-2 precursor [Homo s (5289)  463 46.4  0.0074


>>XP_016866763 (OMIM: 142580) PREDICTED: protein PRRC2A   (2086 aa)
 initn: 6788 init1: 5978 opt: 6038  Z-score: 2087.2  bits: 399.4 E(85289): 1.6e-109
Smith-Waterman score: 6158; 63.8% identity (72.2% similar) in 1565 aa overlap (1-1532:1-1454)

               10        20        30        40        50        60
pF1KB0 MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPAVAPRHGLQSLGKVAIARRMPPPA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPAVAPRHGLQSLGKVAIARRMPPPA
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB0 NLPSLKAENKGNDPNVSLVPKDGTGWASKQEQSDPKSSDASTAQPLESQPLPASQTPASN
       ::::::::::::::::::::::::::::::::::::::::::::: ::::::::::::::
XP_016 NLPSLKAENKGNDPNVSLVPKDGTGWASKQEQSDPKSSDASTAQPPESQPLPASQTPASN
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB0 QPKRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGRASSLLSRFSREEFPTLQAAGDQD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 QPKRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGRASSLLSRFSREEFPTLQAAGDQD
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB0 KAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKLHHGHDPRGGLQPSGP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 KAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKLHHGHDPRGGLQPSGP
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB0 PQFPPYRGMMPPFMYPPYLPFPPPYGPQGPYRYPTPDGPSRFPRVAGPRGSGPPMRLVEP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 PQFPPYRGMMPPFMYPPYLPFPPPYGPQGPYRYPTPDGPSRFPRVAGPRGSGPPMRLVEP
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB0 VGRPSILKEDNLKEFDQLDQENDDGWAGAHEEVDYTEKLKFSDEEDGRDSDEEGAEGHRD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 VGRPSILKEDNLKEFDQLDQENDDGWAGAHEEVDYTEKLKFSDEEDGRDSDEEGAEGHRD
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB0 SQSASGEERPPEADGKKGNSPNSEPPTPKTAWAETSRPPETEPGPPAPKPPLPPPHRGPA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 SQSASGEERPPEADGKKGNSPNSEPPTPKTAWAETSRPPETEPGPPAPKPPLPPPHRGPA
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KB0 GNWGPPGDYPDRGGPPCKPPAPEDEDEAWRQRRKQSSSEISLAVERARRRREEEERRMQE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 GNWGPPGDYPDRGGPPCKPPAPEDEDEAWRQRRKQSSSEISLAVERARRRREEEERRMQE
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KB0 ERRAACAEKLKRLDEKFGAPDKRLKAEPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 ERRAACAEKLKRLDEKFGAPDKRLKAEPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAP
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KB0 TPEKEPEEPAQAPPAQSTPTPGVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPE
       ::: ::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 TPETEPEEPAQAPPAQSTPTPGVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPE
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KB0 PPEEVPPPTTPPVPKVEPKGDGIGPTRQPPSQGLGYPKYQKSLPPRFQRQQQEQLLKQQQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 PPEEVPPPTTPPVPKVEPKGDGIGPTRQPPSQGLGYPKYQKSLPPRFQRQQQEQLLKQQQ
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KB0 QHQWQQHQQGSAPPTPVPPSPPQPVTLGAVPAPQAPPPPPKALYPGALGRPPPMPPMNFD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 QHQWQQHQQGSAPPTPVPPSPPQPVTLGAVPAPQAPPPPPKALYPGALGRPPPMPPMNFD
              670       680       690       700       710       720

              730       740       750       760       770       780
pF1KB0 PRWMMIPPYVDPRLLQGRPPLDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRER
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 PRWMMIPPYVDPRLLQGRPPLDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRER
              730       740       750       760       770       780

              790       800       810       820       830       840
pF1KB0 GTPPVDPKLAWVGDVFTATPAEPRPLTSPLRQAADEDDKGMRSETPPVPPPPPSSSAVFR
       :::::::::::::::::::::::::::::::::::::::::::::::::::::       
XP_016 GTPPVDPKLAWVGDVFTATPAEPRPLTSPLRQAADEDDKGMRSETPPVPPPPP-------
              790       800       810       820       830          

              850       860       870       880        890         
pF1KB0 LDQVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGPPQAPQ-GPSPRPPTRYEPQRV
           . : :.  ...       .  .  ::  ::  : :: . . .    :: . :: . 
XP_016 ---YLASYPGFPENGAPGPPISRFPLEEPG--PRPLPWPPGSDEVAKIQTPPPKKEPPKE
              840       850       860         870       880        

     900       910       920       930       940       950         
pF1KB0 NSGLSSDPHFEEPGPMVRGVGGTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSG
       ...  . :  :     .::::     :.: .: ::.:. :         :    :  .:.
XP_016 ETAQLTGP--EAGRKPARGVG-----SGGQGPPPPRRESRT--------ETRWGPRPGSS
      890         900            910       920               930   

     960       970       980       990      1000      1010         
pF1KB0 FLGSKPEGPGPQAESRDTGTEALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAG
         :  :: ::  :  : .:     :           .:   :...:    : .:.:.  :
XP_016 RRGIPPEEPG--APPRRAG-----P----------IKKPPPPTKVEEL--PPKPLEQ--G
           940         950                      960         970    

    1020      1030      1040      1050      1060      1070         
pF1KB0 TEMSQSDSGVDLSGDSQVSSGPCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPP-
        :  .  .   :.  .   .::  ... :.:.:. : .   .:  .   .. . :.:   
XP_016 DETPKPPKPDPLKITKGKLGGP--KETPPNGNLSPAPR--LRRDYSYERVGPTSCRGRGR
            980       990        1000        1010      1020        

     1080      1090      1100      1110      1120      1130        
pF1KB0 GSEPPRRPPPAPHDGDRKELPREQPLPPGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQF
       :    :        : : .  : . .      . :  : : :   :   :.:   ::.  
XP_016 GEYFARGRGFRGTYGGRGRGARSREFR-----SYREFRGDDGRGGGTGGPNH---PPAPR
     1030      1040      1050           1060      1070         1080

     1140      1150      1160      1170      1180      1190        
pF1KB0 GTSDKDSDLRLVVGDSLKAEKELTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCV
       : .   :. :   ..  .  :.     .:.   ... .: ::   .  :.  .: .   .
XP_016 GRT--ASETRSEGSEYEEIPKRRRQRGSETGSETHESDLAPSDKEAPTPKEGTLTQVPLA
               1090      1100      1110      1120      1130        

     1200      1210              1220      1230      1240      1250
pF1KB0 PEPSSSGQRLYPEVFYGSAG--------PSSSQISGGAMDSQLHPNSGGFRPGTPSLHPY
       : : ..     :  : . .:        ::    .::    :. :   :. : . :: : 
XP_016 PPPPGAPPSPAPARFTARGGRVFTPRGVPSRRGRGGGRPPPQVCP---GWSPPAKSLAP-
     1140      1150      1160      1170      1180         1190     

             1260      1270      1280      1290          1300      
pF1KB0 RSQPLYLPPGPAPPSALLSGVALKGQFLDFSTMQATELGKLPAGGVLYP----PPSFLYS
        ..:   : :: :::       :: ...      ... :.  ...: .     :    ..
XP_016 -KKP---PTGPLPPSKE----PLKEKLIPGPLSPVARGGSNGGSNVGMEDGERPRRRRHG
             1200          1210      1220      1230      1240      

       1310       1320      1330      1340      1350      1360     
pF1KB0 PAFCPSPLPD-TSLLQVRQDLPSPSDFYSTPLQPGGQSGFLPSGAPAQQMLLPMVDSQLP
        :   .  :    : : :..    :.        :  :  ::..::. .  :  :     
XP_016 RAQQQDKPPRFRRLKQERENAARGSE--------GKPSLTLPASAPGPEEALTTV-----
       1250      1260      1270              1280      1290        

        1370      1380         1390      1400      1410      1420  
pF1KB0 VVNFGSLPPAPPPAP---PPLSLLPVGPALQPPSLAVRPPPAPATRVLPSPARPFPASLG
            .. :::  :    : ::      : .    : .     . :   . : :      
XP_016 -----TVAPAPRRAAAKSPDLSNQNSDQANEEWETASESSDFTSERRGDKEAPP------
               1300      1310      1320      1330      1340        

           1430      1440      1450       1460      1470      1480 
pF1KB0 RAELHPVELKPFQDYQKLSSNLGGPGSSRTPP-TGRSFSGLNSRLKATPSTYSGVFRTQR
            :: : :     :  .. :: :.. .:  .. : . :..: :   :  :  : .::
XP_016 -----PVLLTP-----KAVGTPGGGGGGAVPGISAMSRGDLSQRAKDL-SKRS--FSSQR
                     1350      1360      1370      1380            

            1490      1500           1510          1520            
pF1KB0 VDLYQQASPPDALRWIPKPWERTG-----PPPREGPSRRAEE----PGSRG----DKEPG
         . .:   :       .    .:     :  : ::.:  ..    : .:.    .. ::
XP_016 PGMERQNRRPGPGGKAGSSGSSSGGGGGGPGGRTGPGRGDKRSWPSPKNRSRPPEERPPG
    1390      1400      1410      1420      1430      1440         

     1530                                                          
pF1KB0 LP-PPR                                                      
       :: ::                                                       
XP_016 LPLPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGLPQAPQG
    1450      1460      1470      1480      1490      1500         

>--
 initn: 3689 init1: 3689 opt: 3709  Z-score: 1289.6  bits: 251.8 E(85289): 4.3e-65
Smith-Waterman score: 4306; 89.6% identity (89.8% similar) in 703 aa overlap (831-1533:1455-2086)

              810       820       830       840       850       860
pF1KB0 AEPRPLTSPLRQAADEDDKGMRSETPPVPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLS
                                     ::::::::::::::::::::::::::::::
XP_016 PGRGDKRSWPSPKNRSRPPEERPPGLPLPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLS
         1430      1440      1450      1460      1470      1480    

              870       880       890       900       910       920
pF1KB0 SRQGSVTAPGGHPRHKPGPPQAPQGPSPRPPTRYEPQRVNSGLSSDPHFEEPGPMVRGVG
       :::::::::::::::::: :::::::::::::::::::::::::::::::::::::::::
XP_016 SRQGSVTAPGGHPRHKPGLPQAPQGPSPRPPTRYEPQRVNSGLSSDPHFEEPGPMVRGVG
         1490      1500      1510      1520      1530      1540    

              930       940       950       960       970       980
pF1KB0 GTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFLGSKPEGPGPQAESRDTGTE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 GTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFLGSKPEGPGPQAESRDTGTE
         1550      1560      1570      1580      1590      1600    

              990      1000      1010      1020      1030      1040
pF1KB0 ALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGTEMSQSDSGVDLSGDSQVSSG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 ALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGTEMSQSDSGVDLSGDSQVSSG
         1610      1620      1630      1640      1650      1660    

             1050      1060      1070      1080      1090      1100
pF1KB0 PCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPGSEPPRRPPPAPHDGDRKELPR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 PCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPGSEPPRRPPPAPHDGDRKELPR
         1670      1680      1690      1700      1710      1720    

             1110      1120      1130      1140      1150      1160
pF1KB0 EQPLPPGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQFGTSDKDSDLRLVVGDSLKAEKE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 EQPLPPGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQFGTSDKDSDLRLVVGDSLKAEKE
         1730      1740      1750      1760      1770      1780    

             1170      1180      1190      1200      1210      1220
pF1KB0 LTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCVPEPSSSGQRLYPEVFYGSAGPS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 LTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCVPEPSSSGQRLYPEVFYGSAGPS
         1790      1800      1810      1820      1830      1840    

             1230      1240      1250      1260      1270      1280
pF1KB0 SSQISGGAMDSQLHPNSGGFRPGTPSLHPYRSQPLYLPPGPAPPSALLSGVALKGQFLDF
       ::::::::::::::::::::::::::::::::::::::::::::::::::.:::::::::
XP_016 SSQISGGAMDSQLHPNSGGFRPGTPSLHPYRSQPLYLPPGPAPPSALLSGLALKGQFLDF
         1850      1860      1870      1880      1890      1900    

             1290      1300      1310      1320      1330      1340
pF1KB0 STMQATELGKLPAGGVLYPPPSFLYSPAFCPSPLPDTSLLQVRQDLPSPSDFYSTPLQPG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 STMQATELGKLPAGGVLYPPPSFLYSPAFCPSPLPDTSLLQVRQDLPSPSDFYSTPLQPG
         1910      1920      1930      1940      1950      1960    

             1350      1360      1370      1380      1390      1400
pF1KB0 GQSGFLPSGAPAQQMLLPMVDSQLPVVNFGSLPPAPPPAPPPLSLLPVGPALQPPSLAVR
       ::::::::::::::                                              
XP_016 GQSGFLPSGAPAQQ----------------------------------------------
         1970                                                      

             1410      1420      1430      1440      1450      1460
pF1KB0 PPPAPATRVLPSPARPFPASLGRAELHPVELKPFQDYQKLSSNLGGPGSSRTPPTGRSFS
                                :::::::::::::::::::::::::::::::::::
XP_016 -------------------------LHPVELKPFQDYQKLSSNLGGPGSSRTPPTGRSFS
                              1980      1990      2000      2010   

             1470      1480      1490      1500      1510      1520
pF1KB0 GLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRAEEPG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 GLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRAEEPG
          2020      2030      2040      2050      2060      2070   

             1530   
pF1KB0 SRGDKEPGLPPPR
       :::::::::::::
XP_016 SRGDKEPGLPPPR
          2080      

>>NP_542417 (OMIM: 142580) protein PRRC2A [Homo sapiens]  (2157 aa)
 initn: 6028 init1: 5978 opt: 6038  Z-score: 2087.0  bits: 399.4 E(85289): 1.6e-109
Smith-Waterman score: 6158; 63.8% identity (72.2% similar) in 1565 aa overlap (1-1532:1-1454)

               10        20        30        40        50        60
pF1KB0 MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPAVAPRHGLQSLGKVAIARRMPPPA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPAVAPRHGLQSLGKVAIARRMPPPA
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB0 NLPSLKAENKGNDPNVSLVPKDGTGWASKQEQSDPKSSDASTAQPLESQPLPASQTPASN
       ::::::::::::::::::::::::::::::::::::::::::::: ::::::::::::::
NP_542 NLPSLKAENKGNDPNVSLVPKDGTGWASKQEQSDPKSSDASTAQPPESQPLPASQTPASN
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB0 QPKRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGRASSLLSRFSREEFPTLQAAGDQD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 QPKRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGRASSLLSRFSREEFPTLQAAGDQD
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB0 KAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKLHHGHDPRGGLQPSGP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 KAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKLHHGHDPRGGLQPSGP
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB0 PQFPPYRGMMPPFMYPPYLPFPPPYGPQGPYRYPTPDGPSRFPRVAGPRGSGPPMRLVEP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 PQFPPYRGMMPPFMYPPYLPFPPPYGPQGPYRYPTPDGPSRFPRVAGPRGSGPPMRLVEP
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB0 VGRPSILKEDNLKEFDQLDQENDDGWAGAHEEVDYTEKLKFSDEEDGRDSDEEGAEGHRD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 VGRPSILKEDNLKEFDQLDQENDDGWAGAHEEVDYTEKLKFSDEEDGRDSDEEGAEGHRD
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB0 SQSASGEERPPEADGKKGNSPNSEPPTPKTAWAETSRPPETEPGPPAPKPPLPPPHRGPA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 SQSASGEERPPEADGKKGNSPNSEPPTPKTAWAETSRPPETEPGPPAPKPPLPPPHRGPA
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KB0 GNWGPPGDYPDRGGPPCKPPAPEDEDEAWRQRRKQSSSEISLAVERARRRREEEERRMQE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 GNWGPPGDYPDRGGPPCKPPAPEDEDEAWRQRRKQSSSEISLAVERARRRREEEERRMQE
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KB0 ERRAACAEKLKRLDEKFGAPDKRLKAEPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 ERRAACAEKLKRLDEKFGAPDKRLKAEPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAP
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KB0 TPEKEPEEPAQAPPAQSTPTPGVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPE
       ::: ::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 TPETEPEEPAQAPPAQSTPTPGVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPE
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KB0 PPEEVPPPTTPPVPKVEPKGDGIGPTRQPPSQGLGYPKYQKSLPPRFQRQQQEQLLKQQQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 PPEEVPPPTTPPVPKVEPKGDGIGPTRQPPSQGLGYPKYQKSLPPRFQRQQQEQLLKQQQ
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KB0 QHQWQQHQQGSAPPTPVPPSPPQPVTLGAVPAPQAPPPPPKALYPGALGRPPPMPPMNFD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 QHQWQQHQQGSAPPTPVPPSPPQPVTLGAVPAPQAPPPPPKALYPGALGRPPPMPPMNFD
              670       680       690       700       710       720

              730       740       750       760       770       780
pF1KB0 PRWMMIPPYVDPRLLQGRPPLDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRER
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 PRWMMIPPYVDPRLLQGRPPLDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRER
              730       740       750       760       770       780

              790       800       810       820       830       840
pF1KB0 GTPPVDPKLAWVGDVFTATPAEPRPLTSPLRQAADEDDKGMRSETPPVPPPPPSSSAVFR
       :::::::::::::::::::::::::::::::::::::::::::::::::::::       
NP_542 GTPPVDPKLAWVGDVFTATPAEPRPLTSPLRQAADEDDKGMRSETPPVPPPPP-------
              790       800       810       820       830          

              850       860       870       880        890         
pF1KB0 LDQVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGPPQAPQ-GPSPRPPTRYEPQRV
           . : :.  ...       .  .  ::  ::  : :: . . .    :: . :: . 
NP_542 ---YLASYPGFPENGAPGPPISRFPLEEPG--PRPLPWPPGSDEVAKIQTPPPKKEPPKE
              840       850       860         870       880        

     900       910       920       930       940       950         
pF1KB0 NSGLSSDPHFEEPGPMVRGVGGTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSG
       ...  . :  :     .::::     :.: .: ::.:. :         :    :  .:.
NP_542 ETAQLTGP--EAGRKPARGVG-----SGGQGPPPPRRESRT--------ETRWGPRPGSS
      890         900            910       920               930   

     960       970       980       990      1000      1010         
pF1KB0 FLGSKPEGPGPQAESRDTGTEALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAG
         :  :: ::  :  : .:     :           .:   :...:    : .:.:.  :
NP_542 RRGIPPEEPG--APPRRAG-----P----------IKKPPPPTKVEEL--PPKPLEQ--G
           940         950                      960         970    

    1020      1030      1040      1050      1060      1070         
pF1KB0 TEMSQSDSGVDLSGDSQVSSGPCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPP-
        :  .  .   :.  .   .::  ... :.:.:. : .   .:  .   .. . :.:   
NP_542 DETPKPPKPDPLKITKGKLGGP--KETPPNGNLSPAPR--LRRDYSYERVGPTSCRGRGR
            980       990        1000        1010      1020        

     1080      1090      1100      1110      1120      1130        
pF1KB0 GSEPPRRPPPAPHDGDRKELPREQPLPPGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQF
       :    :        : : .  : . .      . :  : : :   :   :.:   ::.  
NP_542 GEYFARGRGFRGTYGGRGRGARSREFR-----SYREFRGDDGRGGGTGGPNH---PPAPR
     1030      1040      1050           1060      1070         1080

     1140      1150      1160      1170      1180      1190        
pF1KB0 GTSDKDSDLRLVVGDSLKAEKELTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCV
       : .   :. :   ..  .  :.     .:.   ... .: ::   .  :.  .: .   .
NP_542 GRT--ASETRSEGSEYEEIPKRRRQRGSETGSETHESDLAPSDKEAPTPKEGTLTQVPLA
               1090      1100      1110      1120      1130        

     1200      1210              1220      1230      1240      1250
pF1KB0 PEPSSSGQRLYPEVFYGSAG--------PSSSQISGGAMDSQLHPNSGGFRPGTPSLHPY
       : : ..     :  : . .:        ::    .::    :. :   :. : . :: : 
NP_542 PPPPGAPPSPAPARFTARGGRVFTPRGVPSRRGRGGGRPPPQVCP---GWSPPAKSLAP-
     1140      1150      1160      1170      1180         1190     

             1260      1270      1280      1290          1300      
pF1KB0 RSQPLYLPPGPAPPSALLSGVALKGQFLDFSTMQATELGKLPAGGVLYP----PPSFLYS
        ..:   : :: :::       :: ...      ... :.  ...: .     :    ..
NP_542 -KKP---PTGPLPPSKE----PLKEKLIPGPLSPVARGGSNGGSNVGMEDGERPRRRRHG
             1200          1210      1220      1230      1240      

       1310       1320      1330      1340      1350      1360     
pF1KB0 PAFCPSPLPD-TSLLQVRQDLPSPSDFYSTPLQPGGQSGFLPSGAPAQQMLLPMVDSQLP
        :   .  :    : : :..    :.        :  :  ::..::. .  :  :     
NP_542 RAQQQDKPPRFRRLKQERENAARGSE--------GKPSLTLPASAPGPEEALTTV-----
       1250      1260      1270              1280      1290        

        1370      1380         1390      1400      1410      1420  
pF1KB0 VVNFGSLPPAPPPAP---PPLSLLPVGPALQPPSLAVRPPPAPATRVLPSPARPFPASLG
            .. :::  :    : ::      : .    : .     . :   . : :      
NP_542 -----TVAPAPRRAAAKSPDLSNQNSDQANEEWETASESSDFTSERRGDKEAPP------
               1300      1310      1320      1330      1340        

           1430      1440      1450       1460      1470      1480 
pF1KB0 RAELHPVELKPFQDYQKLSSNLGGPGSSRTPP-TGRSFSGLNSRLKATPSTYSGVFRTQR
            :: : :     :  .. :: :.. .:  .. : . :..: :   :  :  : .::
NP_542 -----PVLLTP-----KAVGTPGGGGGGAVPGISAMSRGDLSQRAKDL-SKRS--FSSQR
                     1350      1360      1370      1380            

            1490      1500           1510          1520            
pF1KB0 VDLYQQASPPDALRWIPKPWERTG-----PPPREGPSRRAEE----PGSRG----DKEPG
         . .:   :       .    .:     :  : ::.:  ..    : .:.    .. ::
NP_542 PGMERQNRRPGPGGKAGSSGSSSGGGGGGPGGRTGPGRGDKRSWPSPKNRSRPPEERPPG
    1390      1400      1410      1420      1430      1440         

     1530                                                          
pF1KB0 LP-PPR                                                      
       :: ::                                                       
NP_542 LPLPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGLPQAPQG
    1450      1460      1470      1480      1490      1500         

>--
 initn: 4960 init1: 4960 opt: 4960  Z-score: 1717.8  bits: 331.1 E(85289): 6.1e-89
Smith-Waterman score: 4960; 99.7% identity (99.9% similar) in 703 aa overlap (831-1533:1455-2157)

              810       820       830       840       850       860
pF1KB0 AEPRPLTSPLRQAADEDDKGMRSETPPVPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLS
                                     ::::::::::::::::::::::::::::::
NP_542 PGRGDKRSWPSPKNRSRPPEERPPGLPLPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLS
         1430      1440      1450      1460      1470      1480    

              870       880       890       900       910       920
pF1KB0 SRQGSVTAPGGHPRHKPGPPQAPQGPSPRPPTRYEPQRVNSGLSSDPHFEEPGPMVRGVG
       :::::::::::::::::: :::::::::::::::::::::::::::::::::::::::::
NP_542 SRQGSVTAPGGHPRHKPGLPQAPQGPSPRPPTRYEPQRVNSGLSSDPHFEEPGPMVRGVG
         1490      1500      1510      1520      1530      1540    

              930       940       950       960       970       980
pF1KB0 GTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFLGSKPEGPGPQAESRDTGTE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 GTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFLGSKPEGPGPQAESRDTGTE
         1550      1560      1570      1580      1590      1600    

              990      1000      1010      1020      1030      1040
pF1KB0 ALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGTEMSQSDSGVDLSGDSQVSSG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 ALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGTEMSQSDSGVDLSGDSQVSSG
         1610      1620      1630      1640      1650      1660    

             1050      1060      1070      1080      1090      1100
pF1KB0 PCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPGSEPPRRPPPAPHDGDRKELPR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 PCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPGSEPPRRPPPAPHDGDRKELPR
         1670      1680      1690      1700      1710      1720    

             1110      1120      1130      1140      1150      1160
pF1KB0 EQPLPPGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQFGTSDKDSDLRLVVGDSLKAEKE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 EQPLPPGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQFGTSDKDSDLRLVVGDSLKAEKE
         1730      1740      1750      1760      1770      1780    

             1170      1180      1190      1200      1210      1220
pF1KB0 LTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCVPEPSSSGQRLYPEVFYGSAGPS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 LTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCVPEPSSSGQRLYPEVFYGSAGPS
         1790      1800      1810      1820      1830      1840    

             1230      1240      1250      1260      1270      1280
pF1KB0 SSQISGGAMDSQLHPNSGGFRPGTPSLHPYRSQPLYLPPGPAPPSALLSGVALKGQFLDF
       ::::::::::::::::::::::::::::::::::::::::::::::::::.:::::::::
NP_542 SSQISGGAMDSQLHPNSGGFRPGTPSLHPYRSQPLYLPPGPAPPSALLSGLALKGQFLDF
         1850      1860      1870      1880      1890      1900    

             1290      1300      1310      1320      1330      1340
pF1KB0 STMQATELGKLPAGGVLYPPPSFLYSPAFCPSPLPDTSLLQVRQDLPSPSDFYSTPLQPG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 STMQATELGKLPAGGVLYPPPSFLYSPAFCPSPLPDTSLLQVRQDLPSPSDFYSTPLQPG
         1910      1920      1930      1940      1950      1960    

             1350      1360      1370      1380      1390      1400
pF1KB0 GQSGFLPSGAPAQQMLLPMVDSQLPVVNFGSLPPAPPPAPPPLSLLPVGPALQPPSLAVR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 GQSGFLPSGAPAQQMLLPMVDSQLPVVNFGSLPPAPPPAPPPLSLLPVGPALQPPSLAVR
         1970      1980      1990      2000      2010      2020    

             1410      1420      1430      1440      1450      1460
pF1KB0 PPPAPATRVLPSPARPFPASLGRAELHPVELKPFQDYQKLSSNLGGPGSSRTPPTGRSFS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 PPPAPATRVLPSPARPFPASLGRAELHPVELKPFQDYQKLSSNLGGPGSSRTPPTGRSFS
         2030      2040      2050      2060      2070      2080    

             1470      1480      1490      1500      1510      1520
pF1KB0 GLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRAEEPG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_542 GLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRAEEPG
         2090      2100      2110      2120      2130      2140    

             1530   
pF1KB0 SRGDKEPGLPPPR
       :::::::::::::
NP_542 SRGDKEPGLPPPR
         2150       

>>NP_004629 (OMIM: 142580) protein PRRC2A [Homo sapiens]  (2157 aa)
 initn: 6028 init1: 5978 opt: 6038  Z-score: 2087.0  bits: 399.4 E(85289): 1.6e-109
Smith-Waterman score: 6158; 63.8% identity (72.2% similar) in 1565 aa overlap (1-1532:1-1454)

               10        20        30        40        50        60
pF1KB0 MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPAVAPRHGLQSLGKVAIARRMPPPA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPAVAPRHGLQSLGKVAIARRMPPPA
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB0 NLPSLKAENKGNDPNVSLVPKDGTGWASKQEQSDPKSSDASTAQPLESQPLPASQTPASN
       ::::::::::::::::::::::::::::::::::::::::::::: ::::::::::::::
NP_004 NLPSLKAENKGNDPNVSLVPKDGTGWASKQEQSDPKSSDASTAQPPESQPLPASQTPASN
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB0 QPKRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGRASSLLSRFSREEFPTLQAAGDQD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 QPKRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGRASSLLSRFSREEFPTLQAAGDQD
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB0 KAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKLHHGHDPRGGLQPSGP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 KAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKLHHGHDPRGGLQPSGP
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB0 PQFPPYRGMMPPFMYPPYLPFPPPYGPQGPYRYPTPDGPSRFPRVAGPRGSGPPMRLVEP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 PQFPPYRGMMPPFMYPPYLPFPPPYGPQGPYRYPTPDGPSRFPRVAGPRGSGPPMRLVEP
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB0 VGRPSILKEDNLKEFDQLDQENDDGWAGAHEEVDYTEKLKFSDEEDGRDSDEEGAEGHRD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 VGRPSILKEDNLKEFDQLDQENDDGWAGAHEEVDYTEKLKFSDEEDGRDSDEEGAEGHRD
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB0 SQSASGEERPPEADGKKGNSPNSEPPTPKTAWAETSRPPETEPGPPAPKPPLPPPHRGPA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 SQSASGEERPPEADGKKGNSPNSEPPTPKTAWAETSRPPETEPGPPAPKPPLPPPHRGPA
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KB0 GNWGPPGDYPDRGGPPCKPPAPEDEDEAWRQRRKQSSSEISLAVERARRRREEEERRMQE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 GNWGPPGDYPDRGGPPCKPPAPEDEDEAWRQRRKQSSSEISLAVERARRRREEEERRMQE
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KB0 ERRAACAEKLKRLDEKFGAPDKRLKAEPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 ERRAACAEKLKRLDEKFGAPDKRLKAEPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAP
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KB0 TPEKEPEEPAQAPPAQSTPTPGVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPE
       ::: ::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 TPETEPEEPAQAPPAQSTPTPGVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPE
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KB0 PPEEVPPPTTPPVPKVEPKGDGIGPTRQPPSQGLGYPKYQKSLPPRFQRQQQEQLLKQQQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 PPEEVPPPTTPPVPKVEPKGDGIGPTRQPPSQGLGYPKYQKSLPPRFQRQQQEQLLKQQQ
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KB0 QHQWQQHQQGSAPPTPVPPSPPQPVTLGAVPAPQAPPPPPKALYPGALGRPPPMPPMNFD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 QHQWQQHQQGSAPPTPVPPSPPQPVTLGAVPAPQAPPPPPKALYPGALGRPPPMPPMNFD
              670       680       690       700       710       720

              730       740       750       760       770       780
pF1KB0 PRWMMIPPYVDPRLLQGRPPLDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRER
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 PRWMMIPPYVDPRLLQGRPPLDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRER
              730       740       750       760       770       780

              790       800       810       820       830       840
pF1KB0 GTPPVDPKLAWVGDVFTATPAEPRPLTSPLRQAADEDDKGMRSETPPVPPPPPSSSAVFR
       :::::::::::::::::::::::::::::::::::::::::::::::::::::       
NP_004 GTPPVDPKLAWVGDVFTATPAEPRPLTSPLRQAADEDDKGMRSETPPVPPPPP-------
              790       800       810       820       830          

              850       860       870       880        890         
pF1KB0 LDQVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGPPQAPQ-GPSPRPPTRYEPQRV
           . : :.  ...       .  .  ::  ::  : :: . . .    :: . :: . 
NP_004 ---YLASYPGFPENGAPGPPISRFPLEEPG--PRPLPWPPGSDEVAKIQTPPPKKEPPKE
              840       850       860         870       880        

     900       910       920       930       940       950         
pF1KB0 NSGLSSDPHFEEPGPMVRGVGGTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSG
       ...  . :  :     .::::     :.: .: ::.:. :         :    :  .:.
NP_004 ETAQLTGP--EAGRKPARGVG-----SGGQGPPPPRRESRT--------ETRWGPRPGSS
      890         900            910       920               930   

     960       970       980       990      1000      1010         
pF1KB0 FLGSKPEGPGPQAESRDTGTEALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAG
         :  :: ::  :  : .:     :           .:   :...:    : .:.:.  :
NP_004 RRGIPPEEPG--APPRRAG-----P----------IKKPPPPTKVEEL--PPKPLEQ--G
           940         950                      960         970    

    1020      1030      1040      1050      1060      1070         
pF1KB0 TEMSQSDSGVDLSGDSQVSSGPCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPP-
        :  .  .   :.  .   .::  ... :.:.:. : .   .:  .   .. . :.:   
NP_004 DETPKPPKPDPLKITKGKLGGP--KETPPNGNLSPAPR--LRRDYSYERVGPTSCRGRGR
            980       990        1000        1010      1020        

     1080      1090      1100      1110      1120      1130        
pF1KB0 GSEPPRRPPPAPHDGDRKELPREQPLPPGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQF
       :    :        : : .  : . .      . :  : : :   :   :.:   ::.  
NP_004 GEYFARGRGFRGTYGGRGRGARSREFR-----SYREFRGDDGRGGGTGGPNH---PPAPR
     1030      1040      1050           1060      1070         1080

     1140      1150      1160      1170      1180      1190        
pF1KB0 GTSDKDSDLRLVVGDSLKAEKELTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCV
       : .   :. :   ..  .  :.     .:.   ... .: ::   .  :.  .: .   .
NP_004 GRT--ASETRSEGSEYEEIPKRRRQRGSETGSETHESDLAPSDKEAPTPKEGTLTQVPLA
               1090      1100      1110      1120      1130        

     1200      1210              1220      1230      1240      1250
pF1KB0 PEPSSSGQRLYPEVFYGSAG--------PSSSQISGGAMDSQLHPNSGGFRPGTPSLHPY
       : : ..     :  : . .:        ::    .::    :. :   :. : . :: : 
NP_004 PPPPGAPPSPAPARFTARGGRVFTPRGVPSRRGRGGGRPPPQVCP---GWSPPAKSLAP-
     1140      1150      1160      1170      1180         1190     

             1260      1270      1280      1290          1300      
pF1KB0 RSQPLYLPPGPAPPSALLSGVALKGQFLDFSTMQATELGKLPAGGVLYP----PPSFLYS
        ..:   : :: :::       :: ...      ... :.  ...: .     :    ..
NP_004 -KKP---PTGPLPPSKE----PLKEKLIPGPLSPVARGGSNGGSNVGMEDGERPRRRRHG
             1200          1210      1220      1230      1240      

       1310       1320      1330      1340      1350      1360     
pF1KB0 PAFCPSPLPD-TSLLQVRQDLPSPSDFYSTPLQPGGQSGFLPSGAPAQQMLLPMVDSQLP
        :   .  :    : : :..    :.        :  :  ::..::. .  :  :     
NP_004 RAQQQDKPPRFRRLKQERENAARGSE--------GKPSLTLPASAPGPEEALTTV-----
       1250      1260      1270              1280      1290        

        1370      1380         1390      1400      1410      1420  
pF1KB0 VVNFGSLPPAPPPAP---PPLSLLPVGPALQPPSLAVRPPPAPATRVLPSPARPFPASLG
            .. :::  :    : ::      : .    : .     . :   . : :      
NP_004 -----TVAPAPRRAAAKSPDLSNQNSDQANEEWETASESSDFTSERRGDKEAPP------
               1300      1310      1320      1330      1340        

           1430      1440      1450       1460      1470      1480 
pF1KB0 RAELHPVELKPFQDYQKLSSNLGGPGSSRTPP-TGRSFSGLNSRLKATPSTYSGVFRTQR
            :: : :     :  .. :: :.. .:  .. : . :..: :   :  :  : .::
NP_004 -----PVLLTP-----KAVGTPGGGGGGAVPGISAMSRGDLSQRAKDL-SKRS--FSSQR
                     1350      1360      1370      1380            

            1490      1500           1510          1520            
pF1KB0 VDLYQQASPPDALRWIPKPWERTG-----PPPREGPSRRAEE----PGSRG----DKEPG
         . .:   :       .    .:     :  : ::.:  ..    : .:.    .. ::
NP_004 PGMERQNRRPGPGGKAGSSGSSSGGGGGGPGGRTGPGRGDKRSWPSPKNRSRPPEERPPG
    1390      1400      1410      1420      1430      1440         

     1530                                                          
pF1KB0 LP-PPR                                                      
       :: ::                                                       
NP_004 LPLPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGLPQAPQG
    1450      1460      1470      1480      1490      1500         

>--
 initn: 4960 init1: 4960 opt: 4960  Z-score: 1717.8  bits: 331.1 E(85289): 6.1e-89
Smith-Waterman score: 4960; 99.7% identity (99.9% similar) in 703 aa overlap (831-1533:1455-2157)

              810       820       830       840       850       860
pF1KB0 AEPRPLTSPLRQAADEDDKGMRSETPPVPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLS
                                     ::::::::::::::::::::::::::::::
NP_004 PGRGDKRSWPSPKNRSRPPEERPPGLPLPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLS
         1430      1440      1450      1460      1470      1480    

              870       880       890       900       910       920
pF1KB0 SRQGSVTAPGGHPRHKPGPPQAPQGPSPRPPTRYEPQRVNSGLSSDPHFEEPGPMVRGVG
       :::::::::::::::::: :::::::::::::::::::::::::::::::::::::::::
NP_004 SRQGSVTAPGGHPRHKPGLPQAPQGPSPRPPTRYEPQRVNSGLSSDPHFEEPGPMVRGVG
         1490      1500      1510      1520      1530      1540    

              930       940       950       960       970       980
pF1KB0 GTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFLGSKPEGPGPQAESRDTGTE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 GTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFLGSKPEGPGPQAESRDTGTE
         1550      1560      1570      1580      1590      1600    

              990      1000      1010      1020      1030      1040
pF1KB0 ALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGTEMSQSDSGVDLSGDSQVSSG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 ALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGTEMSQSDSGVDLSGDSQVSSG
         1610      1620      1630      1640      1650      1660    

             1050      1060      1070      1080      1090      1100
pF1KB0 PCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPGSEPPRRPPPAPHDGDRKELPR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 PCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPGSEPPRRPPPAPHDGDRKELPR
         1670      1680      1690      1700      1710      1720    

             1110      1120      1130      1140      1150      1160
pF1KB0 EQPLPPGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQFGTSDKDSDLRLVVGDSLKAEKE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 EQPLPPGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQFGTSDKDSDLRLVVGDSLKAEKE
         1730      1740      1750      1760      1770      1780    

             1170      1180      1190      1200      1210      1220
pF1KB0 LTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCVPEPSSSGQRLYPEVFYGSAGPS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 LTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCVPEPSSSGQRLYPEVFYGSAGPS
         1790      1800      1810      1820      1830      1840    

             1230      1240      1250      1260      1270      1280
pF1KB0 SSQISGGAMDSQLHPNSGGFRPGTPSLHPYRSQPLYLPPGPAPPSALLSGVALKGQFLDF
       ::::::::::::::::::::::::::::::::::::::::::::::::::.:::::::::
NP_004 SSQISGGAMDSQLHPNSGGFRPGTPSLHPYRSQPLYLPPGPAPPSALLSGLALKGQFLDF
         1850      1860      1870      1880      1890      1900    

             1290      1300      1310      1320      1330      1340
pF1KB0 STMQATELGKLPAGGVLYPPPSFLYSPAFCPSPLPDTSLLQVRQDLPSPSDFYSTPLQPG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 STMQATELGKLPAGGVLYPPPSFLYSPAFCPSPLPDTSLLQVRQDLPSPSDFYSTPLQPG
         1910      1920      1930      1940      1950      1960    

             1350      1360      1370      1380      1390      1400
pF1KB0 GQSGFLPSGAPAQQMLLPMVDSQLPVVNFGSLPPAPPPAPPPLSLLPVGPALQPPSLAVR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 GQSGFLPSGAPAQQMLLPMVDSQLPVVNFGSLPPAPPPAPPPLSLLPVGPALQPPSLAVR
         1970      1980      1990      2000      2010      2020    

             1410      1420      1430      1440      1450      1460
pF1KB0 PPPAPATRVLPSPARPFPASLGRAELHPVELKPFQDYQKLSSNLGGPGSSRTPPTGRSFS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 PPPAPATRVLPSPARPFPASLGRAELHPVELKPFQDYQKLSSNLGGPGSSRTPPTGRSFS
         2030      2040      2050      2060      2070      2080    

             1470      1480      1490      1500      1510      1520
pF1KB0 GLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRAEEPG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 GLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRAEEPG
         2090      2100      2110      2120      2130      2140    

             1530   
pF1KB0 SRGDKEPGLPPPR
       :::::::::::::
NP_004 SRGDKEPGLPPPR
         2150       

>>XP_011536691 (OMIM: 601234) PREDICTED: nascent polypep  (2078 aa)
 initn: 244 init1: 149 opt: 585  Z-score: 219.6  bits: 53.8 E(85289): 1.7e-05
Smith-Waterman score: 862; 24.4% identity (45.6% similar) in 1545 aa overlap (30-1471:474-1892)

                10        20        30           40        50      
pF1KB0  MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPA---VAPRHGLQSLGKVAIARRM
                                     ..:  .::   .::    .   .:: . :.
XP_011 TNPCTIAAAPTTTFEVATCVSPPMSSGPISNIEPTSPAALVMAPVAPKEPSTQVATTLRI
           450       460       470       480       490       500   

         60        70          80          90       100       110  
pF1KB0 PPPANLPSLKAENKGNDPNVSLV--P--KDGTGWASKQEQSDPKSSDASTAQPLESQPLP
       :    ::.   :.  : :.  ::  :  ::     .. : .  . ..:. .   .   ::
XP_011 PVSPPLPD--PEDLKNLPSSVLVKFPTQKDLQTVPASLEGAPFSPAQAGLTTKKDPTVLP
           510         520       530       540       550       560 

            120         130       140       150        160         
pF1KB0 ASQTPASNQP--KRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGR-ASSLLSRF----
         :.  .:.:  .   ..::  :: : .  . :. :.  :     :. :::. : .    
XP_011 LVQAAPKNSPSFQSTSSSPE-IPLSPEA--TLAKKSL--GEPLPIGKPASSMTSPLGVNS
             570       580          590         600       610      

         170       180       190       200       210       220     
pF1KB0 SREEFPTLQAAGDQDKAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKL
       :   . : . ::  :.:.   .:.  .  :  .  : .:.   : .: .:   .: ..  
XP_011 SASVIKTDSYAGP-DSAGPLLKSSLIT--PTVAAFPLESA---DPAGVAPTTAKGTSTYT
        620        630       640         650          660       670

         230       240       250           260        270          
pF1KB0 HHGHDPRGGLQPSGPPQFPPYRGMMPPFMYPPYL----PFPP-PYGPQGPYR--YPTPDG
         .     :    .: . :  .: .  .   :      :  : : .  .:      .:. 
XP_011 TTASPFLEGTVSLAPKNHPVKEGTLTTLPLVPTASENCPVAPSPQNTCAPLATLVLAPEI
              680       690       700       710       720       730

      280        290       300         310       320       330     
pF1KB0 PSRFPRVA-GPRGSGPPMRLVEPVGRPSILKE--DNLKEFDQLDQENDDGWAGAHEEVDY
       :.  :  .  : :. :  . :. ... : :    .. ::    :       .::   .. 
XP_011 PKSVPSPSLPPAGTPPGTKKVDGISHTSALAPVASSPKECPTED-------SGASATASS
              740       750       760       770              780   

         340       350       360       370        380       390    
pF1KB0 TEKLKFSDEEDGRDSDEEGAEGHRDSQSASGEERPPEADGKKG-NSPNSEPPTPKTAWAE
          : .        .:  .  :   : ..   .:::   :. : ..: ..  .: .  .:
XP_011 KGTLTYL-------ADSPSPLGVSVSPQT---KRPPTKKGSAGPDTPIGNLSSPVSP-VE
           790              800          810       820       830   

          400              410        420       430       440      
pF1KB0 TSRPPE-------TEPGPPAPKPPLPPPHRG-PAGNWGPPGDYPDRGGPPCKPPAPEDED
       .:  ::       .. .: . . : ::  .: :. .   : .      :: . :.:    
XP_011 ASFLPENSLSFQGSKDSPATTHSPTPPSPKGAPTPSAVTPLSPKGVTLPPKETPTP----
            840       850       860       870       880            

        450       460       470       480       490       500      
pF1KB0 EAWRQRRKQSSSEISLAVERARRRREEEERRMQEERRAACAEKLKRLDEKFGAPDKRLKA
                  : ..:   .             :   .   ..   :.   ..: :. .:
XP_011 -----------SVVNLPFPK-------------EGPATPAPKQAPALSMTSSSP-KKARA
                 890                    900       910        920   

        510       520       530       540           550       560  
pF1KB0 EPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAPTPEKEPEEP----AQAPPAQSTPTP-
        :: : . :..:.:  :        :.:: :. :.:.  :  :    : .::: . :.: 
XP_011 TPA-PKGIPASPSPKGA--------PTPPAATPPSPKGGPATPSPKWAPTPPAATPPSPK
            930               940       950       960       970    

             570       580       590       600        610       620
pF1KB0 GVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPEPPEEVPP-PTTPPVPKVEPKG
       :  :.:.  .:. .  ...  : ...:. :. : : .: ::  .:: :   :.    :::
XP_011 GGPATPS-PKGAPTPPAATPPSPKGGPATPS-P-KGAPTPPAVTPPSPKGSPAATPFPKG
          980        990      1000        1010      1020      1030 

              630       640        650       660       670         
pF1KB0 DGIGPTRQPPSQGLGYPKYQKSLP-PRFQRQQQEQLLKQQQQHQWQQHQQGSAPPTPVPP
        .  :.  :::   : :    . : :.         : . .        .:.  :::   
XP_011 ASTPPAATPPSPK-GSPA---ATPLPKGAPTTPAATLPSPKGGPATPSLKGA--PTPPAA
            1040          1050      1060      1070        1080     

     680       690       700          710           720            
pF1KB0 SPPQPVTLGAVPAPQAPPPPPKALYP---GALGRPP----PMPPMNFDPR----WMMIPP
       .::.:    :.:.:.. : :: :  :   :.:. ::    :  :    :         ::
XP_011 TPPSPKGGPATPSPKGAPMPPAATPPSPKGGLATPPHKGAPTTPAATPPSPKGGLATPPP
        1090      1100      1110      1120      1130      1140     

      730       740            750       760       770       780   
pF1KB0 YVDPRLLQGRPP-----LDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRERGTP
          :    . ::     :   ::   :.  .    : .:: .. :  . ::.     .::
XP_011 KGAPTTPAATPPSPKGGLATPPPKGAPTTPAATPPSPKGGLAT-PSPKGAPT--TPAATP
        1150      1160      1170      1180       1190        1200  

           790       800        810       820       830       840  
pF1KB0 PVDPKLAWVGDVFTATPAEPRPLT-SPLRQAADEDDKGMRSETPPVPPPPPSSSAVFRLD
       : .:: . .     ..:. :     ::    :  . ::  . :: . :: :... .    
XP_011 P-SPKGGLATPSPKGAPTTPAATPPSPKGGLATPSPKGAPT-TPAATPPSPKGGPATPPP
            1210      1220      1230      1240       1250      1260

            850       860       870        880       890       900 
pF1KB0 QVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGP-PQAPQGPSPRPPTRYEPQRVNS
       .   . ::.   .:      .:....:   : :: .: : .   :::.      : .   
XP_011 KGAPTPPAATPPSL------KGGLATP---P-HKGAPNPAVVTPPSPKGGPATSPPK---
             1270            1280          1290      1300          

             910       920       930       940       950       960 
pF1KB0 GLSSDPHFEEPGPMVRGVGGTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFL
       :  . :    :.:  .:  :::  ..  .: ::      :.    :   . :  ...   
XP_011 GAPTPPAATPPSP--KGSPGTPPPKG--APTPPAVTPPSPKGTPTLPA-TTPSSKGGPTT
      1310      1320        1330        1340      1350       1360  

             970        980       990      1000      1010      1020
pF1KB0 GSKPEGPGPQAES-RDTGTEALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGT
        :. ::: : : .    :  :.::   .:  .  : :.  :.:  : . :::: . . .:
XP_011 PSSKEGPTPPAATPSHKGGPAMTPPSPKRGPAIPSPKG-DPTS--PAVIPLSP-KKAPAT
           1370      1380      1390      1400         1410         

             1030       1040      1050      1060      1070         
pF1KB0 EMSQSDSGVDLSGD-SQVSSGPCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPG
        ...  ...  .:: .  .  : : ...:     .: .: :  :. :.   ..:   ::.
XP_011 PVTREGAATPSKGDLTPPAVTPVSLKKAPA---TSAPKGGPATPS-SKGDPTLPAVTPPS
     1420      1430      1440         1450      1460       1470    

    1080      1090      1100      1110       1120      1130        
pF1KB0 SEPPRRPPPAPHDGDRKELPREQPLPPGPIGTERSQRT-DRGTEPGPIRPSHRPGPPVQF
          :..:: ::..   .  :.. :  :.:.:.     .   . .  :  :: :  : .  
XP_011 ---PKEPP-APKQVATSSSPKKAPATPAPMGAPTLPAVIPSSPKEVPATPSSRRDPIAPT
             1480      1490      1500      1510      1520      1530

     1140       1150      1160        1170      1180      1190     
pF1KB0 GTS-DKDSDLRLVVGDSLKAEKELTASV--TEAIPVSRDWELLPSAAASAEPQSKNLDSG
       .:  .: .   :.  ..:      . :   : :::. ..    ::.  .. : . . .. 
XP_011 ATLLSKKTPATLAPKEALIPPAMTVPSPKKTPAIPTPKEAPATPSSKEASSPPAVTPSTY
             1540      1550      1560      1570      1580      1590

        1200      1210      1220      1230      1240         1250  
pF1KB0 HCVPEPSSSGQRLYPEVFYGSAGPSSSQISGGAMDSQLHPNSGGFRP---GTPSLHPYRS
       . .: :.   . : : .    ..:: ..       .   :..:   :   :::.  :   
XP_011 KGAPSPK---ELLIPPAV---TSPSPKEAPTPPAVTPPSPEKGPATPAPKGTPTSPPVTP
                1600         1610      1620      1630      1640    

            1260               1270           1280      1290       
pF1KB0 QPLY-LPPGPAP---------PSALLSGVALKG-----QFLDFSTMQATELGKLPAGGVL
       . :   : .::          :.:  .  : ::     . :   . ..: .   :.    
XP_011 SSLKDSPTSPASVTCKMGATVPQASKGLPAKKGPTALKEVLVAPAPESTPIITAPTRKGP
         1650      1660      1670      1680      1690      1700    

      1300      1310            1320      1330      1340      1350 
pF1KB0 YPPPSFLYSPAFCPSPLPDT------SLLQVRQDLPSPSDFYSTPLQPGGQSGFLPSGA-
           :   :: .::.:   .      : .     ::  .:  :.    : ...  :.:  
XP_011 QTKKSSATSPPICPDPSAKNGSKGPLSTVAPAPLLPVQKD--SSKTAKGKDASHSPKGPL
         1710      1720      1730      1740        1750      1760  

               1360          1370       1380      1390      1400   
pF1KB0 --PAQQMLLPMV----DSQLPVVNFGSLPPAP-PPAPPPLSLLPVGPALQPPSLAVRPPP
         : ..   :..    .. ::  . .:.  :: ::.  ::.  :: :.: : .  .  : 
XP_011 APPESKASTPLTAAAFEKVLPKPESASVSAAPSPPVSLPLAPSPV-PTLPPKQQFL--PS
           1770      1780      1790      1800       1810           

          1410      1420       1430         1440      1450         
pF1KB0 APATRVLPSPARPFPASLGRAELHP-VELKPFQD---YQKLSSNLGGPGSSRTP---PTG
       .:.  :: ::..:. :   . :: : .  .:..    .:..  :.  : :.  :   :..
XP_011 SPGL-VLESPSKPL-APADEDELLPLIPPEPISGGVPFQSVLVNMPTPKSAGIPVPTPSA
    1820       1830       1840      1850      1860      1870       

       1460      1470      1480      1490      1500      1510      
pF1KB0 RSFSGLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRA
       ..    :.. ..: :                                             
XP_011 KQPVTKNNKGSGTESDSDESVPELEEQDSTQATTQQAQLAAAAEIDEEPVSKAKQSRSEK
      1880      1890      1900      1910      1920      1930       

>>XP_006719475 (OMIM: 601234) PREDICTED: nascent polypep  (2082 aa)
 initn: 244 init1: 149 opt: 585  Z-score: 219.6  bits: 53.8 E(85289): 1.7e-05
Smith-Waterman score: 862; 24.4% identity (45.6% similar) in 1545 aa overlap (30-1471:474-1892)

                10        20        30           40        50      
pF1KB0  MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPA---VAPRHGLQSLGKVAIARRM
                                     ..:  .::   .::    .   .:: . :.
XP_006 TNPCTIAAAPTTTFEVATCVSPPMSSGPISNIEPTSPAALVMAPVAPKEPSTQVATTLRI
           450       460       470       480       490       500   

         60        70          80          90       100       110  
pF1KB0 PPPANLPSLKAENKGNDPNVSLV--P--KDGTGWASKQEQSDPKSSDASTAQPLESQPLP
       :    ::.   :.  : :.  ::  :  ::     .. : .  . ..:. .   .   ::
XP_006 PVSPPLPD--PEDLKNLPSSVLVKFPTQKDLQTVPASLEGAPFSPAQAGLTTKKDPTVLP
           510         520       530       540       550       560 

            120         130       140       150        160         
pF1KB0 ASQTPASNQP--KRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGR-ASSLLSRF----
         :.  .:.:  .   ..::  :: : .  . :. :.  :     :. :::. : .    
XP_006 LVQAAPKNSPSFQSTSSSPE-IPLSPEA--TLAKKSL--GEPLPIGKPASSMTSPLGVNS
             570       580          590         600       610      

         170       180       190       200       210       220     
pF1KB0 SREEFPTLQAAGDQDKAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKL
       :   . : . ::  :.:.   .:.  .  :  .  : .:.   : .: .:   .: ..  
XP_006 SASVIKTDSYAGP-DSAGPLLKSSLIT--PTVAAFPLESA---DPAGVAPTTAKGTSTYT
        620        630       640         650          660       670

         230       240       250           260        270          
pF1KB0 HHGHDPRGGLQPSGPPQFPPYRGMMPPFMYPPYL----PFPP-PYGPQGPYR--YPTPDG
         .     :    .: . :  .: .  .   :      :  : : .  .:      .:. 
XP_006 TTASPFLEGTVSLAPKNHPVKEGTLTTLPLVPTASENCPVAPSPQNTCAPLATLVLAPEI
              680       690       700       710       720       730

      280        290       300         310       320       330     
pF1KB0 PSRFPRVA-GPRGSGPPMRLVEPVGRPSILKE--DNLKEFDQLDQENDDGWAGAHEEVDY
       :.  :  .  : :. :  . :. ... : :    .. ::    :       .::   .. 
XP_006 PKSVPSPSLPPAGTPPGTKKVDGISHTSALAPVASSPKECPTED-------SGASATASS
              740       750       760       770              780   

         340       350       360       370        380       390    
pF1KB0 TEKLKFSDEEDGRDSDEEGAEGHRDSQSASGEERPPEADGKKG-NSPNSEPPTPKTAWAE
          : .        .:  .  :   : ..   .:::   :. : ..: ..  .: .  .:
XP_006 KGTLTYL-------ADSPSPLGVSVSPQT---KRPPTKKGSAGPDTPIGNLSSPVSP-VE
           790              800          810       820       830   

          400              410        420       430       440      
pF1KB0 TSRPPE-------TEPGPPAPKPPLPPPHRG-PAGNWGPPGDYPDRGGPPCKPPAPEDED
       .:  ::       .. .: . . : ::  .: :. .   : .      :: . :.:    
XP_006 ASFLPENSLSFQGSKDSPATTHSPTPPSPKGAPTPSAVTPLSPKGVTLPPKETPTP----
            840       850       860       870       880            

        450       460       470       480       490       500      
pF1KB0 EAWRQRRKQSSSEISLAVERARRRREEEERRMQEERRAACAEKLKRLDEKFGAPDKRLKA
                  : ..:   .             :   .   ..   :.   ..: :. .:
XP_006 -----------SVVNLPFPK-------------EGPATPAPKQAPALSMTSSSP-KKARA
                 890                    900       910        920   

        510       520       530       540           550       560  
pF1KB0 EPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAPTPEKEPEEP----AQAPPAQSTPTP-
        :: : . :..:.:  :        :.:: :. :.:.  :  :    : .::: . :.: 
XP_006 TPA-PKGIPASPSPKGA--------PTPPAATPPSPKGGPATPSPKWAPTPPAATPPSPK
            930               940       950       960       970    

             570       580       590       600        610       620
pF1KB0 GVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPEPPEEVPP-PTTPPVPKVEPKG
       :  :.:.  .:. .  ...  : ...:. :. : : .: ::  .:: :   :.    :::
XP_006 GGPATPS-PKGAPTPPAATPPSPKGGPATPS-P-KGAPTPPAVTPPSPKGSPAATPFPKG
          980        990      1000        1010      1020      1030 

              630       640        650       660       670         
pF1KB0 DGIGPTRQPPSQGLGYPKYQKSLP-PRFQRQQQEQLLKQQQQHQWQQHQQGSAPPTPVPP
        .  :.  :::   : :    . : :.         : . .        .:.  :::   
XP_006 ASTPPAATPPSPK-GSPA---ATPLPKGAPTTPAATLPSPKGGPATPSLKGA--PTPPAA
            1040          1050      1060      1070        1080     

     680       690       700          710           720            
pF1KB0 SPPQPVTLGAVPAPQAPPPPPKALYP---GALGRPP----PMPPMNFDPR----WMMIPP
       .::.:    :.:.:.. : :: :  :   :.:. ::    :  :    :         ::
XP_006 TPPSPKGGPATPSPKGAPMPPAATPPSPKGGLATPPHKGAPTTPAATPPSPKGGLATPPP
        1090      1100      1110      1120      1130      1140     

      730       740            750       760       770       780   
pF1KB0 YVDPRLLQGRPP-----LDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRERGTP
          :    . ::     :   ::   :.  .    : .:: .. :  . ::.     .::
XP_006 KGAPTTPAATPPSPKGGLATPPPKGAPTTPAATPPSPKGGLAT-PSPKGAPT--TPAATP
        1150      1160      1170      1180       1190        1200  

           790       800        810       820       830       840  
pF1KB0 PVDPKLAWVGDVFTATPAEPRPLT-SPLRQAADEDDKGMRSETPPVPPPPPSSSAVFRLD
       : .:: . .     ..:. :     ::    :  . ::  . :: . :: :... .    
XP_006 P-SPKGGLATPSPKGAPTTPAATPPSPKGGLATPSPKGAPT-TPAATPPSPKGGPATPPP
            1210      1220      1230      1240       1250      1260

            850       860       870        880       890       900 
pF1KB0 QVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGP-PQAPQGPSPRPPTRYEPQRVNS
       .   . ::.   .:      .:....:   : :: .: : .   :::.      : .   
XP_006 KGAPTPPAATPPSL------KGGLATP---P-HKGAPNPAVVTPPSPKGGPATSPPK---
             1270            1280          1290      1300          

             910       920       930       940       950       960 
pF1KB0 GLSSDPHFEEPGPMVRGVGGTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFL
       :  . :    :.:  .:  :::  ..  .: ::      :.    :   . :  ...   
XP_006 GAPTPPAATPPSP--KGSPGTPPPKG--APTPPAVTPPSPKGTPTLPA-TTPSSKGGPTT
      1310      1320        1330        1340      1350       1360  

             970        980       990      1000      1010      1020
pF1KB0 GSKPEGPGPQAES-RDTGTEALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGT
        :. ::: : : .    :  :.::   .:  .  : :.  :.:  : . :::: . . .:
XP_006 PSSKEGPTPPAATPSHKGGPAMTPPSPKRGPAIPSPKG-DPTS--PAVIPLSP-KKAPAT
           1370      1380      1390      1400         1410         

             1030       1040      1050      1060      1070         
pF1KB0 EMSQSDSGVDLSGD-SQVSSGPCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPG
        ...  ...  .:: .  .  : : ...:     .: .: :  :. :.   ..:   ::.
XP_006 PVTREGAATPSKGDLTPPAVTPVSLKKAPA---TSAPKGGPATPS-SKGDPTLPAVTPPS
     1420      1430      1440         1450      1460       1470    

    1080      1090      1100      1110       1120      1130        
pF1KB0 SEPPRRPPPAPHDGDRKELPREQPLPPGPIGTERSQRT-DRGTEPGPIRPSHRPGPPVQF
          :..:: ::..   .  :.. :  :.:.:.     .   . .  :  :: :  : .  
XP_006 ---PKEPP-APKQVATSSSPKKAPATPAPMGAPTLPAVIPSSPKEVPATPSSRRDPIAPT
             1480      1490      1500      1510      1520      1530

     1140       1150      1160        1170      1180      1190     
pF1KB0 GTS-DKDSDLRLVVGDSLKAEKELTASV--TEAIPVSRDWELLPSAAASAEPQSKNLDSG
       .:  .: .   :.  ..:      . :   : :::. ..    ::.  .. : . . .. 
XP_006 ATLLSKKTPATLAPKEALIPPAMTVPSPKKTPAIPTPKEAPATPSSKEASSPPAVTPSTY
             1540      1550      1560      1570      1580      1590

        1200      1210      1220      1230      1240         1250  
pF1KB0 HCVPEPSSSGQRLYPEVFYGSAGPSSSQISGGAMDSQLHPNSGGFRP---GTPSLHPYRS
       . .: :.   . : : .    ..:: ..       .   :..:   :   :::.  :   
XP_006 KGAPSPK---ELLIPPAV---TSPSPKEAPTPPAVTPPSPEKGPATPAPKGTPTSPPVTP
                1600         1610      1620      1630      1640    

            1260               1270           1280      1290       
pF1KB0 QPLY-LPPGPAP---------PSALLSGVALKG-----QFLDFSTMQATELGKLPAGGVL
       . :   : .::          :.:  .  : ::     . :   . ..: .   :.    
XP_006 SSLKDSPTSPASVTCKMGATVPQASKGLPAKKGPTALKEVLVAPAPESTPIITAPTRKGP
         1650      1660      1670      1680      1690      1700    

      1300      1310            1320      1330      1340      1350 
pF1KB0 YPPPSFLYSPAFCPSPLPDT------SLLQVRQDLPSPSDFYSTPLQPGGQSGFLPSGA-
           :   :: .::.:   .      : .     ::  .:  :.    : ...  :.:  
XP_006 QTKKSSATSPPICPDPSAKNGSKGPLSTVAPAPLLPVQKD--SSKTAKGKDASHSPKGPL
         1710      1720      1730      1740        1750      1760  

               1360          1370       1380      1390      1400   
pF1KB0 --PAQQMLLPMV----DSQLPVVNFGSLPPAP-PPAPPPLSLLPVGPALQPPSLAVRPPP
         : ..   :..    .. ::  . .:.  :: ::.  ::.  :: :.: : .  .  : 
XP_006 APPESKASTPLTAAAFEKVLPKPESASVSAAPSPPVSLPLAPSPV-PTLPPKQQFL--PS
           1770      1780      1790      1800       1810           

          1410      1420       1430         1440      1450         
pF1KB0 APATRVLPSPARPFPASLGRAELHP-VELKPFQD---YQKLSSNLGGPGSSRTP---PTG
       .:.  :: ::..:. :   . :: : .  .:..    .:..  :.  : :.  :   :..
XP_006 SPGL-VLESPSKPL-APADEDELLPLIPPEPISGGVPFQSVLVNMPTPKSAGIPVPTPSA
    1820       1830       1840      1850      1860      1870       

       1460      1470      1480      1490      1500      1510      
pF1KB0 RSFSGLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRA
       ..    :.. ..: :                                             
XP_006 KQPVTKNNKGSGTESDSDESVPELEEQDSTQATTQQAQLAAAAEIDEEPVSKAKQSRSEK
      1880      1890      1900      1910      1920      1930       

>>XP_006719476 (OMIM: 601234) PREDICTED: nascent polypep  (2082 aa)
 initn: 244 init1: 149 opt: 585  Z-score: 219.6  bits: 53.8 E(85289): 1.7e-05
Smith-Waterman score: 862; 24.4% identity (45.6% similar) in 1545 aa overlap (30-1471:474-1892)

                10        20        30           40        50      
pF1KB0  MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPA---VAPRHGLQSLGKVAIARRM
                                     ..:  .::   .::    .   .:: . :.
XP_006 TNPCTIAAAPTTTFEVATCVSPPMSSGPISNIEPTSPAALVMAPVAPKEPSTQVATTLRI
           450       460       470       480       490       500   

         60        70          80          90       100       110  
pF1KB0 PPPANLPSLKAENKGNDPNVSLV--P--KDGTGWASKQEQSDPKSSDASTAQPLESQPLP
       :    ::.   :.  : :.  ::  :  ::     .. : .  . ..:. .   .   ::
XP_006 PVSPPLPD--PEDLKNLPSSVLVKFPTQKDLQTVPASLEGAPFSPAQAGLTTKKDPTVLP
           510         520       530       540       550       560 

            120         130       140       150        160         
pF1KB0 ASQTPASNQP--KRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGR-ASSLLSRF----
         :.  .:.:  .   ..::  :: : .  . :. :.  :     :. :::. : .    
XP_006 LVQAAPKNSPSFQSTSSSPE-IPLSPEA--TLAKKSL--GEPLPIGKPASSMTSPLGVNS
             570       580          590         600       610      

         170       180       190       200       210       220     
pF1KB0 SREEFPTLQAAGDQDKAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKL
       :   . : . ::  :.:.   .:.  .  :  .  : .:.   : .: .:   .: ..  
XP_006 SASVIKTDSYAGP-DSAGPLLKSSLIT--PTVAAFPLESA---DPAGVAPTTAKGTSTYT
        620        630       640         650          660       670

         230       240       250           260        270          
pF1KB0 HHGHDPRGGLQPSGPPQFPPYRGMMPPFMYPPYL----PFPP-PYGPQGPYR--YPTPDG
         .     :    .: . :  .: .  .   :      :  : : .  .:      .:. 
XP_006 TTASPFLEGTVSLAPKNHPVKEGTLTTLPLVPTASENCPVAPSPQNTCAPLATLVLAPEI
              680       690       700       710       720       730

      280        290       300         310       320       330     
pF1KB0 PSRFPRVA-GPRGSGPPMRLVEPVGRPSILKE--DNLKEFDQLDQENDDGWAGAHEEVDY
       :.  :  .  : :. :  . :. ... : :    .. ::    :       .::   .. 
XP_006 PKSVPSPSLPPAGTPPGTKKVDGISHTSALAPVASSPKECPTED-------SGASATASS
              740       750       760       770              780   

         340       350       360       370        380       390    
pF1KB0 TEKLKFSDEEDGRDSDEEGAEGHRDSQSASGEERPPEADGKKG-NSPNSEPPTPKTAWAE
          : .        .:  .  :   : ..   .:::   :. : ..: ..  .: .  .:
XP_006 KGTLTYL-------ADSPSPLGVSVSPQT---KRPPTKKGSAGPDTPIGNLSSPVSP-VE
           790              800          810       820       830   

          400              410        420       430       440      
pF1KB0 TSRPPE-------TEPGPPAPKPPLPPPHRG-PAGNWGPPGDYPDRGGPPCKPPAPEDED
       .:  ::       .. .: . . : ::  .: :. .   : .      :: . :.:    
XP_006 ASFLPENSLSFQGSKDSPATTHSPTPPSPKGAPTPSAVTPLSPKGVTLPPKETPTP----
            840       850       860       870       880            

        450       460       470       480       490       500      
pF1KB0 EAWRQRRKQSSSEISLAVERARRRREEEERRMQEERRAACAEKLKRLDEKFGAPDKRLKA
                  : ..:   .             :   .   ..   :.   ..: :. .:
XP_006 -----------SVVNLPFPK-------------EGPATPAPKQAPALSMTSSSP-KKARA
                 890                    900       910        920   

        510       520       530       540           550       560  
pF1KB0 EPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAPTPEKEPEEP----AQAPPAQSTPTP-
        :: : . :..:.:  :        :.:: :. :.:.  :  :    : .::: . :.: 
XP_006 TPA-PKGIPASPSPKGA--------PTPPAATPPSPKGGPATPSPKWAPTPPAATPPSPK
            930               940       950       960       970    

             570       580       590       600        610       620
pF1KB0 GVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPEPPEEVPP-PTTPPVPKVEPKG
       :  :.:.  .:. .  ...  : ...:. :. : : .: ::  .:: :   :.    :::
XP_006 GGPATPS-PKGAPTPPAATPPSPKGGPATPS-P-KGAPTPPAVTPPSPKGSPAATPFPKG
          980        990      1000        1010      1020      1030 

              630       640        650       660       670         
pF1KB0 DGIGPTRQPPSQGLGYPKYQKSLP-PRFQRQQQEQLLKQQQQHQWQQHQQGSAPPTPVPP
        .  :.  :::   : :    . : :.         : . .        .:.  :::   
XP_006 ASTPPAATPPSPK-GSPA---ATPLPKGAPTTPAATLPSPKGGPATPSLKGA--PTPPAA
            1040          1050      1060      1070        1080     

     680       690       700          710           720            
pF1KB0 SPPQPVTLGAVPAPQAPPPPPKALYP---GALGRPP----PMPPMNFDPR----WMMIPP
       .::.:    :.:.:.. : :: :  :   :.:. ::    :  :    :         ::
XP_006 TPPSPKGGPATPSPKGAPMPPAATPPSPKGGLATPPHKGAPTTPAATPPSPKGGLATPPP
        1090      1100      1110      1120      1130      1140     

      730       740            750       760       770       780   
pF1KB0 YVDPRLLQGRPP-----LDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRERGTP
          :    . ::     :   ::   :.  .    : .:: .. :  . ::.     .::
XP_006 KGAPTTPAATPPSPKGGLATPPPKGAPTTPAATPPSPKGGLAT-PSPKGAPT--TPAATP
        1150      1160      1170      1180       1190        1200  

           790       800        810       820       830       840  
pF1KB0 PVDPKLAWVGDVFTATPAEPRPLT-SPLRQAADEDDKGMRSETPPVPPPPPSSSAVFRLD
       : .:: . .     ..:. :     ::    :  . ::  . :: . :: :... .    
XP_006 P-SPKGGLATPSPKGAPTTPAATPPSPKGGLATPSPKGAPT-TPAATPPSPKGGPATPPP
            1210      1220      1230      1240       1250      1260

            850       860       870        880       890       900 
pF1KB0 QVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGP-PQAPQGPSPRPPTRYEPQRVNS
       .   . ::.   .:      .:....:   : :: .: : .   :::.      : .   
XP_006 KGAPTPPAATPPSL------KGGLATP---P-HKGAPNPAVVTPPSPKGGPATSPPK---
             1270            1280          1290      1300          

             910       920       930       940       950       960 
pF1KB0 GLSSDPHFEEPGPMVRGVGGTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFL
       :  . :    :.:  .:  :::  ..  .: ::      :.    :   . :  ...   
XP_006 GAPTPPAATPPSP--KGSPGTPPPKG--APTPPAVTPPSPKGTPTLPA-TTPSSKGGPTT
      1310      1320        1330        1340      1350       1360  

             970        980       990      1000      1010      1020
pF1KB0 GSKPEGPGPQAES-RDTGTEALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGT
        :. ::: : : .    :  :.::   .:  .  : :.  :.:  : . :::: . . .:
XP_006 PSSKEGPTPPAATPSHKGGPAMTPPSPKRGPAIPSPKG-DPTS--PAVIPLSP-KKAPAT
           1370      1380      1390      1400         1410         

             1030       1040      1050      1060      1070         
pF1KB0 EMSQSDSGVDLSGD-SQVSSGPCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPG
        ...  ...  .:: .  .  : : ...:     .: .: :  :. :.   ..:   ::.
XP_006 PVTREGAATPSKGDLTPPAVTPVSLKKAPA---TSAPKGGPATPS-SKGDPTLPAVTPPS
     1420      1430      1440         1450      1460       1470    

    1080      1090      1100      1110       1120      1130        
pF1KB0 SEPPRRPPPAPHDGDRKELPREQPLPPGPIGTERSQRT-DRGTEPGPIRPSHRPGPPVQF
          :..:: ::..   .  :.. :  :.:.:.     .   . .  :  :: :  : .  
XP_006 ---PKEPP-APKQVATSSSPKKAPATPAPMGAPTLPAVIPSSPKEVPATPSSRRDPIAPT
             1480      1490      1500      1510      1520      1530

     1140       1150      1160        1170      1180      1190     
pF1KB0 GTS-DKDSDLRLVVGDSLKAEKELTASV--TEAIPVSRDWELLPSAAASAEPQSKNLDSG
       .:  .: .   :.  ..:      . :   : :::. ..    ::.  .. : . . .. 
XP_006 ATLLSKKTPATLAPKEALIPPAMTVPSPKKTPAIPTPKEAPATPSSKEASSPPAVTPSTY
             1540      1550      1560      1570      1580      1590

        1200      1210      1220      1230      1240         1250  
pF1KB0 HCVPEPSSSGQRLYPEVFYGSAGPSSSQISGGAMDSQLHPNSGGFRP---GTPSLHPYRS
       . .: :.   . : : .    ..:: ..       .   :..:   :   :::.  :   
XP_006 KGAPSPK---ELLIPPAV---TSPSPKEAPTPPAVTPPSPEKGPATPAPKGTPTSPPVTP
                1600         1610      1620      1630      1640    

            1260               1270           1280      1290       
pF1KB0 QPLY-LPPGPAP---------PSALLSGVALKG-----QFLDFSTMQATELGKLPAGGVL
       . :   : .::          :.:  .  : ::     . :   . ..: .   :.    
XP_006 SSLKDSPTSPASVTCKMGATVPQASKGLPAKKGPTALKEVLVAPAPESTPIITAPTRKGP
         1650      1660      1670      1680      1690      1700    

      1300      1310            1320      1330      1340      1350 
pF1KB0 YPPPSFLYSPAFCPSPLPDT------SLLQVRQDLPSPSDFYSTPLQPGGQSGFLPSGA-
           :   :: .::.:   .      : .     ::  .:  :.    : ...  :.:  
XP_006 QTKKSSATSPPICPDPSAKNGSKGPLSTVAPAPLLPVQKD--SSKTAKGKDASHSPKGPL
         1710      1720      1730      1740        1750      1760  

               1360          1370       1380      1390      1400   
pF1KB0 --PAQQMLLPMV----DSQLPVVNFGSLPPAP-PPAPPPLSLLPVGPALQPPSLAVRPPP
         : ..   :..    .. ::  . .:.  :: ::.  ::.  :: :.: : .  .  : 
XP_006 APPESKASTPLTAAAFEKVLPKPESASVSAAPSPPVSLPLAPSPV-PTLPPKQQFL--PS
           1770      1780      1790      1800       1810           

          1410      1420       1430         1440      1450         
pF1KB0 APATRVLPSPARPFPASLGRAELHP-VELKPFQD---YQKLSSNLGGPGSSRTP---PTG
       .:.  :: ::..:. :   . :: : .  .:..    .:..  :.  : :.  :   :..
XP_006 SPGL-VLESPSKPL-APADEDELLPLIPPEPISGGVPFQSVLVNMPTPKSAGIPVPTPSA
    1820       1830       1840      1850      1860      1870       

       1460      1470      1480      1490      1500      1510      
pF1KB0 RSFSGLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRA
       ..    :.. ..: :                                             
XP_006 KQPVTKNNKGSGTESDSDESVPELEEQDSTQATTQQAQLAAAAEIDEEPVSKAKQSRSEK
      1880      1890      1900      1910      1920      1930       

>>XP_006719477 (OMIM: 601234) PREDICTED: nascent polypep  (2082 aa)
 initn: 244 init1: 149 opt: 585  Z-score: 219.6  bits: 53.8 E(85289): 1.7e-05
Smith-Waterman score: 862; 24.4% identity (45.6% similar) in 1545 aa overlap (30-1471:474-1892)

                10        20        30           40        50      
pF1KB0  MSDRSGPTAKGKDGKKYSSLNLFDTYKGKSLEIQKPA---VAPRHGLQSLGKVAIARRM
                                     ..:  .::   .::    .   .:: . :.
XP_006 TNPCTIAAAPTTTFEVATCVSPPMSSGPISNIEPTSPAALVMAPVAPKEPSTQVATTLRI
           450       460       470       480       490       500   

         60        70          80          90       100       110  
pF1KB0 PPPANLPSLKAENKGNDPNVSLV--P--KDGTGWASKQEQSDPKSSDASTAQPLESQPLP
       :    ::.   :.  : :.  ::  :  ::     .. : .  . ..:. .   .   ::
XP_006 PVSPPLPD--PEDLKNLPSSVLVKFPTQKDLQTVPASLEGAPFSPAQAGLTTKKDPTVLP
           510         520       530       540       550       560 

            120         130       140       150        160         
pF1KB0 ASQTPASNQP--KRPPAAPENTPLVPSGVKSWAQASVTHGAHGDGGR-ASSLLSRF----
         :.  .:.:  .   ..::  :: : .  . :. :.  :     :. :::. : .    
XP_006 LVQAAPKNSPSFQSTSSSPE-IPLSPEA--TLAKKSL--GEPLPIGKPASSMTSPLGVNS
             570       580          590         600       610      

         170       180       190       200       210       220     
pF1KB0 SREEFPTLQAAGDQDKAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKL
       :   . : . ::  :.:.   .:.  .  :  .  : .:.   : .: .:   .: ..  
XP_006 SASVIKTDSYAGP-DSAGPLLKSSLIT--PTVAAFPLESA---DPAGVAPTTAKGTSTYT
        620        630       640         650          660       670

         230       240       250           260        270          
pF1KB0 HHGHDPRGGLQPSGPPQFPPYRGMMPPFMYPPYL----PFPP-PYGPQGPYR--YPTPDG
         .     :    .: . :  .: .  .   :      :  : : .  .:      .:. 
XP_006 TTASPFLEGTVSLAPKNHPVKEGTLTTLPLVPTASENCPVAPSPQNTCAPLATLVLAPEI
              680       690       700       710       720       730

      280        290       300         310       320       330     
pF1KB0 PSRFPRVA-GPRGSGPPMRLVEPVGRPSILKE--DNLKEFDQLDQENDDGWAGAHEEVDY
       :.  :  .  : :. :  . :. ... : :    .. ::    :       .::   .. 
XP_006 PKSVPSPSLPPAGTPPGTKKVDGISHTSALAPVASSPKECPTED-------SGASATASS
              740       750       760       770              780   

         340       350       360       370        380       390    
pF1KB0 TEKLKFSDEEDGRDSDEEGAEGHRDSQSASGEERPPEADGKKG-NSPNSEPPTPKTAWAE
          : .        .:  .  :   : ..   .:::   :. : ..: ..  .: .  .:
XP_006 KGTLTYL-------ADSPSPLGVSVSPQT---KRPPTKKGSAGPDTPIGNLSSPVSP-VE
           790              800          810       820       830   

          400              410        420       430       440      
pF1KB0 TSRPPE-------TEPGPPAPKPPLPPPHRG-PAGNWGPPGDYPDRGGPPCKPPAPEDED
       .:  ::       .. .: . . : ::  .: :. .   : .      :: . :.:    
XP_006 ASFLPENSLSFQGSKDSPATTHSPTPPSPKGAPTPSAVTPLSPKGVTLPPKETPTP----
            840       850       860       870       880            

        450       460       470       480       490       500      
pF1KB0 EAWRQRRKQSSSEISLAVERARRRREEEERRMQEERRAACAEKLKRLDEKFGAPDKRLKA
                  : ..:   .             :   .   ..   :.   ..: :. .:
XP_006 -----------SVVNLPFPK-------------EGPATPAPKQAPALSMTSSSP-KKARA
                 890                    900       910        920   

        510       520       530       540           550       560  
pF1KB0 EPAAPPAAPSTPAPPPAVPKELPAPPAPPPASAPTPEKEPEEP----AQAPPAQSTPTP-
        :: : . :..:.:  :        :.:: :. :.:.  :  :    : .::: . :.: 
XP_006 TPA-PKGIPASPSPKGA--------PTPPAATPPSPKGGPATPSPKWAPTPPAATPPSPK
            930               940       950       960       970    

             570       580       590       600        610       620
pF1KB0 GVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPEPPEEVPP-PTTPPVPKVEPKG
       :  :.:.  .:. .  ...  : ...:. :. : : .: ::  .:: :   :.    :::
XP_006 GGPATPS-PKGAPTPPAATPPSPKGGPATPS-P-KGAPTPPAVTPPSPKGSPAATPFPKG
          980        990      1000        1010      1020      1030 

              630       640        650       660       670         
pF1KB0 DGIGPTRQPPSQGLGYPKYQKSLP-PRFQRQQQEQLLKQQQQHQWQQHQQGSAPPTPVPP
        .  :.  :::   : :    . : :.         : . .        .:.  :::   
XP_006 ASTPPAATPPSPK-GSPA---ATPLPKGAPTTPAATLPSPKGGPATPSLKGA--PTPPAA
            1040          1050      1060      1070        1080     

     680       690       700          710           720            
pF1KB0 SPPQPVTLGAVPAPQAPPPPPKALYP---GALGRPP----PMPPMNFDPR----WMMIPP
       .::.:    :.:.:.. : :: :  :   :.:. ::    :  :    :         ::
XP_006 TPPSPKGGPATPSPKGAPMPPAATPPSPKGGLATPPHKGAPTTPAATPPSPKGGLATPPP
        1090      1100      1110      1120      1130      1140     

      730       740            750       760       770       780   
pF1KB0 YVDPRLLQGRPP-----LDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRERGTP
          :    . ::     :   ::   :.  .    : .:: .. :  . ::.     .::
XP_006 KGAPTTPAATPPSPKGGLATPPPKGAPTTPAATPPSPKGGLAT-PSPKGAPT--TPAATP
        1150      1160      1170      1180       1190        1200  

           790       800        810       820       830       840  
pF1KB0 PVDPKLAWVGDVFTATPAEPRPLT-SPLRQAADEDDKGMRSETPPVPPPPPSSSAVFRLD
       : .:: . .     ..:. :     ::    :  . ::  . :: . :: :... .    
XP_006 P-SPKGGLATPSPKGAPTTPAATPPSPKGGLATPSPKGAPT-TPAATPPSPKGGPATPPP
            1210      1220      1230      1240       1250      1260

            850       860       870        880       890       900 
pF1KB0 QVIHSNPAGIQQALAQLSSRQGSVTAPGGHPRHKPGP-PQAPQGPSPRPPTRYEPQRVNS
       .   . ::.   .:      .:....:   : :: .: : .   :::.      : .   
XP_006 KGAPTPPAATPPSL------KGGLATP---P-HKGAPNPAVVTPPSPKGGPATSPPK---
             1270            1280          1290      1300          

             910       920       930       940       950       960 
pF1KB0 GLSSDPHFEEPGPMVRGVGGTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFL
       :  . :    :.:  .:  :::  ..  .: ::      :.    :   . :  ...   
XP_006 GAPTPPAATPPSP--KGSPGTPPPKG--APTPPAVTPPSPKGTPTLPA-TTPSSKGGPTT
      1310      1320        1330        1340      1350       1360  

             970        980       990      1000      1010      1020
pF1KB0 GSKPEGPGPQAES-RDTGTEALTPHIWNRLHTATSRKSYRPSSMEPWMEPLSPFEDVAGT
        :. ::: : : .    :  :.::   .:  .  : :.  :.:  : . :::: . . .:
XP_006 PSSKEGPTPPAATPSHKGGPAMTPPSPKRGPAIPSPKG-DPTS--PAVIPLSP-KKAPAT
           1370      1380      1390      1400         1410         

             1030       1040      1050      1060      1070         
pF1KB0 EMSQSDSGVDLSGD-SQVSSGPCSQRSSPDGGLKGAAEGPPKRPGGSSPLNAVPCEGPPG
        ...  ...  .:: .  .  : : ...:     .: .: :  :. :.   ..:   ::.
XP_006 PVTREGAATPSKGDLTPPAVTPVSLKKAPA---TSAPKGGPATPS-SKGDPTLPAVTPPS
     1420      1430      1440         1450      1460       1470    

    1080      1090      1100      1110       1120      1130        
pF1KB0 SEPPRRPPPAPHDGDRKELPREQPLPPGPIGTERSQRT-DRGTEPGPIRPSHRPGPPVQF
          :..:: ::..   .  :.. :  :.:.:.     .   . .  :  :: :  : .  
XP_006 ---PKEPP-APKQVATSSSPKKAPATPAPMGAPTLPAVIPSSPKEVPATPSSRRDPIAPT
             1480      1490      1500      1510      1520      1530

     1140       1150      1160        1170      1180      1190     
pF1KB0 GTS-DKDSDLRLVVGDSLKAEKELTASV--TEAIPVSRDWELLPSAAASAEPQSKNLDSG
       .:  .: .   :.  ..:      . :   : :::. ..    ::.  .. : . . .. 
XP_006 ATLLSKKTPATLAPKEALIPPAMTVPSPKKTPAIPTPKEAPATPSSKEASSPPAVTPSTY
             1540      1550      1560      1570      1580      1590

        1200      1210      1220      1230      1240         1250  
pF1KB0 HCVPEPSSSGQRLYPEVFYGSAGPSSSQISGGAMDSQLHPNSGGFRP---GTPSLHPYRS
       . .: :.   . : : .    ..:: ..       .   :..:   :   :::.  :   
XP_006 KGAPSPK---ELLIPPAV---TSPSPKEAPTPPAVTPPSPEKGPATPAPKGTPTSPPVTP
                1600         1610      1620      1630      1640    

            1260               1270           1280      1290       
pF1KB0 QPLY-LPPGPAP---------PSALLSGVALKG-----QFLDFSTMQATELGKLPAGGVL
       . :   : .::          :.:  .  : ::     . :   . ..: .   :.    
XP_006 SSLKDSPTSPASVTCKMGATVPQASKGLPAKKGPTALKEVLVAPAPESTPIITAPTRKGP
         1650      1660      1670      1680      1690      1700    

      1300      1310            1320      1330      1340      1350 
pF1KB0 YPPPSFLYSPAFCPSPLPDT------SLLQVRQDLPSPSDFYSTPLQPGGQSGFLPSGA-
           :   :: .::.:   .      : .     ::  .:  :.    : ...  :.:  
XP_006 QTKKSSATSPPICPDPSAKNGSKGPLSTVAPAPLLPVQKD--SSKTAKGKDASHSPKGPL
         1710      1720      1730      1740        1750      1760  

               1360          1370       1380      1390      1400   
pF1KB0 --PAQQMLLPMV----DSQLPVVNFGSLPPAP-PPAPPPLSLLPVGPALQPPSLAVRPPP
         : ..   :..    .. ::  . .:.  :: ::.  ::.  :: :.: : .  .  : 
XP_006 APPESKASTPLTAAAFEKVLPKPESASVSAAPSPPVSLPLAPSPV-PTLPPKQQFL--PS
           1770      1780      1790      1800       1810           

          1410      1420       1430         1440      1450         
pF1KB0 APATRVLPSPARPFPASLGRAELHP-VELKPFQD---YQKLSSNLGGPGSSRTP---PTG
       .:.  :: ::..:. :   . :: : .  .:..    .:..  :.  : :.  :   :..
XP_006 SPGL-VLESPSKPL-APADEDELLPLIPPEPISGGVPFQSVLVNMPTPKSAGIPVPTPSA
    1820       1830       1840      1850      1860      1870       

       1460      1470      1480      1490      1500      1510      
pF1KB0 RSFSGLNSRLKATPSTYSGVFRTQRVDLYQQASPPDALRWIPKPWERTGPPPREGPSRRA
       ..    :.. ..: :                                             
XP_006 KQPVTKNNKGSGTESDSDESVPELEEQDSTQATTQQAQLAAAAEIDEEPVSKAKQSRSEK
      1880      1890      1900      1910      1920      1930       

>>XP_011529151 (OMIM: 301050,303630) PREDICTED: collagen  (1696 aa)
 initn: 260 init1:  93 opt: 531  Z-score: 202.3  bits: 50.3 E(85289): 0.00016
Smith-Waterman score: 711; 25.5% identity (42.8% similar) in 1460 aa overlap (57-1405:211-1488)

         30        40        50        60        70        80      
pF1KB0 KGKSLEIQKPAVAPRHGLQSLGKVAIARRMPPPANLPSLKAENKGNDPNVSLVPKDGTGW
                                     : : .::.     :::       ::   : 
XP_011 PGPPGIQGLPGPTGIPGPIGPPGPPGLMGPPGPPGLPG----PKGNMGLNFQGPKGEKGE
              190       200       210           220       230      

         90       100       110        120       130       140     
pF1KB0 ASKQEQSDPKSSDASTAQPLESQPLPASQ-TPASNQPKRPPAAPENTPLVPSGVKSWAQA
        . :    : .. .   .:.. .   ..:  :..  :  ::.  .. :  :.: :.    
XP_011 QGLQGPPGPPGQISEQKRPIDVEFQKGDQGLPGDRGPPGPPGI-RGPPGPPGGEKGEKGE
        240       250       260       270        280       290     

         150       160       170        180       190              
pF1KB0 SVTHGAHGDGGRASSLLSRFSREEFPTLQA-AGDQDKAAKERESAEQS-SGP-GPSL---
       .   : .:  :. .    . ..  .: : .  :   . ... :..... .:: ::     
XP_011 QGEPGKRGKPGKDG----ENGQPGIPGLPGDPGYPGEPGRDGEKGQKGDTGPPGPPGLVI
         300           310       320       330       340       350 

      200       210       220               230         240        
pF1KB0 -RPQNSTTWRDGGGRGPDELEG-------PDSKLHHG-HDPRGG--LQPSGPPQFPPYRG
        :: .. :  . :. :   : :       :  .   :   : :.  . : ::: ::  ::
XP_011 PRPGTGITIGEKGNIGLPGLPGEKGERGFPGIQGPPGLPGPPGAAVMGPPGPPGFPGERG
             360       370       380       390       400       410 

      250                 260           270       280       290    
pF1KB0 MM----PPFMY---PPYL---P----FPPPYGPQGPYRYPTPDGPSRFPRVAGPRGSGPP
       .     :: .    :: :   :    .: : :: ::.  :  :   . :   :: :: : 
XP_011 QKGDEGPPGISIPGPPGLDGQPGAPGLPGPPGPAGPH-IPPSDEICE-PGPPGPPGS-PG
             420       430       440        450        460         

          300       310       320         330       340       350  
pF1KB0 MRLVEPVGRPSILKEDNLKEFDQLDQ--ENDDGWAGAHEEVDYTEKLKFSDEEDGRDSDE
        . ..  :. ..  . .   :. .     .  :  :         .: :  ..   .. .
XP_011 DKGLQ--GEQGVKGDKGDTCFNCIGTGISGPPGQPGLPGLPGPPGSLGFPGQKG--EKGQ
      470         480       490       500       510       520      

            360       370       380        390         400         
pF1KB0 EGAEGHRDSQSASGEERPPEADGKKGNSPNSEP-PTPKTAWAETSRP--PETE--PGPPA
        :: : .   .  :    :   :.::.  .    :  :   .: . :  :     :: :.
XP_011 AGATGPKGLPGIPGAPGAPGFPGSKGEPGDILTFPGMKGDKGELGSPGAPGLPGLPGTPG
          530       540       550       560       570       580    

         410                  420       430          440       450 
pF1KB0 PK--PPLPPPH-----------RGPAGNWGPPGDYPDRG--GPP-CKPPAPEDEDEAWRQ
           : :: :.           ::: :: : ::   . :  :::   ::.:  :     :
XP_011 QDGLPGLPGPKGEPGGITFKGERGPPGNPGLPGLPGNIGPMGPPGFGPPGPVGEKGI--Q
          590       600       610       620       630       640    

             460       470       480       490       500        510
pF1KB0 RRKQSSSEISLAVERARRRREEEERRMQEERRAACAEKLKRLDEKFGAP-DKRLKAEPAA
           . .. ..   ..     .  . . .  . .   .  : :   : : :  : ..:. 
XP_011 GVAGNPGQPGIPGPKG-----DPGQTITQPGKPGLPGNPGR-DGDVGLPGDPGLPGQPGL
            650            660       670        680       690      

                      520       530       540       550       560  
pF1KB0 P--------PAAPSTPAPPPAVPKELPAPPAPPPASAPTPEKEPEEPAQAPPAQSTPTPG
       :        :. :.   : :  :: .:. :.:: : . :: .   :   .::.     ::
XP_011 PGIPGSKGEPGIPGIGLPGPPGPKGFPGIPGPPGAPG-TPGRIGLEGPPGPPG----FPG
        700       710       720       730        740           750 

            570       580       590       600       610            
pF1KB0 VAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPEPPEEVPPPTTPP-------VPK
         . : ..  :            . :  : . .  ::.  .  : :  ::       .: 
XP_011 PKGEPGFALPGPP----------GPPGLPGFKGALGPKGDRGFPGPPGPPGRTGLDGLPG
             760                 770       780       790       800 

         620       630        640       650       660       670    
pF1KB0 VEPKGDGIGPTRQPPSQGL-GYPKYQKSLPPRFQRQQQEQLLKQQQQHQWQQHQQGSAPP
         :::: .::. ::  .:  : :    . ::          . :   :    ..   .::
XP_011 --PKGD-VGPNGQPGPMGPPGLPGIGVQGPP--GPPGIPGPIGQPGLHGIPGEKGDPGPP
                810       820         830       840       850      

                 680       690       700          710           720
pF1KB0 ---TPVPP----SPPQPVTLGAVPAPQAPPPPPKAL---YPGALGR----PPPMPPMNFD
          .: ::    ::  : . : .  : .:  : ::    .::. :.     :: ::  . 
XP_011 GLDVPGPPGERGSPGIPGAPGPIGPPGSPGLPGKAGASGFPGTKGEMGMMGPPGPPGPLG
        860       870       880       890       900       910      

               730       740       750       760       770         
pF1KB0 -PRWMMIPPYVDPRLLQGRPPLDFYPPGVHPSGLVPRERSDSGGSSSEPFDRHAPAMLRE
        :    .:       :::.: :    ::  :.:    :.    ::..::     :     
XP_011 IPGRSGVPGLKGDDGLQGQPGL----PG--PTG----EK----GSKGEP---GLP-----
        920       930           940                 950            

     780        790        800         810       820         830   
pF1KB0 RGTP-PVDPKLAWVGDV-FTATPAEPR-P-LTSPLRQAADEDDKGMR--SETPPVPPPPP
        : : :.::.:  .:.    . :. :  : ...:    .   : :.   :  : .: :: 
XP_011 -GPPGPMDPNL--LGSKGEKGEPGLPGIPGVSGPKGYQGLPGDPGQPGLSGQPGLPGPPG
           960         970       980       990      1000      1010 

           840       850       860         870       880       890 
pF1KB0 SSSAVFRLDQVIHSNPAGIQQALAQLS--SRQGSVTAPGGHPRHKPGPPQAPQGPSPRPP
        ..      :    .: :.. ......  . :: : .: : :   :: : .:  :. .  
XP_011 PKGNPGLPGQPGLIGPPGLKGTIGDMGFPGPQG-VEGPPG-PSGVPGQPGSPGLPGQKGD
            1020      1030      1040       1050       1060         

             900       910        920         930       940        
pF1KB0 TRYEPQRVNSGLSSDPHFE-EPGPMVRGVGGTP--RDSAGVSPFPPKRRERPPRKPELLQ
        . .:   . :: . :  . :::  . :  :.:  . :.:   .:       :  :    
XP_011 -KGDPGISSIGLPGLPGPKGEPG--LPGYPGNPGIKGSVGDPGLPGL-----PGTPGAKG
     1070      1080      1090        1100      1110           1120 

      950       960       970       980       990      1000        
pF1KB0 EESLPPPHSSGFLGSKPEGPGPQAESRDTGTEALTPHIWNRLHTATSRKSYRPSSMEPWM
       . .::     :: :. :  :::.. :   :. .: :      . .    . .:..  :  
XP_011 QPGLP-----GFPGT-PGPPGPKGISGPPGNPGL-PG-----EPGPVGGGGHPGQPGPPG
                 1130       1140       1150           1160         

     1010       1020      1030      1040      1050      1060       
pF1KB0 EPLSPFED-VAGTEMSQSDSGVDLSGDSQVSSGPCSQRSSPDGGLKGAAEGPPKRPGGSS
       :  .: .: . :   .... :    :.    . :  . .. :::: :     :  ::  .
XP_011 EKGKPGQDGIPGPAGQKGEPGQPGFGNPGPPGLPGLSGQKGDGGLPGI----PGNPGLPG
    1170      1180      1190      1200      1210          1220     

      1070      1080      1090      1100      1110      1120       
pF1KB0 PLNAVPCEGPPGSEPPRRPPPAPHDGDRKELPREQPLPPGPIGTERSQRTDRGTEPGPIR
       : .    .: :: . :  :: .:  :   : :. .: : :: :  :   :     :::  
XP_011 PKGEPGFHGFPGVQGPPGPPGSP--GPALEGPKGNPGPQGPPG--RPGPTGFQGLPGPEG
        1230      1240        1250      1260        1270      1280 

      1130      1140      1150      1160      1170      1180       
pF1KB0 PSHRPGPPVQFGTSDKDSDLRLVVGDSLKAEKELTASVTEAIPVSRDWELLPSAAASAEP
       :   :: : . :               .:.::        . : .     ::.  ..  :
XP_011 P---PGLPGNGG---------------IKGEK--------GNPGQPGLPGLPGLKGDQGP
               1290                             1300      1310     

      1190      1200      1210           1220      1230      1240  
pF1KB0 QSKNLDSGHCVPEPSSSGQRLYPEV-----FYGSAGPSSSQISGGAMDSQLHPNSGGFRP
        . . . :    .:. .:..  : .     : :  :::.   :.:    . .:.  :  :
XP_011 PGLQGNPG----RPGLNGMKGDPGLPGVPGFPGMKGPSGVPGSAG---PEGEPGLIG-PP
        1320          1330      1340      1350         1360        

           1250      1260      1270      1280      1290      1300  
pF1KB0 GTPSLHPYRSQPLYLPPGPAPPSALLSGVALKGQFLDFSTMQATELGKLPAGGVLYPPPS
       : :.:           :::.  : ...:                      ::     ::.
XP_011 GPPGL-----------PGPSGQSIIIKG---------------------DAG-----PPG
      1370                 1380                                1390

           1310      1320      1330      1340        1350      1360
pF1KB0 FLYSPAFCPSPLPDTSLLQVRQDLPSPSDFYSTPLQPG--GQSGFLPSGAPAQQMLLPMV
       .  .:..   : :     :  : ::.:.   . : .::  :  ::  .:.   .  ::  
XP_011 IPGQPGLKGLPGP-----QGPQGLPGPT---GPPGDPGRNGLPGFDGAGGRKGDPGLP--
             1400           1410         1420      1430      1440  

             1370           1380      1390      1400      1410     
pF1KB0 DSQLPVVNFGSLPPAP-----PPAPPPLSLLPVGPALQPPSLAVRPPPAPATRVLPSPAR
        .: : .   . ::.:     ::.::  : .  :  .   : ..  :  :          
XP_011 -GQ-PGTRGLDGPPGPDGLQGPPGPPGTSSVAHGFLITRHSQTTDAPQCPQGTLQVYEGF
               1450      1460      1470      1480      1490        

        1420      1430      1440      1450      1460      1470     
pF1KB0 PFPASLGRAELHPVELKPFQDYQKLSSNLGGPGSSRTPPTGRSFSGLNSRLKATPSTYSG
                                                                   
XP_011 SLLYVQGNKRAHGQDLGTAGSCLRRFSTMPFMFCNINNVCNFASRNDYSYWLSTPEPMPM
     1500      1510      1520      1530      1540      1550        

>>XP_016884752 (OMIM: 301050,303630) PREDICTED: collagen  (1136 aa)
 initn: 248 init1: 103 opt: 492  Z-score: 191.4  bits: 47.7 E(85289): 0.00064
Smith-Waterman score: 576; 26.3% identity (42.1% similar) in 1154 aa overlap (187-1305:4-942)

        160       170       180       190       200       210      
pF1KB0 RASSLLSRFSREEFPTLQAAGDQDKAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPD
                                     ...: .:  .:.:    .:  .::    : 
XP_016                            MKGDKGELGSPGAPGLPGLPGTPGQDGL---PG
                                          10        20           30

        220       230       240       250       260       270      
pF1KB0 ELEGPDSKLHHGHDPRGGLQPSGPPQFPPYRGMMPPFMYPPYLPFPPPYGPQGPYRYPTP
        : :: ..   :   .:   : : : .:   : . : : ::   : :: :: :       
XP_016 -LPGPKGE-PGGITFKGERGPPGNPGLPGLPGNIGP-MGPP--GFGPP-GPVGEKGIQGV
                 40        50        60           70         80    

        280       290       300       310       320       330      
pF1KB0 DGPSRFPRVAGPRGSGPPMRLVEPVGRPSILKEDNLKEFDQLDQENDDGWAGAHEEVDYT
        :    : . ::.:. : . ...: :.:. :  .  .. : .   .: :  :        
XP_016 AGNPGQPGIPGPKGD-PGQTITQP-GKPG-LPGNPGRDGD-VGLPGDPGLPGQ----PGL
           90        100        110        120        130          

        340       350       360       370       380       390      
pF1KB0 EKLKFSDEEDGRDSDEEGAEGHRDSQSASGEERPPEADGKKGNSPNSEPPTPKTAWAETS
         .  :  : :  .   :  :    ..  :   :: : :  :      :: :       .
XP_016 PGIPGSKGEPGIPG--IGLPGPPGPKGFPGIPGPPGAPGTPGRIGLEGPPGP------PG
        140       150         160       170       180              

         400       410       420       430       440       450     
pF1KB0 RP-PETEPGPPAPKPPLPPPHRGPAGNWGPPGDYPDRGGPPCKPPAPEDEDEAWRQRRKQ
        : :. :::   : :: ::   :  :  :: ::   :: :   ::.:             
XP_016 FPGPKGEPGFALPGPPGPPGLPGFKGALGPKGD---RGFPG--PPGPPG-----------
      190       200       210       220            230             

         460       470       480       490       500       510     
pF1KB0 SSSEISLAVERARRRREEEERRMQEERRAACAEKLKRLDEKFGAPDKRLKAEPAAPPAAP
                                  :..       ::   : :  .  . : . :.  
XP_016 ---------------------------RTG-------LD---GLPGPKGDVGPNGQPG--
                                                 240       250     

         520        530           540       550         560        
pF1KB0 STPAPPPAVPK-ELPAPPAPP----PASAPTPEKEPEEPAQ-APPAQSTP-TPGVAAAPT
         :  ::..:   . .::.::    : . :  .  : : .. .::. ..:  ::  ..: 
XP_016 --PMGPPGLPGIGVQGPPGPPGIPGPIGQPGLHGIPGEKGDPGPPGLDVPGPPGERGSPG
             260       270       280       290       300       310 

      570       580       590       600       610       620        
pF1KB0 LVSGGGSTSSTSSGSFEASPVEPQLPSKEGPEPPEEVPPPTTPPVPKVEPKGDGIGPTRQ
       . .. :  .          :  : ::.: :           .   : .. .   .::   
XP_016 IPGAPGPIG---------PPGSPGLPGKAG-----------ASGFPGTKGEMGMMGPP-G
             320                330                  340        350

      630       640       650       660       670         680      
pF1KB0 PPSQGLGYPKYQKSLPPRFQRQQQEQLLKQQQQHQWQQHQQGSA--PPTPVPPSPPQPVT
       ::.  :: :   .:  : ..    .. :. :        ..::   :  : ::.: .:  
XP_016 PPGP-LGIPG--RSGVPGLK---GDDGLQGQPGLPGPTGEKGSKGEPGLPGPPGPMDPNL
                 360          370       380       390       400    

        690         700        710         720        730       740
pF1KB0 LGAVPAPQAP--PPPPKALYP-GALGRP--PPMPPMNFDPRWMMIP-PYVDPRLLQGRPP
       ::.      :  :  : .  : :  : :  : .: .. .:     : :  .: :  :.: 
XP_016 LGSKGEKGEPGLPGIPGVSGPKGYQGLPGDPGQPGLSGQPGLPGPPGPKGNPGL-PGQPG
          410       420       430       440       450        460   

              750            760       770       780       790     
pF1KB0 LDFYPPGVHPS----GLV-PRERSDSGGSSSEPFDRHAPAMLRERGTPPVDPKLAWVGDV
       : . :::.. .    :.  :.      : :. : .  .:..  ..:    :: .. .:  
XP_016 L-IGPPGLKGTIGDMGFPGPQGVEGPPGPSGVPGQPGSPGLPGQKGDKG-DPGISSIG--
            470       480       490       500       510            

         800       810       820       830       840       850     
pF1KB0 FTATPAEPRPLTSPLRQAADEDDKGMRSETPPVPPPPPSSSAVFRLDQVIHSNPAGIQQA
           :. : :   :          :.    :  :  :  ...:        ..:.     
XP_016 ---LPGLPGPKGEP----------GL----PGYPGNPGIKGSV--------GDPG-----
        520       530                     540                      

         860       870         880       890       900       910   
pF1KB0 LAQLSSRQGSVTAPG--GHPRHKPGPPQAPQGPSPRPPTRYEPQRVNSGLSSDPHFEEPG
       :  : .  :.   ::  : :   :::: .:.: :  ::        : :: .     :::
XP_016 LPGLPGTPGAKGQPGLPGFP-GTPGPP-GPKGISG-PPG-------NPGLPG-----EPG
     550       560        570        580               590         

           920       930       940       950       960        970  
pF1KB0 PMVRGVGGTPRDSAGVSPFPPKRRERPPRKPELLQEESLPPPHSSGFLGSKPEG-PGPQA
       :.  : :: :    : .: :: .. .: .        .   : . :: .  : : :: ..
XP_016 PV--GGGGHP----G-QPGPPGEKGKPGQDGIPGPAGQKGEPGQPGFGNPGPPGLPGLSG
            600            610       620       630       640       

            980       990      1000        1010         1020       
pF1KB0 ESRDTGTEALTPHIWNRLHTATSRKSYR--PSSMEPWMEPLSP---FEDVAGTEMSQSDS
       .. : :  ..  .    :    .. ...  :. . :   : ::   .:   :.   :.  
XP_016 QKGDGGLPGIPGN--PGLPGPKGEPGFHGFPGVQGPPGPPGSPGPALEGPKGNPGPQGPP
       650       660         670       680       690       700     

      1030      1040       1050      1060      1070      1080      
pF1KB0 GVDLSGDSQVSSGPCSQRSSP-DGGLKGAAEGPPKRPGGSSPLNAVPCEGPPGSEP-PRR
       :       :   :: .  . : .::.::  .: : .::  .  .    .:::: .  : :
XP_016 GRPGPTGFQGLPGPEGPPGLPGNGGIKGE-KGNPGQPGLPGLPGLKGDQGPPGLQGNPGR
         710       720       730        740       750       760    

        1090      1100        1110      1120      1130      1140   
pF1KB0 PPPAPHDGDRKELPREQPLP--PGPIGTERSQRTDRGTEPGPIRPSHRPGPPVQFGTSDK
       :      ::   ::    .:   :: :.  :   . : ::: : :   ::::   : : .
XP_016 PGLNGMKGD-PGLPGVPGFPGMKGPSGVPGSAGPE-G-EPGLIGP---PGPPGLPGPSGQ
          770        780       790         800          810        

          1150      1160      1170      1180      1190      1200   
pF1KB0 DSDLRLVVGDSLKAEKELTASVTEAIPVSRDWELLPSAAASAEPQSKNLDSGHCVPEPSS
       .    .. ::.             .:: .   . ::.      ::. .   :   : :..
XP_016 SI---IIKGDAG----------PPGIPGQPGLKGLPG------PQGPQGLPGPTGP-PGD
      820                    830       840             850         

          1210      1220      1230      1240       1250      1260  
pF1KB0 SGQRLYPEVFYGSAGPSSSQISGGAMDSQLHPNSGGFRPGTPSLH-PYRSQPLYLPPGPA
        :.   :  : :..: ...            :.  : .::: .:  :   . :  :::: 
XP_016 PGRNGLPG-FDGAGGRKGD------------PGLPG-QPGTRGLDGPPGPDGLQGPPGPP
      860        870                   880        890       900    

           1270      1280      1290       1300      1310      1320 
pF1KB0 PPSALLSGVALKGQFLDFSTMQATELGKLPAGGV-LYPPPSFLYSPAFCPSPLPDTSLLQ
         :..  :      ::     :.:.  . : : . .:   :.::                
XP_016 GTSSVAHG------FLITRHSQTTDAPQCPQGTLQVYEGFSLLYVQGNKRAHGQDLGTAG
          910             920       930       940       950        

            1330      1340      1350      1360      1370      1380 
pF1KB0 VRQDLPSPSDFYSTPLQPGGQSGFLPSGAPAQQMLLPMVDSQLPVVNFGSLPPAPPPAPP
                                                                   
XP_016 SCLRRFSTMPFMFCNINNVCNFASRNDYSYWLSTPEPMPMSMQPLKGQSIQPFISRCAVC
      960       970       980       990      1000      1010        

>>NP_203699 (OMIM: 301050,303630) collagen alpha-5(IV) c  (1691 aa)
 initn: 315 init1: 103 opt: 496  Z-score: 190.4  bits: 48.1 E(85289): 0.00073
Smith-Waterman score: 666; 26.0% identity (42.3% similar) in 1288 aa overlap (211-1405:377-1483)

              190       200       210       220       230       240
pF1KB0 KAAKERESAEQSSGPGPSLRPQNSTTWRDGGGRGPDELEGPDSKLHHGHDPRGGLQPSGP
                                     : .::  : :: .    :        : ::
NP_203 PRPGTGITIGEKGNIGLPGLPGEKGERGFPGIQGPPGLPGPPGAAVMG--------PPGP
        350       360       370       380       390                

              250                 260           270       280      
pF1KB0 PQFPPYRGMM----PPFMY---PPYL---P----FPPPYGPQGPYRYPTPDGPSRFPRVA
       : ::  ::.     :: .    :: :   :    .: : :: ::.  :  :   . :   
NP_203 PGFPGERGQKGDEGPPGISIPGPPGLDGQPGAPGLPGPPGPAGPH-IPPSDEICE-PGPP
      400       410       420       430       440        450       

        290       300       310       320         330       340    
pF1KB0 GPRGSGPPMRLVEPVGRPSILKEDNLKEFDQLDQ--ENDDGWAGAHEEVDYTEKLKFSDE
       :: :: :  . ..  :. ..  . .   :. .     .  :  :         .: :  .
NP_203 GPPGS-PGDKGLQ--GEQGVKGDKGDTCFNCIGTGISGPPGQPGLPGLPGPPGSLGFPGQ
        460          470       480       490       500       510   

          350       360       370       380        390         400 
pF1KB0 EDGRDSDEEGAEGHRDSQSASGEERPPEADGKKGNSPNSEP-PTPKTAWAETSRP--PET
       .   .. . :: : .   .  :    :   :.::.  .    :  :   .: . :  :  
NP_203 KG--EKGQAGATGPKGLPGIPGAPGAPGFPGSKGEPGDILTFPGMKGDKGELGSPGAPGL
             520       530       540       550       560       570 

                 410                  420       430          440   
pF1KB0 E--PGPPAPK--PPLPPPH-----------RGPAGNWGPPGDYPDRG--GPP-CKPPAPE
          :: :.    : :: :.           ::: :: : ::   . :  :::   ::.: 
NP_203 PGLPGTPGQDGLPGLPGPKGEPGGITFKGERGPPGNPGLPGLPGNIGPMGPPGFGPPGPV
             580       590       600       610       620       630 

           450       460       470       480       490       500   
pF1KB0 DEDEAWRQRRKQSSSEISLAVERARRRREEEERRMQEERRAACAEKLKRLDEKFGAP-DK
        :     :    . .. ..   ..     .  . . .  . .   .  : :   : : : 
NP_203 GEKGI--QGVAGNPGQPGIPGPKG-----DPGQTITQPGKPGLPGNPGR-DGDVGLPGDP
               640       650            660       670        680   

            510               520       530       540       550    
pF1KB0 RLKAEPAAP--------PAAPSTPAPPPAVPKELPAPPAPPPASAPTPEKEPEEPAQAPP
        : ..:. :        :. :.   : :  :: .:. :.:: : . :: .   :   .::
NP_203 GLPGQPGLPGIPGSKGEPGIPGIGLPGPPGPKGFPGIPGPPGAPG-TPGRIGLEGPPGPP
           690       700       710       720        730       740  

          560       570       580       590       600       610    
pF1KB0 AQSTPTPGVAAAPTLVSGGGSTSSTSSGSFEASPVEPQLPSKEGPEPPEEVPPPTTPP--
       .     ::  . : ..  :            . :  : . .  ::.  .  : :  ::  
NP_203 G----FPGPKGEPGFALPGPP----------GPPGLPGFKGALGPKGDRGFPGPPGPPGR
                750                 760       770       780        

                 620       630        640       650       660      
pF1KB0 -----VPKVEPKGDGIGPTRQPPSQGL-GYPKYQKSLPPRFQRQQQEQLLKQQQQHQWQQ
            .:   :::: .::. ::  .:  : :    . ::          . :   :    
NP_203 TGLDGLPG--PKGD-VGPNGQPGPMGPPGLPGIGVQGPP--GPPGIPGPIGQPGLHGIPG
      790         800        810       820         830       840   

        670              680       690       700          710      
pF1KB0 HQQGSAPP---TPVPP----SPPQPVTLGAVPAPQAPPPPPKAL---YPGALGR----PP
       ..   .::   .: ::    ::  : . : .  : .:  : ::    .::. :.     :
NP_203 EKGDPGPPGLDVPGPPGERGSPGIPGAPGPIGPPGSPGLPGKAGASGFPGTKGEMGMMGP
           850       860       870       880       890       900   

            720        730       740       750       760       770 
pF1KB0 PMPPMNFD-PRWMMIPPYVDPRLLQGRPPLDFYPPGVHPSGLVPRERSDSGGSSSEPFDR
       : ::  .  :    .:       :::.: :    ::  :.:    :.    ::..::   
NP_203 PGPPGPLGIPGRSGVPGLKGDDGLQGQPGL----PG--PTG----EK----GSKGEP---
           910       920       930                 940             

             780        790        800         810       820       
pF1KB0 HAPAMLRERGTP-PVDPKLAWVGDV-FTATPAEPR-P-LTSPLRQAADEDDKGMR--SET
         :      : : :.::.:  .:.    . :. :  : ...:    .   : :.   :  
NP_203 GLP------GPPGPMDPNL--LGSKGEKGEPGLPGIPGVSGPKGYQGLPGDPGQPGLSGQ
              950         960       970       980       990        

         830       840       850       860         870       880   
pF1KB0 PPVPPPPPSSSAVFRLDQVIHSNPAGIQQALAQLS--SRQGSVTAPGGHPRHKPGPPQAP
       : .: ::  ..      :    .: :.. ......  . :: : .: : :   :: : .:
NP_203 PGLPGPPGPKGNPGLPGQPGLIGPPGLKGTIGDMGFPGPQG-VEGPPG-PSGVPGQPGSP
     1000      1010      1020      1030       1040       1050      

           890       900       910        920         930       940
pF1KB0 QGPSPRPPTRYEPQRVNSGLSSDPHFE-EPGPMVRGVGGTP--RDSAGVSPFPPKRRERP
         :. .   . .:   . :: . :  . :::  . :  :.:  . :.:   .:       
NP_203 GLPGQKGD-KGDPGISSIGLPGLPGPKGEPG--LPGYPGNPGIKGSVGDPGLPGL-----
       1060       1070      1080        1090      1100             

              950       960       970       980       990      1000
pF1KB0 PRKPELLQEESLPPPHSSGFLGSKPEGPGPQAESRDTGTEALTPHIWNRLHTATSRKSYR
       :  :    . .::     :: :. :  :::.. :   :. .: :      . .    . .
NP_203 PGTPGAKGQPGLP-----GFPGT-PGPPGPKGISGPPGNPGL-PG-----EPGPVGGGGH
     1110      1120            1130      1140            1150      

             1010       1020      1030      1040      1050         
pF1KB0 PSSMEPWMEPLSPFED-VAGTEMSQSDSGVDLSGDSQVSSGPCSQRSSPDGGLKGAAEGP
       :..  :  :  .: .: . :   .... :    :.    . :  . .. :::: :     
NP_203 PGQPGPPGEKGKPGQDGIPGPAGQKGEPGQPGFGNPGPPGLPGLSGQKGDGGLPGI----
       1160      1170      1180      1190      1200      1210      

    1060      1070      1080      1090      1100      1110         
pF1KB0 PKRPGGSSPLNAVPCEGPPGSEPPRRPPPAPHDGDRKELPREQPLPPGPIGTERSQRTDR
       :  ::  .: .    .: :: . :  :: .:  :   : :. .: : :: :  :   :  
NP_203 PGNPGLPGPKGEPGFHGFPGVQGPPGPPGSP--GPALEGPKGNPGPQGPPG--RPGPTGF
           1220      1230      1240        1250      1260          

    1120      1130      1140      1150      1160      1170         
pF1KB0 GTEPGPIRPSHRPGPPVQFGTSDKDSDLRLVVGDSLKAEKELTASVTEAIPVSRDWELLP
          :::  :   :: : . :               .:.::        . : .     ::
NP_203 QGLPGPEGP---PGLPGNGG---------------IKGEK--------GNPGQPGLPGLP
     1270         1280                     1290              1300  

    1180      1190      1200      1210           1220      1230    
pF1KB0 SAAASAEPQSKNLDSGHCVPEPSSSGQRLYPEV-----FYGSAGPSSSQISGGAMDSQLH
       .  ..  : . . . :.    :. .:..  : .     : :  :::.   :.:    . .
NP_203 GLKGDQGPPGLQGNPGR----PGLNGMKGDPGLPGVPGFPGMKGPSGVPGSAG---PEGE
           1310          1320      1330      1340      1350        

         1240      1250      1260      1270      1280      1290    
pF1KB0 PNSGGFRPGTPSLHPYRSQPLYLPPGPAPPSALLSGVALKGQFLDFSTMQATELGKLPAG
       :.  :  :: :.:           :::.  : ...:                      ::
NP_203 PGLIG-PPGPPGL-----------PGPSGQSIIIKG---------------------DAG
        1360                  1370                           1380  

         1300      1310      1320      1330      1340        1350  
pF1KB0 GVLYPPPSFLYSPAFCPSPLPDTSLLQVRQDLPSPSDFYSTPLQPG--GQSGFLPSGAPA
            ::..  .:..   : :     :  : ::.:.   . : .::  :  ::  .:.  
NP_203 -----PPGIPGQPGLKGLPGP-----QGPQGLPGPT---GPPGDPGRNGLPGFDGAGGRK
                1390           1400         1410      1420         

           1360      1370           1380      1390      1400       
pF1KB0 QQMLLPMVDSQLPVVNFGSLPPAP-----PPAPPPLSLLPVGPALQPPSLAVRPPPAPAT
        .  ::   .: : .   . ::.:     ::.::  : .  :  .   : ..  :  :  
NP_203 GDPGLP---GQ-PGTRGLDGPPGPDGLQGPPGPPGTSSVAHGFLITRHSQTTDAPQCPQG
    1430          1440      1450      1460      1470      1480     

      1410      1420      1430      1440      1450      1460       
pF1KB0 RVLPSPARPFPASLGRAELHPVELKPFQDYQKLSSNLGGPGSSRTPPTGRSFSGLNSRLK
                                                                   
NP_203 TLQVYEGFSLLYVQGNKRAHGQDLGTAGSCLRRFSTMPFMFCNINNVCNFASRNDYSYWL
        1490      1500      1510      1520      1530      1540     




1533 residues in 1 query   sequences
60827320 residues in 85289 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Thu Nov  3 11:36:29 2016 done: Thu Nov  3 11:36:33 2016
 Total Scan time: 22.420 Total Display time:  1.090

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com