Result of FASTA (ccds) for pFN21AB7993
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB7993, 469 aa
  1>>>pF1KB7993 469 - 469 aa - 469 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 9.3178+/-0.00126; mu= -0.3496+/- 0.075
 mean_var=243.8506+/-48.856, 0's: 0 Z-trim(108.4): 120  B-trim: 69 in 1/51
 Lambda= 0.082132
 statistics sampled from 10077 (10189) to 10077 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.655), E-opt: 0.2 (0.313), width:  16
 Scan time:  2.570

The best scores are:                                      opt bits E(32554)
CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12           ( 469) 2904 357.6 1.6e-98
CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12           ( 590) 1741 219.9 5.8e-57
CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12         ( 564) 1722 217.6 2.7e-56
CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12        ( 564) 1710 216.2 7.2e-56
CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12          ( 564) 1709 216.1 7.8e-56
CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12          ( 551) 1707 215.8   9e-56
CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12           ( 483) 1693 214.1 2.6e-55
CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12          ( 511) 1693 214.1 2.7e-55
CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12          ( 628) 1623 205.9 9.9e-53
CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12          ( 520) 1616 205.0 1.5e-52
CCDS8839.1 KRT79 gene_id:338785|Hs108|chr12        ( 535) 1595 202.5 8.7e-52
CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12         ( 638) 1569 199.5 8.4e-51
CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12          ( 600) 1558 198.2   2e-50
CCDS8834.1 KRT73 gene_id:319101|Hs108|chr12        ( 540) 1548 197.0 4.2e-50
CCDS8833.1 KRT72 gene_id:140807|Hs108|chr12        ( 511) 1546 196.7 4.7e-50
CCDS8836.1 KRT1 gene_id:3848|Hs108|chr12           ( 644) 1514 193.0 7.8e-49
CCDS8831.1 KRT71 gene_id:112802|Hs108|chr12        ( 523) 1494 190.6 3.4e-48
CCDS8837.1 KRT77 gene_id:374454|Hs108|chr12        ( 578) 1467 187.4 3.4e-47
CCDS8832.1 KRT74 gene_id:121391|Hs108|chr12        ( 529) 1465 187.1 3.7e-47
CCDS8835.1 KRT2 gene_id:3849|Hs108|chr12           ( 639) 1430 183.1 7.7e-46
CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12          ( 507) 1388 178.0   2e-44
CCDS8840.1 KRT78 gene_id:196374|Hs108|chr12        ( 520) 1387 177.9 2.2e-44
CCDS8826.1 KRT82 gene_id:3888|Hs108|chr12          ( 513) 1372 176.1 7.6e-44
CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12         ( 505) 1348 173.3 5.4e-43
CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12         ( 486) 1347 173.1 5.7e-43
CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12          ( 493) 1333 171.5 1.8e-42
CCDS73473.1 KRT78 gene_id:196374|Hs108|chr12       ( 410) 1165 151.5 1.5e-36
CCDS8821.2 KRT80 gene_id:144501|Hs108|chr12        ( 452) 1063 139.4 7.2e-33
CCDS41784.1 KRT80 gene_id:144501|Hs108|chr12       ( 422) 1057 138.7 1.1e-32
CCDS53795.1 KRT72 gene_id:140807|Hs108|chr12       ( 469) 1027 135.2 1.4e-31
CCDS73472.1 KRT85 gene_id:3891|Hs108|chr12         ( 295)  890 118.8 7.7e-27
CCDS7120.1 VIM gene_id:7431|Hs108|chr10            ( 466)  795 107.7 2.7e-23
CCDS75712.1 NEFL gene_id:4747|Hs108|chr8           ( 543)  793 107.5 3.6e-23
CCDS45708.1 GFAP gene_id:2670|Hs108|chr17          ( 431)  765 104.1   3e-22
CCDS11491.1 GFAP gene_id:2670|Hs108|chr17          ( 432)  753 102.7   8e-22
CCDS59296.1 GFAP gene_id:2670|Hs108|chr17          ( 438)  753 102.7 8.1e-22
CCDS8783.1 PRPH gene_id:5630|Hs108|chr12           ( 470)  750 102.4 1.1e-21
CCDS33383.1 DES gene_id:1674|Hs108|chr2            ( 470)  741 101.3 2.3e-21
CCDS7545.1 INA gene_id:9118|Hs108|chr10            ( 499)  709 97.5 3.3e-20
CCDS6046.1 NEFM gene_id:4741|Hs108|chr8            ( 916)  699 96.6 1.2e-19
CCDS31809.1 KRT18 gene_id:3875|Hs108|chr12         ( 430)  638 89.1   1e-17
CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17         ( 456)  622 87.2 3.9e-17
CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17         ( 584)  617 86.7 7.1e-17
CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17         ( 458)  608 85.5 1.2e-16
CCDS13858.1 NEFH gene_id:4744|Hs108|chr22          (1020)  615 86.6 1.3e-16
CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17         ( 472)  603 85.0 1.9e-16
CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17         ( 473)  598 84.4 2.9e-16
CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17         ( 400)  592 83.6 4.2e-16
CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17         ( 420)  587 83.0 6.5e-16
CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17         ( 494)  585 82.8 8.7e-16


>>CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12                (469 aa)
 initn: 2904 init1: 2904 opt: 2904  Z-score: 1882.2  bits: 357.6 E(32554): 1.6e-98
Smith-Waterman score: 2904; 99.6% identity (100.0% similar) in 469 aa overlap (1-469:1-469)

               10        20        30        40        50        60
pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYGLGASRPRVAVRSAYGGPVG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYGLGASRPRVAVRSAYGGPVG
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB7 AGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQNKLLE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 AGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQNKLLE
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB7 TKWTLLQEQKSAKSSRLPDIFEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVEDFKNKY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 TKWTLLQEQKSAKSSRLPDIFEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVEDFKNKY
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB7 EDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVDALNDEINFLRTLNETELTELQSQI
       :::::.::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 EDEINHRTAAENEFVVLKKDVDAAYMSKVELEAKVDALNDEINFLRTLNETELTELQSQI
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB7 SDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQAGKHGDD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 SDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQAGKHGDD
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB7 LRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIAEAEERGELALKDARAKQEELEAA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 LRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIAEAEERGELALKDARAKQEELEAA
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB7 LQRAKQDMARQLREYQELMSVKLALDIEIATYRKLLEGEESRLAGDGVGAVNISVMNSTG
       :::.::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 LQRGKQDMARQLREYQELMSVKLALDIEIATYRKLLEGEESRLAGDGVGAVNISVMNSTG
              370       380       390       400       410       420

              430       440       450       460         
pF1KB7 GSSSGGGIGLTLGGTMGSNALSFSSSAGPGLLKAYSIRTASASRRSARD
       :::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 GSSSGGGIGLTLGGTMGSNALSFSSSAGPGLLKAYSIRTASASRRSARD
              430       440       450       460         

>>CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12                (590 aa)
 initn: 1895 init1: 1328 opt: 1741  Z-score: 1136.1  bits: 219.9 E(32554): 5.8e-57
Smith-Waterman score: 1756; 61.7% identity (80.4% similar) in 491 aa overlap (1-468:74-559)

                                             10        20        30
pF1KB7                               MSIHFSSPVFTSRSAAFSGRGAQVRLSSAR
                                     .::  :.  : .: .: .: :     ..: 
CCDS88 GGFGRVSLAGACGVGGYGSRSLYNLGGSKRISISTSGGSFRNRFGAGAGGGYGFG-GGAG
            50        60        70        80        90        100  

                  40        50             60        70        80  
pF1KB7 PG---GLGSSSLYGLGASRPRVAVRSAYGGP-----VGAGIREVTINQSLLAPLRLDADP
        :   : :... .:::..   ..  ...:::       .::.:::.:::::.:: :. ::
CCDS88 SGFGFGGGAGGGFGLGGG---AGFGGGFGGPGFPVCPPGGIQEVTVNQSLLTPLNLQIDP
            110       120          130       140       150         

             90       100       110       120       130         140
pF1KB7 SLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQNKLLETKWTLLQEQKSAKSSR--LPDI
       :.:::: :: :::::::::::::::::::::::::.:.::::::::: . :. :  :  .
CCDS88 SIQRVRTEEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTLLQEQGT-KTVRQNLEPL
     160       170       180       190       200        210        

              150       160       170       180       190       200
pF1KB7 FEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVEDFKNKYEDEINRRTAAENEFVVLKKD
       ::  : .:: ::...  . :::..:::.:::.:::::::::::::.::.::::::.::::
CCDS88 FEQYINNLRRQLDSIVGERGRLDSELRNMQDLVEDFKNKYEDEINKRTTAENEFVMLKKD
      220       230       240       250       260       270        

              210       220       230       240       250       260
pF1KB7 VDAAYMSKVELEAKVDALNDEINFLRTLNETELTELQSQISDTSVVLSMDNSRSLDLDGI
       ::::::.::::::::::: :::::.. . ..::...:...:::::::::::.:.::::.:
CCDS88 VDAAYMNKVELEAKVDALMDEINFMKMFFDAELSQMQTHVSDTSVVLSMDNNRNLDLDSI
      280       290       300       310       320       330        

              270       280       290       300       310       320
pF1KB7 IAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQAGKHGDDLRNTRNEISEMNRAIQRLQA
       ::::::::::.:. ::.:::.:::::.: ::  ::.::::::::..::::::: ::::.:
CCDS88 IAEVKAQYEEIANRSRTEAESWYQTKYEELQQTAGRHGDDLRNTKHEISEMNRMIQRLRA
      340       350       360       370       380       390        

              330       340       350       360       370       380
pF1KB7 EIDNIKNQRAKLEAAIAEAEERGELALKDARAKQEELEAALQRAKQDMARQLREYQELMS
       ::::.:.: :.:. :::.::.:::::::::: :  ::: :::.::::::: ::::::::.
CCDS88 EIDNVKKQCANLQNAIADAEQRGELALKDARNKLAELEEALQKAKQDMARLLREYQELMN
      400       410       420       430       440       450        

              390       400       410             420       430    
pF1KB7 VKLALDIEIATYRKLLEGEESRLAGDGVGAVNISVMNST------GGSSSGGGIGLTLGG
       .:::::.::::::::::::: ::.:.::: :::::..:.      .::. :::.:  :::
CCDS88 TKLALDVEIATYRKLLEGEECRLSGEGVGPVNISVVTSSVSSGYGSGSGYGGGLGGGLGG
      460       470       480       490       500       510        

                 440       450       460                           
pF1KB7 TMG-------SNALSFSSSAGPGLLKAYSIRTASASRRSARD                  
        .:       :..   :::.: ::  . :.  .. :  :.:                   
CCDS88 GLGGGLAGGSSGSYYSSSSGGVGLGGGLSVGGSGFSASSGRGLGVGFGSGGGSSSSVKFV
      520       530       540       550       560       570        

CCDS88 STTSSSRKSFKS
      580       590

>>CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12              (564 aa)
 initn: 1794 init1: 1311 opt: 1722  Z-score: 1124.2  bits: 217.6 E(32554): 2.7e-56
Smith-Waterman score: 1722; 64.3% identity (84.9% similar) in 445 aa overlap (14-450:90-524)

                                10        20        30        40   
pF1KB7                  MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYGLG
                                     : .:.: :.   ..    :: : .  .:::
CCDS41 SLYGLGGSKRISIGGGSCAISGGYGSRAGGSYGFGGAGSGFGFG----GGAGIG--FGLG
      60        70        80        90       100             110   

            50             60        70        80        90        
pF1KB7 ASRPRVAVRSAYGGP-----VGAGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTL
       ..   ... ...:::       .::.:::.:::::.:: :. ::..:::: :: ::::::
CCDS41 GG---AGLAGGFGGPGFPVCPPGGIQEVTVNQSLLTPLNLQIDPTIQRVRAEEREQIKTL
              120       130       140       150       160       170

      100       110       120       130         140       150      
pF1KB7 NNKFASFIDKVRFLEQQNKLLETKWTLLQEQKSAKSSR--LPDIFEAQIAGLRGQLEALQ
       :::::::::::::::::::.::::::::::: . :. :  :  .::  : .:: ::... 
CCDS41 NNKFASFIDKVRFLEQQNKVLETKWTLLQEQGT-KTVRQNLEPLFEQYINNLRRQLDSIV
              180       190       200        210       220         

        160       170       180       190       200       210      
pF1KB7 VDGGRLEAELRSMQDVVEDFKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVD
        . :::..:::.:::.:::::::::::::.:::::::::.::::::::::.::::.::.:
CCDS41 GERGRLDSELRGMQDLVEDFKNKYEDEINKRTAAENEFVTLKKDVDAAYMNKVELQAKAD
     230       240       250       260       270       280         

        220       230       240       250       260       270      
pF1KB7 ALNDEINFLRTLNETELTELQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSR
       .:.:::::::.: ..::...:..::::::::::::.:.::::.:::::::::::.:. ::
CCDS41 TLTDEINFLRALYDAELSQMQTHISDTSVVLSMDNNRNLDLDSIIAEVKAQYEEIAQRSR
     290       300       310       320       330       340         

        280       290       300       310       320       330      
pF1KB7 AEAEAWYQTKFETLQAQAGKHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAI
       ::::.:::::.: ::. ::.::::::::..::.:.:: ::::..:::..:.: :.:.:::
CCDS41 AEAESWYQTKYEELQVTAGRHGDDLRNTKQEIAEINRMIQRLRSEIDHVKKQCANLQAAI
     350       360       370       380       390       400         

        340       350       360       370       380       390      
pF1KB7 AEAEERGELALKDARAKQEELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLL
       :.::.:::.:::::. : : :: :::.::::.:: :.::::::.::::::.:::::::::
CCDS41 ADAEQRGEMALKDAKNKLEGLEDALQKAKQDLARLLKEYQELMNVKLALDVEIATYRKLL
     410       420       430       440       450       460         

        400       410       420       430        440       450     
pF1KB7 EGEESRLAGDGVGAVNISVMNSTGGSSSGGGIGLTLG-GTMGSNALSFSSSAGPGLLKAY
       :::: :: :.::: :::::..:: .:. ::. :.  : :  :... :..:. : :     
CCDS41 EGEECRLNGEGVGQVNISVVQSTVSSGYGGASGVGSGLGLGGGSSYSYGSGLGVGGGFSS
     470       480       490       500       510       520         

         460                              
pF1KB7 SIRTASASRRSARD                     
                                          
CCDS41 SSGRAIGGGLSSVGGGSSTIKYTTTSSSSRKSYKH
     530       540       550       560    

>>CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12             (564 aa)
 initn: 1833 init1: 1304 opt: 1710  Z-score: 1116.5  bits: 216.2 E(32554): 7.2e-56
Smith-Waterman score: 1710; 63.6% identity (84.9% similar) in 445 aa overlap (14-450:90-524)

                                10        20        30        40   
pF1KB7                  MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYGLG
                                     : .:.: :.   ..    :: : .  .:::
CCDS88 SLYGLGGSKRISIGGGSCAISGGYGSRAGGSYGFGGAGSGFGFG----GGAGIG--FGLG
      60        70        80        90       100             110   

            50             60        70        80        90        
pF1KB7 ASRPRVAVRSAYGGP-----VGAGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTL
       ..   ... ...:::       .::.:::.:::::.:: :. ::..:::: :: ::::::
CCDS88 GG---AGLAGGFGGPGFPVCPPGGIQEVTVNQSLLTPLNLQIDPAIQRVRAEEREQIKTL
              120       130       140       150       160       170

      100       110       120       130         140       150      
pF1KB7 NNKFASFIDKVRFLEQQNKLLETKWTLLQEQKSAKSSR--LPDIFEAQIAGLRGQLEALQ
       :::::::::::::::::::.:.::::::::: . :. :  :  .::  : .:: ::... 
CCDS88 NNKFASFIDKVRFLEQQNKVLDTKWTLLQEQGT-KTVRQNLEPLFEQYINNLRRQLDSIV
              180       190       200        210       220         

        160       170       180       190       200       210      
pF1KB7 VDGGRLEAELRSMQDVVEDFKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVD
        . :::..:::.:::.:::.:::::::::.:::::::::.::::::::::.::::.::.:
CCDS88 GERGRLDSELRNMQDLVEDLKNKYEDEINKRTAAENEFVTLKKDVDAAYMNKVELQAKAD
     230       240       250       260       270       280         

        220       230       240       250       260       270      
pF1KB7 ALNDEINFLRTLNETELTELQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSR
       .:.:::::::.: ..::...:..::::::::::::.:.::::.:::::::::::.:. ::
CCDS88 TLTDEINFLRALYDAELSQMQTHISDTSVVLSMDNNRNLDLDSIIAEVKAQYEEIAQRSR
     290       300       310       320       330       340         

        280       290       300       310       320       330      
pF1KB7 AEAEAWYQTKFETLQAQAGKHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAI
       ::::.:::::.: ::. ::.::::::::..::.:.:: ::::..:::..:.: :.:.:::
CCDS88 AEAESWYQTKYEELQVTAGRHGDDLRNTKQEIAEINRMIQRLRSEIDHVKKQCASLQAAI
     350       360       370       380       390       400         

        340       350       360       370       380       390      
pF1KB7 AEAEERGELALKDARAKQEELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLL
       :.::.:::.:::::. : : :: :::.::::.:: :.::::::.::::::.:::::::::
CCDS88 ADAEQRGEMALKDAKNKLEGLEDALQKAKQDLARLLKEYQELMNVKLALDVEIATYRKLL
     410       420       430       440       450       460         

        400       410       420       430        440       450     
pF1KB7 EGEESRLAGDGVGAVNISVMNSTGGSSSGGGIGLTLG-GTMGSNALSFSSSAGPGLLKAY
       :::: :: :.::: ::.::..:: .:. ::. :.  : :  :... :..:. : :     
CCDS88 EGEECRLNGEGVGQVNVSVVQSTISSGYGGASGVGSGLGLGGGSSYSYGSGLGIGGGFSS
     470       480       490       500       510       520         

         460                              
pF1KB7 SIRTASASRRSARD                     
                                          
CCDS88 SSGRAIGGGLSSVGGGSSTIKYTTTSSSSRKSYKH
     530       540       550       560    

>>CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12               (564 aa)
 initn: 1780 init1: 1302 opt: 1709  Z-score: 1115.9  bits: 216.1 E(32554): 7.8e-56
Smith-Waterman score: 1709; 63.1% identity (83.5% similar) in 461 aa overlap (14-463:90-535)

                                10        20        30        40   
pF1KB7                  MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYGLG
                                     : .:.: :.   ..    :: : .  .:::
CCDS88 SLYGLGGSKRISIGGGSCAISGGYGSRAGGSYGFGGAGSGFGFG----GGAGIG--FGLG
      60        70        80        90       100             110   

            50             60        70        80        90        
pF1KB7 ASRPRVAVRSAYGGP-----VGAGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTL
       ..   ... ...:::       .::.:::.:::::.:: :. ::..:::: :: ::::::
CCDS88 GG---AGLAGGFGGPGFPVCPPGGIQEVTVNQSLLTPLNLQIDPAIQRVRAEEREQIKTL
              120       130       140       150       160       170

      100       110       120       130         140       150      
pF1KB7 NNKFASFIDKVRFLEQQNKLLETKWTLLQEQKSAKSSR--LPDIFEAQIAGLRGQLEALQ
       :::::::::::::::::::.:.::::::::: ..:. :  :  .::  : .:: ::. . 
CCDS88 NNKFASFIDKVRFLEQQNKVLDTKWTLLQEQ-GTKTVRQNLEPLFEQYINNLRRQLDNIV
              180       190       200        210       220         

        160       170       180       190       200       210      
pF1KB7 VDGGRLEAELRSMQDVVEDFKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVD
        . :::..:::.:::.:::.:::::::::.:::::::::.::::::::::.::::.::.:
CCDS88 GERGRLDSELRNMQDLVEDLKNKYEDEINKRTAAENEFVTLKKDVDAAYMNKVELQAKAD
     230       240       250       260       270       280         

        220       230       240       250       260       270      
pF1KB7 ALNDEINFLRTLNETELTELQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSR
       .:.:::::::.: ..::...:..::::::::::::.:.::::.:::::::::::.:. ::
CCDS88 TLTDEINFLRALYDAELSQMQTHISDTSVVLSMDNNRNLDLDSIIAEVKAQYEEIAQRSR
     290       300       310       320       330       340         

        280       290       300       310       320       330      
pF1KB7 AEAEAWYQTKFETLQAQAGKHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAI
       ::::.:::::.: ::  ::.::::::::..::.:.:: ::::..:::..:.: :.:.:::
CCDS88 AEAESWYQTKYEELQITAGRHGDDLRNTKQEIAEINRMIQRLRSEIDHVKKQCANLQAAI
     350       360       370       380       390       400         

        340       350       360       370       380       390      
pF1KB7 AEAEERGELALKDARAKQEELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLL
       :.::.:::.:::::. : : :: :::.::::.:: :.::::::.::::::.:::::::::
CCDS88 ADAEQRGEMALKDAKNKLEGLEDALQKAKQDLARLLKEYQELMNVKLALDVEIATYRKLL
     410       420       430       440       450       460         

        400       410          420        430       440       450  
pF1KB7 EGEESRLAGDGVGAVNISVMNST---G-GSSSGGGIGLTLGGTMGSNALSFSSSAGPGLL
       :::: :: :.::: :::::..::   : :..:: : :: :::  ::   :.: ..: :. 
CCDS88 EGEECRLNGEGVGQVNISVVQSTVSSGYGGASGVGSGLGLGG--GS---SYSYGSGLGVG
     470       480       490       500       510            520    

            460                                
pF1KB7 KAYSIRTASASRRSARD                       
        ..:  .. :.                             
CCDS88 GGFSSSSGRATGGGLSSVGGGSSTIKYTTTSSSSRKSYKH
          530       540       550       560    

>>CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12               (551 aa)
 initn: 1787 init1: 1288 opt: 1707  Z-score: 1114.7  bits: 215.8 E(32554): 9e-56
Smith-Waterman score: 1721; 62.2% identity (80.8% similar) in 490 aa overlap (5-451:32-512)

                                         10        20        30    
pF1KB7                           MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGL
                                     ::: : ..::::  : :.  :.:::  ...
CCDS88 SRQSSITFQSGSRRGFSTTSAITPAAGRSRFSS-VSVARSAA--GSGGLGRISSA-GASF
              10        20        30         40          50        

           40        50                               60           
pF1KB7 GSSSLYGLGASRPRVAV-------RSA----------------YGGPVGAG---------
       :: :::.::... ::..       ::.                ::: ::.:         
CCDS88 GSRSLYNLGGAK-RVSINGCGSSCRSGFGGRASNRFGVNSGFGYGGGVGGGFSGPSFPVC
        60         70        80        90       100       110      

                 70        80        90       100       110        
pF1KB7 ----IREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQNKL
           :.:::.:::::.::.:. ::..:::: :: :::::::::::::::::::::::::.
CCDS88 PPGGIQEVTVNQSLLTPLHLQIDPTIQRVRAEEREQIKTLNNKFASFIDKVRFLEQQNKV
        120       130       140       150       160       170      

      120       130         140       150       160       170      
pF1KB7 LETKWTLLQEQKSAKSSR--LPDIFEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVEDF
       :::::.::::: : .. :  :  .:..  . :: :::.. .. ::::::::.::::::::
CCDS88 LETKWALLQEQGS-RTVRQNLEPLFDSYTSELRRQLESITTERGRLEAELRNMQDVVEDF
        180        190       200       210       220       230     

        180       190       200       210       220       230      
pF1KB7 KNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVDALNDEINFLRTLNETELTEL
       : .::::::.:::::::::.::::::::::.:::::::: .: .::::.... ..::..:
CCDS88 KVRYEDEINKRTAAENEFVALKKDVDAAYMNKVELEAKVKSLPEEINFIHSVFDAELSQL
         240       250       260       270       280       290     

        240       250       260       270       280       290      
pF1KB7 QSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQAGK
       :.:..::::::::::.:.::::.::::::::::..:. ::::::.:::::.: ::. ::.
CCDS88 QTQVGDTSVVLSMDNNRNLDLDSIIAEVKAQYEDIANRSRAEAESWYQTKYEELQVTAGR
         300       310       320       330       340       350     

        300       310       320       330       340       350      
pF1KB7 HGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIAEAEERGELALKDARAKQEE
       ::::::::..::::::: ::::.::::..:.: ..:..:::.::.::::::::::::  .
CCDS88 HGDDLRNTKQEISEMNRMIQRLRAEIDSVKKQCSSLQTAIADAEQRGELALKDARAKLVD
         360       370       380       390       400       410     

        360       370       380       390       400       410      
pF1KB7 LEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLLEGEESRLAGDGVGAVNISVM
       :: :::.::::::: ::::::::..:::::.::::::::::::: ::.:.::. :::::.
CCDS88 LEEALQKAKQDMARLLREYQELMNIKLALDVEIATYRKLLEGEECRLSGEGVSPVNISVV
         420       430       440       450       460       470     

             420       430       440       450       460           
pF1KB7 NST-----GGSSSGGGIGLTLGGTMGSNALSFSSSAGPGLLKAYSIRTASASRRSARD  
       .::     :..:: :: .: :::  :    ::..:.: .:                    
CCDS88 TSTLSSGYGSGSSIGGGNLGLGGGSG---YSFTTSGGHSLGAGLGGSGFSATSNRGLGGS
         480       490       500          510       520       530  

CCDS88 GSSVKFVSTTSSSQKSYTH
            540       550 

>>CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12                (483 aa)
 initn: 1242 init1: 1242 opt: 1693  Z-score: 1106.6  bits: 214.1 E(32554): 2.6e-55
Smith-Waterman score: 1693; 62.9% identity (81.8% similar) in 472 aa overlap (6-469:9-470)

                  10        20        30         40        50      
pF1KB7    MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGG-LGSSSLYGLGASRPRVAVRSAYG
               :  : ::   :::.:.      .. ::. ..:::.  .:.:  : .. ..::
CCDS88 MSIRVTQKSYKVSTSGPRAFSSRS-----YTSGPGSRISSSSFSRVGSSNFRGGLGGGYG
               10        20             30        40        50     

         60         70        80        90       100       110     
pF1KB7 GPVG-AGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQ
       :  : .::  ::.:::::.:: :..::..: :: .:.:::::::::::::::::::::::
CCDS88 GASGMGGITAVTVNQSLLSPLVLEVDPNIQAVRTQEKEQIKTLNNKFASFIDKVRFLEQQ
          60        70        80        90       100       110     

         120       130       140       150       160       170     
pF1KB7 NKLLETKWTLLQEQKSAKSSRLPDIFEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVED
       ::.:::::.:::.::.:.:. . ..::. : .:: :::.:  .  .::::: .:: .:::
CCDS88 NKMLETKWSLLQQQKTARSN-MDNMFESYINNLRRQLETLGQEKLKLEAELGNMQGLVED
         120       130        140       150       160       170    

         180       190       200       210       220       230     
pF1KB7 FKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVDALNDEINFLRTLNETELTE
       ::::::::::.::  :::::..::::: :::.:::::.....:.::::::: : : :. :
CCDS88 FKNKYEDEINKRTEMENEFVLIKKDVDEAYMNKVELESRLEGLTDEINFLRQLYEEEIRE
          180       190       200       210       220       230    

         240       250       260       270       280       290     
pF1KB7 LQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQAG
       :::::::::::::::::::::.:.::::::::::..:. ::::::. :: :.: ::. ::
CCDS88 LQSQISDTSVVLSMDNSRSLDMDSIIAEVKAQYEDIANRSRAEAESMYQIKYEELQSLAG
          240       250       260       270       280       290    

         300       310       320       330       340       350     
pF1KB7 KHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIAEAEERGELALKDARAKQE
       ::::::: :..::::::: :.::::::...:.:::.::::::.::.:::::.::: ::  
CCDS88 KHGDDLRRTKTEISEMNRNISRLQAEIEGLKGQRASLEAAIADAEQRGELAIKDANAKLS
          300       310       320       330       340       350    

         360       370       380       390       400       410     
pF1KB7 ELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLLEGEESRLAGDGVGAVNISV
       ::::::::::::::::::::::::.::::::::::::::::::::::: .   :  :.:.
CCDS88 ELEAALQRAKQDMARQLREYQELMNVKLALDIEIATYRKLLEGEESRLES---GMQNMSI
          360       370       380       390       400          410 

              420       430       440       450        460         
pF1KB7 MNST-----GGSSSGGGIGLTLGGTMGSNALSFSSSAGPGLL-KAYSIRTASASRRSARD
        ..:     :: ::. : :::  :   : . ::.:.:: . . .. : :.. ...  .::
CCDS88 HTKTTSGYAGGLSSAYG-GLTSPGLSYSLGSSFGSGAGSSSFSRTSSSRAVVVKKIETRD
             420        430       440       450       460       470

CCDS88 GKLVSESSDVLPK
              480   

>>CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12               (511 aa)
 initn: 1242 init1: 1242 opt: 1693  Z-score: 1106.2  bits: 214.1 E(32554): 2.7e-55
Smith-Waterman score: 1693; 62.9% identity (81.8% similar) in 472 aa overlap (6-469:37-498)

                                        10        20        30     
pF1KB7                          MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGG-L
                                     :  : ::   :::.:.      .. ::. .
CCDS58 SQDLQEGISAWFGPPASTPASTMSIRVTQKSYKVSTSGPRAFSSRS-----YTSGPGSRI
         10        20        30        40        50             60 

           40        50        60         70        80        90   
pF1KB7 GSSSLYGLGASRPRVAVRSAYGGPVG-AGIREVTINQSLLAPLRLDADPSLQRVRQEESE
       .:::.  .:.:  : .. ..:::  : .::  ::.:::::.:: :..::..: :: .:.:
CCDS58 SSSSFSRVGSSNFRGGLGGGYGGASGMGGITAVTVNQSLLSPLVLEVDPNIQAVRTQEKE
              70        80        90       100       110       120 

           100       110       120       130       140       150   
pF1KB7 QIKTLNNKFASFIDKVRFLEQQNKLLETKWTLLQEQKSAKSSRLPDIFEAQIAGLRGQLE
       ::::::::::::::::::::::::.:::::.:::.::.:.:. . ..::. : .:: :::
CCDS58 QIKTLNNKFASFIDKVRFLEQQNKMLETKWSLLQQQKTARSN-MDNMFESYINNLRRQLE
             130       140       150       160        170       180

           160       170       180       190       200       210   
pF1KB7 ALQVDGGRLEAELRSMQDVVEDFKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEA
       .:  .  .::::: .:: .:::::::::::::.::  :::::..::::: :::.:::::.
CCDS58 TLGQEKLKLEAELGNMQGLVEDFKNKYEDEINKRTEMENEFVLIKKDVDEAYMNKVELES
              190       200       210       220       230       240

           220       230       240       250       260       270   
pF1KB7 KVDALNDEINFLRTLNETELTELQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAK
       ....:.::::::: : : :. ::::::::::::::::::::::.:.::::::::::..:.
CCDS58 RLEGLTDEINFLRQLYEEEIRELQSQISDTSVVLSMDNSRSLDMDSIIAEVKAQYEDIAN
              250       260       270       280       290       300

           280       290       300       310       320       330   
pF1KB7 CSRAEAEAWYQTKFETLQAQAGKHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLE
        ::::::. :: :.: ::. ::::::::: :..::::::: :.::::::...:.:::.::
CCDS58 RSRAEAESMYQIKYEELQSLAGKHGDDLRRTKTEISEMNRNISRLQAEIEGLKGQRASLE
              310       320       330       340       350       360

           340       350       360       370       380       390   
pF1KB7 AAIAEAEERGELALKDARAKQEELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYR
       ::::.::.:::::.::: ::  ::::::::::::::::::::::::.:::::::::::::
CCDS58 AAIADAEQRGELAIKDANAKLSELEAALQRAKQDMARQLREYQELMNVKLALDIEIATYR
              370       380       390       400       410       420

           400       410            420       430       440        
pF1KB7 KLLEGEESRLAGDGVGAVNISVMNST-----GGSSSGGGIGLTLGGTMGSNALSFSSSAG
       :::::::::: .   :  :.:. ..:     :: ::. : :::  :   : . ::.:.::
CCDS58 KLLEGEESRLES---GMQNMSIHTKTTSGYAGGLSSAYG-GLTSPGLSYSLGSSFGSGAG
              430          440       450        460       470      

      450        460                      
pF1KB7 PGLL-KAYSIRTASASRRSARD             
        . . .. : :.. ...  .::             
CCDS58 SSSFSRTSSSRAVVVKKIETRDGKLVSESSDVLPK
        480       490       500       510 

>>CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12               (628 aa)
 initn: 1312 init1: 1262 opt: 1623  Z-score: 1060.2  bits: 205.9 E(32554): 9.9e-53
Smith-Waterman score: 1623; 62.8% identity (85.5% similar) in 427 aa overlap (31-450:140-561)

               10        20        30        40        50          
pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYGLGASRPRVAVRSAYG-GPV
                                     :::.:.:. .:  .:     . :  : :: 
CCDS44 GGGRGMGGGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGS-----LGSPGGFGPG
     110       120       130       140       150            160    

      60          70        80        90       100       110       
pF1KB7 G--AGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQNK
       :  .::.::::::::: :: .. ::.. .:. .: :::::::::::::::::::::::::
CCDS44 GFPGGIQEVTINQSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNK
          170       180       190       200       210       220    

       120       130          140       150       160       170    
pF1KB7 LLETKWTLLQEQKSAK---SSRLPDIFEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVE
       .:::::.:::.: ...   .. :  .:: .:  ::. :. .  . :::..::..:.:.::
CCDS44 VLETKWNLLQQQGTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVE
          230       240       250       260       270       280    

          180       190       200       210       220       230    
pF1KB7 DFKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVDALNDEINFLRTLNETELT
       :::.:::::::.:::::::::.::::::.:::.::::.:::::: :::.::::: ..::.
CCDS44 DFKKKYEDEINKRTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELS
          290       300       310       320       330       340    

          240       250       260       270       280       290    
pF1KB7 ELQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQA
       ..::.::::::::::::.::::::.:::::.::::..:. :.::::: ::::.  ::. :
CCDS44 QMQSHISDTSVVLSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTA
          350       360       370       380       390       400    

          300       310       320       330       340       350    
pF1KB7 GKHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIAEAEERGELALKDARAKQ
       :.::::::::..:: :.:: ::::.:::...:.: :.:..::::::..::.::::: :: 
CCDS44 GRHGDDLRNTKSEIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKL
          410       420       430       440       450       460    

          360       370       380       390       400       410    
pF1KB7 EELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLLEGEESRLAGDGVGAVNIS
       .::.::::.::.:.:: ::.:::::.::::::.::::::::::::: :..:.  .::.::
CCDS44 QELQAALQQAKDDLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSIS
          470       480       490       500       510       520    

          420       430        440       450       460             
pF1KB7 VMNSTGGSSSGGGIGLTLGGTMGSN-ALSFSSSAGPGLLKAYSIRTASASRRSARD    
       :..:.  :.:.:: :   :: ::.. . .::...: :                       
CCDS44 VVSSSTTSASAGGYGGGYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSGFS
          530       540       550       560       570       580    

CCDS44 GGSGFGSISGARYGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR
          590       600       610       620        

>>CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12               (520 aa)
 initn: 1683 init1: 1194 opt: 1616  Z-score: 1056.8  bits: 205.0 E(32554): 1.5e-52
Smith-Waterman score: 1616; 59.2% identity (84.3% similar) in 458 aa overlap (12-464:58-509)

                                  10        20        30        40 
pF1KB7                    MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYG
                                     ..: ..:  :..     .  ::.:.... :
CCDS41 GAFSSVSMSGGAGRCSSGGFGSRSLYNLRGNKSISMSVAGSRQGACFGGAGGFGTGGFGG
        30        40        50        60        70        80       

               50          60        70        80        90        
pF1KB7 -LGASRPRVAVRSAYGGPV--GAGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTL
        .:.:    . ... : ::  ..::.:::::::::.::... :: .:.:: :: :::: :
CCDS41 GFGGS---FSGKGGPGFPVCPAGGIQEVTINQSLLTPLHVEIDPEIQKVRTEEREQIKLL
        90          100       110       120       130       140    

      100       110       120       130        140       150       
pF1KB7 NNKFASFIDKVRFLEQQNKLLETKWTLLQEQKSAKSSR-LPDIFEAQIAGLRGQLEALQV
       :::::::::::.:::::::.:::::.:::.: .. ::. :  .::. .. :: ::..:  
CCDS41 NNKFASFIDKVQFLEQQNKVLETKWNLLQQQTTTTSSKNLEPLFETYLSVLRKQLDTLGN
          150       160       170       180       190       200    

       160       170       180       190       200       210       
pF1KB7 DGGRLEAELRSMQDVVEDFKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVDA
       : :::..::..::: :::::.:::.:::.::::::.::::::::::::..:::::::::.
CCDS41 DKGRLQSELKTMQDSVEDFKTKYEEEINKRTAAENDFVVLKKDVDAAYLNKVELEAKVDS
          210       220       230       240       250       260    

       220       230       240       250       260       270       
pF1KB7 LNDEINFLRTLNETELTELQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRA
       ::::::::..: ..::...:...:::::::::::.:.::::.:::::.:::::.:. :.:
CCDS41 LNDEINFLKVLYDAELSQMQTHVSDTSVVLSMDNNRNLDLDSIIAEVRAQYEEIAQRSKA
          270       280       290       300       310       320    

       280       290       300       310       320       330       
pF1KB7 EAEAWYQTKFETLQAQAGKHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIA
       :::: :::: . :: .. .:::.:.::..::.:.:: ::::.:::.:::.:   :....:
CCDS41 EAEALYQTKVQQLQISVDQHGDNLKNTKSEIAELNRMIQRLRAEIENIKKQCQTLQVSVA
          330       340       350       360       370       380    

       340       350       360       370       380       390       
pF1KB7 EAEERGELALKDARAKQEELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLLE
       .::.::: :::::..:. :::::::.::...::.::::::::::::::::::::::::::
CCDS41 DAEQRGENALKDAHSKRVELEAALQQAKEELARMLREYQELMSVKLALDIEIATYRKLLE
          390       400       410       420       430       440    

       400       410       420       430       440        450      
pF1KB7 GEESRLAGDGVGAVNISVMNSTGGSSSGGGIGLTLGGTMGSNALS-FSSSAGPGLLKAYS
       ::: :..:.  .::.:::..   ::.: :::.  ::.  : .  : :.:..: :.  . :
CCDS41 GEEYRMSGECQSAVSISVVS---GSTSTGGISGGLGSGSGFGLSSGFGSGSGSGFGFGGS
          450       460          470       480       490       500 

        460               
pF1KB7 IRTASASRRSARD      
       .  .:.:.           
CCDS41 VSGSSSSKIISTTTLNKRR
             510       520




469 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Mon Nov  7 02:36:27 2016 done: Mon Nov  7 02:36:28 2016
 Total Scan time:  2.570 Total Display time:  0.090

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com