Result of FASTA (ccds) for pFN21AE0564
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KE0564, 448 aa
  1>>>pF1KE0564 448 - 448 aa - 448 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 7.5063+/-0.00119; mu= 9.2167+/- 0.071
 mean_var=217.8258+/-41.707, 0's: 0 Z-trim(110.2): 139  B-trim: 107 in 2/52
 Lambda= 0.086900
 statistics sampled from 11269 (11417) to 11269 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.694), E-opt: 0.2 (0.351), width:  16
 Scan time:  2.410

The best scores are:                                      opt bits E(32554)
CCDS11393.1 KRT32 gene_id:3882|Hs108|chr17         ( 448) 3005 389.8  3e-108
CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17         ( 455) 1899 251.1 1.7e-66
CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17         ( 467) 1885 249.4 5.7e-66
CCDS11391.1 KRT31 gene_id:3881|Hs108|chr17         ( 416) 1819 241.1 1.6e-63
CCDS11388.1 KRT33A gene_id:3883|Hs108|chr17        ( 404) 1754 232.9 4.6e-61
CCDS11389.1 KRT33B gene_id:3884|Hs108|chr17        ( 404) 1752 232.7 5.4e-61
CCDS11390.1 KRT34 gene_id:3885|Hs108|chr17         ( 436) 1731 230.1 3.5e-60
CCDS42320.1 KRT40 gene_id:125115|Hs108|chr17       ( 431) 1588 212.1 8.7e-55
CCDS11382.1 KRT39 gene_id:390792|Hs108|chr17       ( 491) 1564 209.2 7.7e-54
CCDS11392.1 KRT38 gene_id:8687|Hs108|chr17         ( 456) 1552 207.6 2.1e-53
CCDS32653.1 KRT37 gene_id:8688|Hs108|chr17         ( 449) 1513 202.7 6.1e-52
CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17         ( 472) 1227 166.9 3.9e-41
CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17         ( 456) 1220 166.0   7e-41
CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17         ( 400) 1208 164.4 1.8e-40
CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17         ( 432) 1201 163.6 3.5e-40
CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17         ( 473) 1190 162.3 9.7e-40
CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17         ( 458) 1176 160.5 3.2e-39
CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17         ( 420) 1165 159.1 7.9e-39
CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17         ( 584) 1115 153.0 7.6e-37
CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17         ( 494) 1087 149.4 7.7e-36
CCDS11379.1 KRT20 gene_id:54474|Hs108|chr17        ( 424) 1027 141.8 1.3e-33
CCDS11375.1 KRT27 gene_id:342574|Hs108|chr17       ( 459)  996 137.9   2e-32
CCDS11376.1 KRT28 gene_id:162605|Hs108|chr17       ( 464)  984 136.4 5.7e-32
CCDS11373.1 KRT25 gene_id:147183|Hs108|chr17       ( 450)  979 135.8 8.7e-32
CCDS11372.1 KRT24 gene_id:192666|Hs108|chr17       ( 525)  980 136.0 8.8e-32
CCDS31809.1 KRT18 gene_id:3875|Hs108|chr12         ( 430)  961 133.5   4e-31
CCDS32654.1 KRT9 gene_id:3857|Hs108|chr17          ( 623)  909 127.2 4.7e-29
CCDS11374.1 KRT26 gene_id:353288|Hs108|chr17       ( 468)  904 126.4   6e-29
CCDS11380.1 KRT23 gene_id:25984|Hs108|chr17        ( 422)  892 124.9 1.6e-28
CCDS62182.1 KRT23 gene_id:25984|Hs108|chr17        ( 285)  701 100.7   2e-21
CCDS45708.1 GFAP gene_id:2670|Hs108|chr17          ( 431)  608 89.3 8.5e-18
CCDS11491.1 GFAP gene_id:2670|Hs108|chr17          ( 432)  608 89.3 8.5e-18
CCDS59296.1 GFAP gene_id:2670|Hs108|chr17          ( 438)  608 89.3 8.5e-18
CCDS6046.1 NEFM gene_id:4741|Hs108|chr8            ( 916)  595 88.0 4.3e-17
CCDS33383.1 DES gene_id:1674|Hs108|chr2            ( 470)  587 86.7 5.5e-17
CCDS7120.1 VIM gene_id:7431|Hs108|chr10            ( 466)  565 83.9 3.7e-16
CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12         ( 505)  542 81.1 2.9e-15
CCDS7545.1 INA gene_id:9118|Hs108|chr10            ( 499)  540 80.8 3.4e-15
CCDS75712.1 NEFL gene_id:4747|Hs108|chr8           ( 543)  539 80.7   4e-15
CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12          ( 493)  538 80.6   4e-15
CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12          ( 507)  536 80.3 4.9e-15
CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12         ( 486)  533 79.9 6.2e-15
CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12          ( 551)  531 79.7   8e-15
CCDS13858.1 NEFH gene_id:4744|Hs108|chr22          (1020)  535 80.5 8.4e-15
CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12          ( 600)  531 79.8 8.4e-15
CCDS8826.1 KRT82 gene_id:3888|Hs108|chr12          ( 513)  526 79.1 1.2e-14
CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12           ( 483)  520 78.3 1.9e-14
CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12          ( 511)  520 78.3   2e-14
CCDS8783.1 PRPH gene_id:5630|Hs108|chr12           ( 470)  519 78.1   2e-14
CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12           ( 469)  516 77.8 2.6e-14


>>CCDS11393.1 KRT32 gene_id:3882|Hs108|chr17              (448 aa)
 initn: 3005 init1: 3005 opt: 3005  Z-score: 2056.9  bits: 389.8 E(32554): 3e-108
Smith-Waterman score: 3005; 100.0% identity (100.0% similar) in 448 aa overlap (1-448:1-448)

               10        20        30        40        50        60
pF1KE0 MTSSCCVTNNLQASLKSCPRPASVCSSGVNCRPELCLGYVCQPMACLPSVCLPTTFRPAS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MTSSCCVTNNLQASLKSCPRPASVCSSGVNCRPELCLGYVCQPMACLPSVCLPTTFRPAS
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KE0 CLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVRQLEQE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 CLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVRQLEQE
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KE0 NAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAKLAADD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 NAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAKLAADD
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KE0 FRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHEEEVGS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 FRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHEEEVGS
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KE0 LRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELNQQVAT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELNQQVAT
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KE0 SSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQCMITN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQCMITN
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KE0 VEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTPSCTTC
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTPSCTTC
              370       380       390       400       410       420

              430       440        
pF1KE0 VPSPCVPRTVCVPRTVGMPCSPCPQGRY
       ::::::::::::::::::::::::::::
CCDS11 VPSPCVPRTVCVPRTVGMPCSPCPQGRY
              430       440        

>>CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17              (455 aa)
 initn: 1943 init1: 1798 opt: 1899  Z-score: 1307.5  bits: 251.1 E(32554): 1.7e-66
Smith-Waterman score: 1915; 67.0% identity (82.3% similar) in 464 aa overlap (1-448:1-455)

               10        20        30          40        50        
pF1KE0 MTSSCCVTNNLQASLKSCPRPASVCSSGVNC--RPELCLGYVCQPMACLPSVCLP----T
       :.:.:  ..  ..:::: :  ::  :. :.       :     .:.:   :.:      .
CCDS11 MASKCLKAGFSSGSLKS-PGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLGRS
               10         20        30        40        50         

           60        70        80         90       100       110   
pF1KE0 TFRPASCLSKTYLSSSCQAASGISGSM-GPGSWYSEGAFNGNEKETMQFLNDRLASYLTR
       ..: .:::        :  :.:.. :. : :.:..:: ..:::::::: ::::::.:: .
CCDS11 SYRATSCLPAL-----CLPAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEK
      60        70             80        90       100       110    

           120       130       140       150       160       170   
pF1KE0 VRQLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDN
       ::::::::: :::::.:  ..::  : :::::.::::::::.: ::.::::::.::.:::
CCDS11 VRQLEQENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDN
          120       130       140       150       160       170    

           180       190       200       210       220       230   
pF1KE0 AKLAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKN
       :::::::::.:::.:...:::::.::::::::::::::::.:::::::::::::.:::::
CCDS11 AKLAADDFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKN
          180       190       200       210       220       230    

           240       250       260       270       280       290   
pF1KE0 HEEEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEE
       :::::.:::::::::::.::::::::::.:::::::::::..:: ::::.:.:.. : ::
CCDS11 HEEEVNSLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEE
          240       250       260       270       280       290    

           300       310       320       330       340       350   
pF1KE0 LNQQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQ
       :::::..::::::. :..::.::::::.::::::::::.::.::.::.:.::::::::::
CCDS11 LNQQVVSSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQ
          300       310       320       330       340       350    

           360       370       380       390       400       410   
pF1KE0 MQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCS
       ::::::::::::::::::::::::::::::::::::: ::::::.:::.:: :::::::.
CCDS11 MQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCA
          360       370       380       390       400       410    

                420           430       440        
pF1KE0 ---TPS--CTTCVPSP-CVP---RTVCVPRTVGMPCSPCPQGRY
          .::  :  :.:.  : :   :: : :: .   : ::: ::.
CCDS11 PDYSPSKSCLPCLPAASCGPSAARTNCSPRPI---CVPCPGGRF
          420       430       440          450     

>>CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17              (467 aa)
 initn: 1930 init1: 1765 opt: 1885  Z-score: 1297.9  bits: 249.4 E(32554): 5.7e-66
Smith-Waterman score: 1896; 66.4% identity (82.9% similar) in 455 aa overlap (1-445:1-438)

               10               20        30           40        50
pF1KE0 MTSSCCVTNNLQASLKS-C------PRPASVCSSGVNCR-PELC--LGYVCQPMACLPSV
       :... :. .   .:.:. :       : .:. : : .:: : :    ::. .  . : ..
CCDS11 MATQTCTPTFSTGSIKGLCGTAGGISRVSSIRSVG-SCRVPSLAGAAGYISSARSGLSGL
               10        20        30         40        50         

               60        70        80        90       100       110
pF1KE0 CLPTTFRPASCLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASY
               .:::  .:::: :..    :: .: :.:. ::.:::.:::::::::::::.:
CCDS11 --------GSCLPGSYLSSECHT----SGFVGSGGWFCEGSFNGSEKETMQFLNDRLANY
              60        70            80        90       100       

              120       130       140       150       160       170
pF1KE0 LTRVRQLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVN
       : .:::::.:::::::::::  . :.  . :::::.:.:::..::::: ::.::::.:..
CCDS11 LEKVRQLERENAELESRIQEWYEFQIPYICPDYQSYFKTIEDFQQKILLTKSENARLVLQ
       110       120       130       140       150       160       

              180       190       200       210       220       230
pF1KE0 IDNAKLAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCL
       ::::::::::::.:::.::..::::::::::::::::.::::::::::::::::::::::
CCDS11 IDNAKLAADDFRTKYETELSLRQLVEADINGLRRILDELTLCKADLEAQVESLKEELMCL
       170       180       190       200       210       220       

              240       250       260       270       280       290
pF1KE0 KKNHEEEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQ
       ::::::::. ::::::::::.::::::::::...::.:::::::.:: :::::: ::: :
CCDS11 KKNHEEEVSVLRCQLGDRLNVEVDAAPPVDLNKILEDMRCQYEALVENNRRDVEAWFNTQ
       230       240       250       260       270       280       

              300       310       320       330       340       350
pF1KE0 MEELNQQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQ
        :::::::..::::::  :..::.::::::.::::::::::.:.:::.::.:.:::::::
CCDS11 TEELNQQVVSSSEQLQCCQTEIIELRRTVNALEIELQAQHSMRNSLESTLAETEARYSSQ
       290       300       310       320       330       340       

              360       370       380       390       400       410
pF1KE0 LAQMQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCN
       ::::::.:.::::::.::: :::::::::::::::.::::::: ::: :::.:::::: .
CCDS11 LAQMQCLISNVEAQLSEIRCDLERQNQEYQVLLDVKARLEGEIATYRHLLEGEDCKLPPQ
       350       360       370       380       390       400       

              420       430       440                              
pF1KE0 PCSTPSCTTCVPSPCVPRTVCVPRTVGMPCSPCPQGRY                      
       ::.: .:   .  : :: . :::   ..::.: ::                         
CCDS11 PCAT-ACKPVIRVPSVPPVPCVP---SVPCTPAPQVGTQIRTITEEIRDGKVISSREHVQ
       410        420          430       440       450       460   

CCDS11 SRPL
           

>>CCDS11391.1 KRT31 gene_id:3881|Hs108|chr17              (416 aa)
 initn: 1889 init1: 1763 opt: 1819  Z-score: 1253.7  bits: 241.1 E(32554): 1.6e-63
Smith-Waterman score: 1819; 69.1% identity (87.4% similar) in 405 aa overlap (46-447:6-407)

          20        30        40        50        60        70     
pF1KE0 KSCPRPASVCSSGVNCRPELCLGYVCQPMACLPSVCLPTTFRPASCLSKTYLSSSCQAAS
                                     ::::.   :.     :.  .  : .  .: 
CCDS11                          MPYNFCLPSLSCRTSCSSRPCVPPSCHSCTLPGAC
                                        10        20        30     

          80        90       100       110       120       130     
pF1KE0 GISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVRQLEQENAELESRIQEASHSQ
       .: ....  .:. ::.:::.:::::::::::::::: .:::::..:::::. :.: :..:
CCDS11 NIPANVSNCNWFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAELENLIRERSQQQ
          40        50        60        70        80        90     

         140       150       160       170       180       190     
pF1KE0 VLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAKLAADDFRAKYEAELAMRQLV
          . :.:::.:.:::::::::::::.::::.::.::::::::::::.::..::..::::
CCDS11 EPLLCPSYQSYFKTIEELQQKILCTKSENARLVVQIDNAKLAADDFRTKYQTELSLRQLV
         100       110       120       130       140       150     

         200       210       220       230       240       250     
pF1KE0 EADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHEEEVGSLRCQLGDRLNIEVDA
       :.::::::::::.:::::.:::::::::::::.:::.:::.::..::::::::::.::::
CCDS11 ESDINGLRRILDELTLCKSDLEAQVESLKEELLCLKSNHEQEVNTLRCQLGDRLNVEVDA
         160       170       180       190       200       210     

         260       270       280       290       300       310     
pF1KE0 APPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELNQQVATSSEQLQNYQSDIIDL
       :: :::.:::.: : ::::.::.:::.::.::. : ::::.::..::::::.::..::.:
CCDS11 APTVDLNRVLNETRSQYEALVETNRREVEQWFTTQTEELNKQVVSSSEQLQSYQAEIIEL
         220       230       240       250       260       270     

         320       330       340       350       360       370     
pF1KE0 RRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQCMITNVEAQLAEIRADLERQ
       :::::.:::::::::.::::::::::::::::::::.:.: .:::::.::::::.:::::
CCDS11 RRTVNALEIELQAQHNLRDSLENTLTESEARYSSQLSQVQSLITNVESQLAEIRSDLERQ
         280       290       300       310       320       330     

         380       390       400       410       420         430   
pF1KE0 NQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTPSCTTCVPSPCV--PRTVCVP
       ::::::::::::::: ::::::::::.:::.:: :::.: .  .   .::.  : : :::
CCDS11 NQEYQVLLDVRARLECEINTYRSLLESEDCNLPSNPCATTNACSKPIGPCLSNPCTSCVP
         340       350       360       370       380       390     

           440                 
pF1KE0 RTVGMPCSPC-PQGRY        
        .   ::.:: :. :         
CCDS11 PA---PCTPCAPRPRCGPCNSFVR
            400       410      

>>CCDS11388.1 KRT33A gene_id:3883|Hs108|chr17             (404 aa)
 initn: 1770 init1: 1727 opt: 1754  Z-score: 1209.8  bits: 232.9 E(32554): 4.6e-61
Smith-Waterman score: 1754; 68.1% identity (86.1% similar) in 404 aa overlap (37-433:1-398)

         10        20        30        40          50        60    
pF1KE0 VTNNLQASLKSCPRPASVCSSGVNCRPELCLGYVCQ-P-MACLPSVCLPTTFRPASCLSK
                                     ..: :  : ..:  : :      : :: . 
CCDS11                               MSYSCGLPSLSCRTS-CSSRPCVPPSCHGC
                                             10         20         

           70        80        90       100       110       120    
pF1KE0 TYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVRQLEQENAEL
       : : ..:.  ...:.     .:. ::.:::.:::::::::::::::: .:::::..::::
CCDS11 T-LPGACNIPANVSNC----NWFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAEL
      30         40            50        60        70        80    

          130       140       150       160       170       180    
pF1KE0 ESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAKLAADDFRAK
       :. :.: :..:   .  .:::.:.:::::::::::.:.::::.::.:::::::.::::.:
CCDS11 ENLIRERSQQQEPLVCASYQSYFKTIEELQQKILCSKSENARLVVQIDNAKLASDDFRTK
           90       100       110       120       130       140    

          190       200       210       220       230       240    
pF1KE0 YEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHEEEVGSLRCQ
       ::.::..:::::.::::::::::.::::..:::::::::::::.:::.:::.::..::::
CCDS11 YETELSLRQLVESDINGLRRILDELTLCRSDLEAQVESLKEELLCLKQNHEQEVNTLRCQ
          150       160       170       180       190       200    

          250       260       270       280       290       300    
pF1KE0 LGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELNQQVATSSEQ
       ::::::.:::::: :::..::.: : ::::.::.:::.::.::  : ::::.::..::::
CCDS11 LGDRLNVEVDAAPTVDLNQVLNETRSQYEALVETNRREVEQWFATQTEELNKQVVSSSEQ
          210       220       230       240       250       260    

          310       320       330       340       350       360    
pF1KE0 LQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQCMITNVEAQ
       ::.::..::.::::::.:::::::::.::::::::::::::::::::.:.: .:::::.:
CCDS11 LQSYQAEIIELRRTVNALEIELQAQHNLRDSLENTLTESEARYSSQLSQVQRLITNVESQ
          270       280       290       300       310       320    

          370       380       390       400       410              
pF1KE0 LAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTPS-CTT----
       :::::.:::::::::::::::::::: ::::::::::.:::::: :::.: . :      
CCDS11 LAEIRSDLERQNQEYQVLLDVRARLECEINTYRSLLESEDCKLPSNPCATTNACDKSTGP
          330       340       350       360       370       380    

     420       430       440        
pF1KE0 CVPSPCVPRTVCVPRTVGMPCSPCPQGRY
       :. .::  :. : :               
CCDS11 CISNPCGLRARCGPCNTFGY         
          390       400             

>>CCDS11389.1 KRT33B gene_id:3884|Hs108|chr17             (404 aa)
 initn: 1755 init1: 1697 opt: 1752  Z-score: 1208.5  bits: 232.7 E(32554): 5.4e-61
Smith-Waterman score: 1752; 68.1% identity (87.2% similar) in 398 aa overlap (47-433:1-398)

         20        30        40         50        60        70     
pF1KE0 SCPRPASVCSSGVNCRPELCLGYVCQPMACLP-SVCLPTTFRPASCLSKTYLSSSCQA--
                                     .: . :::.    .:: :.  .  ::..  
CCDS11                               MPYNFCLPSLSCRTSCSSRPCVPPSCHGYT
                                             10        20        30

               80        90       100       110       120       130
pF1KE0 ---ASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVRQLEQENAELESRIQE
          : .: ....  .:. ::.:::.:::::::::::::::: .:::::..:::::. :.:
CCDS11 LPGACNIPANVSNCNWFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAELENLIRE
               40        50        60        70        80        90

              140       150       160       170       180       190
pF1KE0 ASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAKLAADDFRAKYEAELA
        :..:   . :.:::.:.:::::::::::.:.::::.::.::::::::::::.::..: .
CCDS11 RSQQQEPLLCPSYQSYFKTIEELQQKILCSKSENARLVVQIDNAKLAADDFRTKYQTEQS
              100       110       120       130       140       150

              200       210       220       230       240       250
pF1KE0 MRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHEEEVGSLRCQLGDRLN
       .:::::.:::.::::::.::::..:::::.:::::::. ::.:::.::..::::::::::
CCDS11 LRQLVESDINSLRRILDELTLCRSDLEAQMESLKEELLSLKQNHEQEVNTLRCQLGDRLN
              160       170       180       190       200       210

              260       270       280       290       300       310
pF1KE0 IEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELNQQVATSSEQLQNYQS
       .:::::: :::..::.: : ::::.::.:::.::.::  : ::::.::..::::::.::.
CCDS11 VEVDAAPAVDLNQVLNETRNQYEALVETNRREVEQWFATQTEELNKQVVSSSEQLQSYQA
              220       230       240       250       260       270

              320       330       340       350       360       370
pF1KE0 DIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQCMITNVEAQLAEIRA
       .::.::::::.:::::::::.:: :::::::::::::::::.:.: .:::::.::::::.
CCDS11 EIIELRRTVNALEIELQAQHNLRYSLENTLTESEARYSSQLSQVQSLITNVESQLAEIRS
              280       290       300       310       320       330

              380       390       400       410            420     
pF1KE0 DLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTPS-CT----TCVPSPC
       :::::::::::::::::::: ::::::::::.:::::: :::.: . :     .:: .::
CCDS11 DLERQNQEYQVLLDVRARLECEINTYRSLLESEDCKLPSNPCATTNACEKPIGSCVTNPC
              340       350       360       370       380       390

         430       440        
pF1KE0 VPRTVCVPRTVGMPCSPCPQGRY
        ::. : :               
CCDS11 GPRSRCGPCNTFGY         
              400             

>>CCDS11390.1 KRT34 gene_id:3885|Hs108|chr17              (436 aa)
 initn: 1710 init1: 1710 opt: 1731  Z-score: 1193.9  bits: 230.1 E(32554): 3.5e-60
Smith-Waterman score: 1731; 65.7% identity (83.8% similar) in 414 aa overlap (20-425:23-427)

                  10        20        30           40        50    
pF1KE0    MTSSCCVTNNLQASLKSCPRPASVCSSGVNCRPELC---LGYVCQPMACLPSV----
                             .:: .  . ..:    :   ..: :    ::::.    
CCDS11 MLYAKPPPTINGIKGLQRKERLKPAHIHLQQLTCFSITCSSTMSYSC----CLPSLGCRT
               10        20        30        40            50      

                60        70        80        90       100         
pF1KE0 -CLPTTFRPASCLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLAS
        :      : :: . : : ..:.  ...:.     .:. ::.:::.::::::::::::::
CCDS11 SCSSRPCVPPSCHGYT-LPGACNIPANVSNC----NWFCEGSFNGSEKETMQFLNDRLAS
         60        70         80            90       100       110 

     110       120       130       140       150       160         
pF1KE0 YLTRVRQLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVV
       :: .:::::..:::::. ::: :..:   . :.:::.:.:::::::::::.::::::.::
CCDS11 YLEKVRQLERDNAELEKLIQERSQQQEPLLCPSYQSYFKTIEELQQKILCAKAENARLVV
             120       130       140       150       160       170 

     170       180       190       200       210       220         
pF1KE0 NIDNAKLAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMC
       ::::::::.::::.::..: ..: :::.:::..:::::.:::::.:::.:::::.:::.:
CCDS11 NIDNAKLASDDFRSKYQTEQSLRLLVESDINSIRRILDELTLCKSDLESQVESLREELIC
             180       190       200       210       220       230 

     230       240       250       260       270       280         
pF1KE0 LKKNHEEEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNM
       :::::::::..:: :::::::.:::.:: :::..::.: : ::::.:: :::.::.::  
CCDS11 LKKNHEEEVNTLRSQLGDRLNVEVDTAPTVDLNQVLNETRSQYEALVEINRREVEQWFAT
             240       250       260       270       280       290 

     290       300       310       320       330       340         
pF1KE0 QMEELNQQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSS
       : ::::.::..::::::. :..::.::::::.:::::::::.::::::::::::::.:::
CCDS11 QTEELNKQVVSSSEQLQSCQAEIIELRRTVNALEIELQAQHNLRDSLENTLTESEAHYSS
             300       310       320       330       340       350 

     350       360       370       380       390       400         
pF1KE0 QLAQMQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPC
       ::.:.: .:::::.:::::: :::::::::::::::::::: ::::::::::.:::::::
CCDS11 QLSQVQSLITNVESQLAEIRCDLERQNQEYQVLLDVRARLECEINTYRSLLESEDCKLPC
             360       370       380       390       400       410 

     410       420       430       440        
pF1KE0 NPCSTPSCTTCVPSPCVPRTVCVPRTVGMPCSPCPQGRY
       :::.: . .    .::                       
CCDS11 NPCATTNASGNSCGPCGTSQKGCCN              
             420       430                    

>>CCDS42320.1 KRT40 gene_id:125115|Hs108|chr17            (431 aa)
 initn: 1632 init1: 1468 opt: 1588  Z-score: 1097.0  bits: 212.1 E(32554): 8.7e-55
Smith-Waterman score: 1588; 57.9% identity (79.3% similar) in 439 aa overlap (1-431:1-424)

               10        20        30        40        50        60
pF1KE0 MTSSCCVTNNLQASLKSCPRPASVCSSGVNCRPELCLGYVCQPMACLPSVCLPTTFRPAS
       :::.:  :.    : .::   :: :. . .:  :     .: : .:  : :   .:   :
CCDS42 MTSDCSSTH---CSPESCGT-ASGCAPASSCSVET----ACLPGTCATSRCQTPSFLSRS
                  10         20        30            40        50  

                    70        80        90       100       110     
pF1KE0 -----CLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVR
            ::   :...::..   .    :  .:  .:.:..::::::::::::::::: .::
CCDS42 RGLTGCLLPCYFTGSCNSPCLV----GNCAWCEDGVFTSNEKETMQFLNDRLASYLEKVR
             60        70            80        90       100        

         120       130       140       150       160       170     
pF1KE0 QLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAK
       .::. ::::::::::  ....  . :::: .: :::.::::::::::::.:..:..:: :
CCDS42 SLEETNAELESRIQEQCEQDIPMVCPDYQRYFNTIEDLQQKILCTKAENSRLAVQLDNCK
      110       120       130       140       150       160        

         180       190       200       210       220       230     
pF1KE0 LAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHE
       ::.:::..:::.::..:::.::::..:. ::..:::::.::::.::::::.:.:::::::
CCDS42 LATDDFKSKYESELSLRQLLEADISSLHGILEELTLCKSDLEAHVESLKEDLLCLKKNHE
      170       180       190       200       210       220        

         240       250       260       270       280       290     
pF1KE0 EEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELN
       :::. :: ::::::..:.:.:: .::.:::.::::: :...  :::..:::. .: ::::
CCDS42 EEVNLLREQLGDRLSVELDTAPTLDLNRVLDEMRCQCETVLANNRREAEEWLAVQTEELN
      230       240       250       260       270       280        

         300       310       320       330       340       350     
pF1KE0 QQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQ
       ::  .:.::::. : .:..:.::...::::::::.:: .::: :..:.::.:::::::.:
CCDS42 QQQLSSAEQLQGCQMEILELKRTASALEIELQAQQSLTESLECTVAETEAQYSSQLAQIQ
      290       300       310       320       330       340        

         360       370       380       390       400       410     
pF1KE0 CMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTP
       :.: :.: :::::: :::::::::::::::.:::::::::: .::..:: .: :.:::: 
CCDS42 CLIDNLENQLAEIRCDLERQNQEYQVLLDVKARLEGEINTYWGLLDSEDSRLSCSPCST-
      350       360       370       380       390       400        

            420       430       440        
pF1KE0 SCT---TCVPSPCVPRTVCVPRTVGMPCSPCPQGRY
       .::   ::   ::   ..:                 
CCDS42 TCTSSNTC--EPCSAYVICTVENCCL          
       410         420       430           

>>CCDS11382.1 KRT39 gene_id:390792|Hs108|chr17            (491 aa)
 initn: 1553 init1: 1434 opt: 1564  Z-score: 1080.1  bits: 209.2 E(32554): 7.7e-54
Smith-Waterman score: 1564; 56.6% identity (77.7% similar) in 452 aa overlap (2-443:3-442)

                10        20          30        40        50       
pF1KE0  MTSSCCVTNNLQASLKSCPRPASVC--SSGVNCRPELCLGYVCQPMACLPSV-----CL
         :..: .::. ..  ..: : ..:   ::. .:.:       ::: . .  .     : 
CCDS11 MDTKGCTTTNSPSTPCQNCSRITNVSTISSNNGCHPGGLTVNNCQPAGHVLRIPWDQGCQ
               10        20        30        40        50        60

             60        70        80        90       100       110  
pF1KE0 PTTFRPASCLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLT
       ::   :  : .  :: .. .:      :.   :::.:: .:.:::::::.::.:::.:: 
CCDS11 PT---PRFCRKPIYLMNNFNA----RFSLDDCSWYGEG-INSNEKETMQILNERLANYLQ
                  70            80        90        100       110  

            120       130       140       150       160       170  
pF1KE0 RVRQLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNID
       .::.::.:::::::.::: :.... .. ::: :.. ::::::::::::::::.:.: .::
CCDS11 KVRMLERENAELESKIQEESNKELPVLCPDYLSYYTTIEELQQKILCTKAENSRLVSQID
            120       130       140       150       160       170  

            180       190       200       210       220       230  
pF1KE0 NAKLAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKK
       :.::.:::.:::::::...:::::.: :::..::. ::: ::::::::.::::::.:::.
CCDS11 NTKLTADDLRAKYEAEVSLRQLVESDANGLKQILNVLTLGKADLEAQVQSLKEELLCLKN
            180       190       200       210       220       230  

            240       250       260       270       280       290  
pF1KE0 NHEEEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQME
       ::.::..::.::::.::.::: ::: .::..::.::::::: ..:.::.:::.::: :.:
CCDS11 NHKEEINSLQCQLGERLDIEVTAAPSADLNQVLQEMRCQYEPIMETNRKDVEQWFNTQIE
            240       250       260       270       280       290  

            300       310       320       330       340       350  
pF1KE0 ELNQQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLA
       ::::::.:::.: :  :..::.:::.:::::.:::::: .::: :  :::.::::.. :.
CCDS11 ELNQQVVTSSQQQQCCQKEIIELRRSVNTLEVELQAQHRMRDSQECILTETEARYTALLT
            300       310       320       330       340       350  

            360       370       380       390       400       410  
pF1KE0 QMQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPC
       :.: .: :.::::::::  ::::::::..::::..::: ::.:::::::. : : :: : 
CCDS11 QIQSLIDNLEAQLAEIRCALERQNQEYEILLDVKSRLECEITTYRSLLESSDGKRPCYP-
            360       370       380       390       400       410  

            420          430       440                             
pF1KE0 STPSCTTCVPSP---CVPRTVCVPRTVGMPCSPCPQGRY                     
            : : :::   :   ..     .    :::                          
CCDS11 ---RATKCEPSPWTSCKSGAIESTAPACTSSSPCSLKEHCSACGPLSRILVKICTITKEI
                420       430       440       450       460        

CCDS11 KDGKVISSYEHVQPCFIIRPAKV
      470       480       490 

>>CCDS11392.1 KRT38 gene_id:8687|Hs108|chr17              (456 aa)
 initn: 1596 init1: 1430 opt: 1552  Z-score: 1072.4  bits: 207.6 E(32554): 2.1e-53
Smith-Waterman score: 1557; 55.6% identity (74.4% similar) in 464 aa overlap (2-446:6-453)

                   10        20        30          40              
pF1KE0     MTSSCCVTNNLQASLKSCPRPASVCSSGVNCRP--ELCLGYVC-------------
            .:: :    :  ..    : .::    ..:.:  :  .. .:             
CCDS11 MTSSYSSSSC---PLGCTMAPGARNVSVSPIDIGCQPGAEANIAPMCLLANVAHANRVRV
               10           20        30        40        50       

                50        60        70        80        90         
pF1KE0 --QPMACLPSVCLPTTFRPASCLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKET
          :..  ::.::: :     : .   : ..:.    : :..:  . :.:...::.::::
CCDS11 GSTPLG-RPSLCLPPT-----CHTACPLPGTCH----IPGNIGICGAYGENTLNGHEKET
        60         70             80            90       100       

     100       110       120       130       140       150         
pF1KE0 MQFLNDRLASYLTRVRQLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILC
       :::::::::.:: .::::::::::::. . : :. .  :. :::::.:.:::::::::::
CCDS11 MQFLNDRLANYLEKVRQLEQENAELEATLLERSKCHESTVCPDYQSYFHTIEELQQKILC
       110       120       130       140       150       160       

     160       170       180       190       200       210         
pF1KE0 TKAENARMVVNIDNAKLAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQ
       .::::::..:.:::::::::::: : :.: ..:::::::  : ...::: :: :::::::
CCDS11 SKAENARLIVQIDNAKLAADDFRIKLESERSLRQLVEADKCGTQKLLDDATLAKADLEAQ
       170       180       190       200       210       220       

     220       230       240       250       260       270         
pF1KE0 VESLKEELMCLKKNHEEEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEAN
        :::::: . ::.:::.::  :: :::..: ::.:  : .::.::: ::: :::::.:.:
CCDS11 QESLKEEQLSLKSNHEQEVKILRSQLGEKLRIELDIEPTIDLNRVLGEMRAQYEAMLETN
       230       240       250       260       270       280       

     280       290       300       310       320       330         
pF1KE0 RRDVEEWFNMQMEELNQQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENT
       :.:::.::. : : .. :  . ::.::  ::.:..:: :::.::.: ::::.:.: :.:.
CCDS11 RQDVEQWFQAQSEGISLQDMSCSEELQCCQSEILELRCTVNALEVERQAQHTLKDCLQNS
       290       300       310       320       330       340       

     340       350       360       370       380       390         
pF1KE0 LTESEARYSSQLAQMQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSL
       : :.: :....::::: .:.::: ::.:::::::::::::::::::..:::.:: :::.:
CCDS11 LCEAEDRFGTELAQMQSLISNVEEQLSEIRADLERQNQEYQVLLDVKTRLENEIATYRNL
       350       360       370       380       390       400       

     400       410        420       430        440         
pF1KE0 LENEDCKLPCNPCST-PSCTTCVPSPCVPRTVCVP-RTVGMPCSPCPQGRY 
       ::.:::::::::::: :::.:   .::.::  : :  : :  :.    :   
CCDS11 LESEDCKLPCNPCSTSPSCVT---APCAPRPSCGPCTTCGPTCGASTTGSRF
       410       420          430       440       450      




448 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Wed Nov  2 23:11:20 2016 done: Wed Nov  2 23:11:20 2016
 Total Scan time:  2.410 Total Display time:  0.070

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com