Result of FASTA (ccds) for pF1KB7728
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB7728, 479 aa
  1>>>pF1KB7728 479 - 479 aa - 479 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 6.0982+/-0.00085; mu= 14.4233+/- 0.051
 mean_var=82.1166+/-16.179, 0's: 0 Z-trim(108.2): 17  B-trim: 3 in 1/50
 Lambda= 0.141533
 statistics sampled from 10072 (10086) to 10072 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.688), E-opt: 0.2 (0.31), width:  16
 Scan time:  3.200

The best scores are:                                      opt bits E(32554)
CCDS2134.1 TFCP2L1 gene_id:29842|Hs108|chr2        ( 479) 3257 674.7 5.7e-194
CCDS8808.1 TFCP2 gene_id:7024|Hs108|chr12          ( 502) 2414 502.6 3.9e-142
CCDS46788.1 UBP1 gene_id:7342|Hs108|chr3           ( 504) 1854 388.3  1e-107
CCDS2659.1 UBP1 gene_id:7342|Hs108|chr3            ( 540) 1403 296.2 5.7e-80
CCDS55827.1 TFCP2 gene_id:7024|Hs108|chr12         ( 450)  848 182.8 6.4e-46
CCDS33144.2 GRHL1 gene_id:29841|Hs108|chr2         ( 618)  366 84.5 3.6e-16
CCDS83312.1 GRHL2 gene_id:79977|Hs108|chr8         ( 609)  355 82.2 1.7e-15
CCDS34931.1 GRHL2 gene_id:79977|Hs108|chr8         ( 625)  355 82.2 1.7e-15
CCDS53284.1 GRHL3 gene_id:57822|Hs108|chr1         ( 556)  352 81.6 2.4e-15
CCDS44088.1 GRHL3 gene_id:57822|Hs108|chr1         ( 602)  352 81.6 2.5e-15
CCDS251.1 GRHL3 gene_id:57822|Hs108|chr1           ( 607)  352 81.6 2.5e-15
CCDS252.2 GRHL3 gene_id:57822|Hs108|chr1           ( 626)  352 81.6 2.6e-15


>>CCDS2134.1 TFCP2L1 gene_id:29842|Hs108|chr2             (479 aa)
 initn: 3257 init1: 3257 opt: 3257  Z-score: 3595.9  bits: 674.7 E(32554): 5.7e-194
Smith-Waterman score: 3257; 100.0% identity (100.0% similar) in 479 aa overlap (1-479:1-479)

               10        20        30        40        50        60
pF1KB7 MLFWHTQPEHYNQHNSGSYLRDVLALPIFKQEEPQLSPENEARLPPLQYVLCAATSPAVK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 MLFWHTQPEHYNQHNSGSYLRDVLALPIFKQEEPQLSPENEARLPPLQYVLCAATSPAVK
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB7 LHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVFHDRRLQYTEHQQLEGW
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 LHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVFHDRRLQYTEHQQLEGW
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB7 RWSRPGDRILDIDIPLSVGILDPRASPTQLNAVEFLWDPAKRASAFIQVHCISTEFTPRK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 RWSRPGDRILDIDIPLSVGILDPRASPTQLNAVEFLWDPAKRASAFIQVHCISTEFTPRK
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB7 HGGEKGVPFRVQIDTFKQNENGEYTEHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 HGGEKGVPFRVQIDTFKQNENGEYTEHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAQ
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB7 EKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGLGEGNASPTHPVEALPV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 EKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGLGEGNASPTHPVEALPV
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB7 GSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQICGPADGIRLFN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 GSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQICGPADGIRLFN
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB7 AIKGRNVRPKMTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAIFLEELTTLELIEKIAN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 AIKGRNVRPKMTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAIFLEELTTLELIEKIAN
              370       380       390       400       410       420

              430       440       450       460       470         
pF1KB7 LYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESNDGYHIILKCGL
       :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 LYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESNDGYHIILKCGL
              430       440       450       460       470         

>>CCDS8808.1 TFCP2 gene_id:7024|Hs108|chr12               (502 aa)
 initn: 2065 init1: 1475 opt: 2414  Z-score: 2665.3  bits: 502.6 E(32554): 3.9e-142
Smith-Waterman score: 2414; 74.6% identity (91.5% similar) in 469 aa overlap (16-476:35-502)

                              10         20        30        40    
pF1KB7                MLFWHTQPEHYNQHNSGSY-LRDVLALPIFKQEEPQLSPENEARL
                                     .:.: . :::::::::::: .: :.:: ..
CCDS88 LKLPLADEVIESGLVQDFDASLSGIGQELGAGAYSMSDVLALPIFKQEESSLPPDNENKI
           10        20        30        40        50        60    

           50        60        70        80        90       100    
pF1KB7 PPLQYVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVF
        :.:::::::::::::::.:::::::::::::::.:.:::::.. ..: : ::::.::::
CCDS88 LPFQYVLCAATSPAVKLHDETLTYLNQGQSYEIRMLDNRKLGELPEINGKLVKSIFRVVF
           70        80        90       100       110       120    

          110       120       130       140       150       160    
pF1KB7 HDRRLQYTEHQQLEGWRWSRPGDRILDIDIPLSVGILDPRASPTQLNAVEFLWDPAKRAS
       ::::::::::::::::::.::::::::::::.::::.::::.:::::.::::::::::.:
CCDS88 HDRRLQYTEHQQLEGWRWNRPGDRILDIDIPMSVGIIDPRANPTQLNTVEFLWDPAKRTS
          130       140       150       160       170       180    

          170       180       190       200       210       220    
pF1KB7 AFIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHLHSASCQIKVFKPKGAD
       .:::::::::::: :::::::::::::::::::.::::::::::::::::::::::::::
CCDS88 VFIQVHCISTEFTMRKHGGEKGVPFRVQIDTFKENENGEYTEHLHSASCQIKVFKPKGAD
          190       200       210       220       230       240    

          230       240       250       260       270       280    
pF1KB7 RKQKTDREKMEKRTAQEKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGL
       :::::::::::::: .:::::::::::::::::::::...: ::..:::..:.: .::.:
CCDS88 RKQKTDREKMEKRTPHEKEKYQPSYETTILTECSPWPEITY-VNNSPSPGFNSSHSSFSL
          250       260       270       280        290       300   

          290       300       310       320       330       340    
pF1KB7 GEGNASPTHPVEALPVGSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRD
       ::::.::.:  :  :  .:.:::... :.::::::::::: : :::..::::::::..::
CCDS88 GEGNGSPNHQPEPPPPVTDNLLPTTTPQEAQQWLHRNRFSTFTRLFTNFSGADLLKLTRD
           310       320       330       340       350       360   

          350       360       370            380       390         
pF1KB7 DLVQICGPADGIRLFNAIKGRNVRPKMTIYVCQEL-----EQNRVPLQQKRDGSGDSNLS
       :..::::::::::::::.::: :::..:::::::      .:..   ::..  .:::: .
CCDS88 DVIQICGPADGIRLFNALKGRMVRPRLTIYVCQESLQLREQQQQQQQQQQKHEDGDSNGT
           370       380       390       400       410       420   

       400       410       420       430       440       450       
pF1KB7 --VYHAIFLEELTTLELIEKIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESC
         :::::.:::::..:: ::::.:.:::: .: ..:.::::::::..:.::.::::.:.:
CCDS88 FFVYHAIYLEELTAVELTEKIAQLFSISPCQISQIYKQGPTGIHVLISDEMIQNFQEEAC
           430       440       450       460       470       480   

       460       470         
pF1KB7 FVLSTIKAESNDGYHIILKCGL
       :.:.:.:::.::.::::::   
CCDS88 FILDTMKAETNDSYHIILK   
           490       500     

>>CCDS46788.1 UBP1 gene_id:7342|Hs108|chr3                (504 aa)
 initn: 2156 init1: 1446 opt: 1854  Z-score: 2047.3  bits: 388.3 E(32554): 1e-107
Smith-Waterman score: 2176; 68.1% identity (89.2% similar) in 474 aa overlap (16-476:32-504)

                              10         20        30        40    
pF1KB7                MLFWHTQPEHYNQHNSGSY-LRDVLALPIFKQEEPQLSPENEARL
                                     .:.: . :::::::::::. .:  ..:.. 
CCDS46 AWVLKMDEVIESGLVHDFDASLSGIGQELGAGAYSMSDVLALPIFKQEDSSLPLDGETEH
              10        20        30        40        50        60 

           50        60        70        80        90       100    
pF1KB7 PPLQYVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVF
       ::.:::.:::::::::::.:::::::::::::::.:.:::.::. ..: : :::::::::
CCDS46 PPFQYVMCAATSPAVKLHDETLTYLNQGQSYEIRMLDNRKMGDMPEINGKLVKSIIRVVF
              70        80        90       100       110       120 

          110       120       130       140       150       160    
pF1KB7 HDRRLQYTEHQQLEGWRWSRPGDRILDIDIPLSVGILDPRASPTQLNAVEFLWDPAKRAS
       ::::::::::::::::.:.:::::.::.:::.::::.: :..:.::::::::::::::.:
CCDS46 HDRRLQYTEHQQLEGWKWNRPGDRLLDLDIPMSVGIIDTRTNPSQLNAVEFLWDPAKRTS
             130       140       150       160       170       180 

          170       180       190       200       210       220    
pF1KB7 AFIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHLHSASCQIKVFKPKGAD
       ::::::::::::::::::::::::::.:.::::::::::::.::::::::::::::::::
CCDS46 AFIQVHCISTEFTPRKHGGEKGVPFRIQVDTFKQNENGEYTDHLHSASCQIKVFKPKGAD
             190       200       210       220       230       240 

          230       240       250       260         270            
pF1KB7 RKQKTDREKMEKRTAQEKEKYQPSYETTILTECSPWPDV--AYQVNSAPSPSYN-GSP--
       :::::::::::::::.:::::::::.::::::::::::.  :: ::..:::. .  ::  
CCDS46 RKQKTDREKMEKRTAHEKEKYQPSYDTTILTECSPWPDAPTAY-VNNSPSPAPTFTSPQQ
             250       260       270       280        290       300

     280       290         300       310       320       330       
pF1KB7 NSFGLGEGNAS-PTHPVE-ALPVGSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGAD
       .. .. ..:.: :.:  . :  ...... :::.::..:::: .::::.. :::..:::::
CCDS46 STCSVPDSNSSSPNHQGDGASQTSGEQIQPSATIQETQQWLLKNRFSSYTRLFSNFSGAD
              310       320       330       340       350       360

       340       350       360       370       380        390      
pF1KB7 LLKMSRDDLVQICGPADGIRLFNAIKGRNVRPKMTIYVCQELEQNRV-PLQQKRDGSGDS
       :::....::::::: ::::::.:..:.:.:::..:::::.:  .. :   ::.  .:.. 
CCDS46 LLKLTKEDLVQICGAADGIRLYNSLKSRSVRPRLTIYVCREQPSSTVLQGQQQAASSASE
              370       380       390       400       410       420

            400       410       420       430       440       450  
pF1KB7 NLS----VYHAIFLEELTTLELIEKIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNF
       : :    :::::.:::. . :. .:.: ...:  ..:..::::::::::..::..:::::
CCDS46 NGSGAPYVYHAIYLEEMIASEVARKLALVFNIPLHQINQVYRQGPTGIHILVSDQMVQNF
              430       440       450       460       470       480

            460       470         
pF1KB7 QDESCFVLSTIKAESNDGYHIILKCGL
       ::::::..::.::::.:: :::::   
CCDS46 QDESCFLFSTVKAESSDGIHIILK   
              490       500       

>>CCDS2659.1 UBP1 gene_id:7342|Hs108|chr3                 (540 aa)
 initn: 2142 init1: 1385 opt: 1403  Z-score: 1549.1  bits: 296.2 E(32554): 5.7e-80
Smith-Waterman score: 2031; 62.9% identity (82.7% similar) in 498 aa overlap (16-464:32-528)

                              10         20        30        40    
pF1KB7                MLFWHTQPEHYNQHNSGSY-LRDVLALPIFKQEEPQLSPENEARL
                                     .:.: . :::::::::::. .:  ..:.. 
CCDS26 AWVLKMDEVIESGLVHDFDASLSGIGQELGAGAYSMSDVLALPIFKQEDSSLPLDGETEH
              10        20        30        40        50        60 

           50        60        70        80        90       100    
pF1KB7 PPLQYVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVF
       ::.:::.:::::::::::.:::::::::::::::.:.:::.::. ..: : :::::::::
CCDS26 PPFQYVMCAATSPAVKLHDETLTYLNQGQSYEIRMLDNRKMGDMPEINGKLVKSIIRVVF
              70        80        90       100       110       120 

          110       120       130       140       150       160    
pF1KB7 HDRRLQYTEHQQLEGWRWSRPGDRILDIDIPLSVGILDPRASPTQLNAVEFLWDPAKRAS
       ::::::::::::::::.:.:::::.::.:::.::::.: :..:.::::::::::::::.:
CCDS26 HDRRLQYTEHQQLEGWKWNRPGDRLLDLDIPMSVGIIDTRTNPSQLNAVEFLWDPAKRTS
             130       140       150       160       170       180 

          170       180       190       200       210       220    
pF1KB7 AFIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHLHSASCQIKVFKPKGAD
       ::::::::::::::::::::::::::.:.::::::::::::.::::::::::::::::::
CCDS26 AFIQVHCISTEFTPRKHGGEKGVPFRIQVDTFKQNENGEYTDHLHSASCQIKVFKPKGAD
             190       200       210       220       230       240 

          230       240       250                                  
pF1KB7 RKQKTDREKMEKRTAQEKEKYQPSYETTILTE----------------------------
       :::::::::::::::.:::::::::.::::::                            
CCDS26 RKQKTDREKMEKRTAHEKEKYQPSYDTTILTEMRLEPIIEDAVEHEQKKSSKRTLPADYG
             250       260       270       280       290       300 

                260         270          280       290         300 
pF1KB7 --------CSPWPDV--AYQVNSAPSPSYN-GSP--NSFGLGEGNAS-PTHPVE-ALPVG
               ::::::.  :: ::..:::. .  ::  .. .. ..:.: :.:  . :  ..
CCDS26 DSLAKRGSCSPWPDAPTAY-VNNSPSPAPTFTSPQQSTCSVPDSNSSSPNHQGDGASQTS
             310       320        330       340       350       360

             310       320       330       340       350       360 
pF1KB7 SDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQICGPADGIRLFNA
       .... :::.::..:::: .::::.. :::..::::::::....::::::: ::::::.:.
CCDS26 GEQIQPSATIQETQQWLLKNRFSSYTRLFSNFSGADLLKLTKEDLVQICGAADGIRLYNS
              370       380       390       400       410       420

             370       380        390           400       410      
pF1KB7 IKGRNVRPKMTIYVCQELEQNRV-PLQQKRDGSGDSNLS----VYHAIFLEELTTLELIE
       .:.:.:::..:::::.:  .. :   ::.  .:.. : :    :::::.:::. . :. .
CCDS26 LKSRSVRPRLTIYVCREQPSSTVLQGQQQAASSASENGSGAPYVYHAIYLEEMIASEVAR
              430       440       450       460       470       480

        420       430       440       450       460       470      
pF1KB7 KIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESNDGYHIILK
       :.: ...:  ..:..::::::::::..::..:::::::::::..::.:            
CCDS26 KLALVFNIPLHQINQVYRQGPTGIHILVSDQMVQNFQDESCFLFSTVKAESSDGIHIILK
              490       500       510       520       530       540

          
pF1KB7 CGL

>>CCDS55827.1 TFCP2 gene_id:7024|Hs108|chr12              (450 aa)
 initn: 1778 init1: 840 opt: 848  Z-score: 937.9  bits: 182.8 E(32554): 6.4e-46
Smith-Waterman score: 1948; 64.0% identity (80.6% similar) in 469 aa overlap (16-476:35-450)

                              10         20        30        40    
pF1KB7                MLFWHTQPEHYNQHNSGSY-LRDVLALPIFKQEEPQLSPENEARL
                                     .:.: . :::::::::::: .: :.:: ..
CCDS55 LKLPLADEVIESGLVQDFDASLSGIGQELGAGAYSMSDVLALPIFKQEESSLPPDNENKI
           10        20        30        40        50        60    

           50        60        70        80        90       100    
pF1KB7 PPLQYVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVF
        :.:::::::::::::::.:::::::::::::::.:.:::::.. ..: : ::::.::::
CCDS55 LPFQYVLCAATSPAVKLHDETLTYLNQGQSYEIRMLDNRKLGELPEINGKLVKSIFRVVF
           70        80        90       100       110       120    

          110       120       130       140       150       160    
pF1KB7 HDRRLQYTEHQQLEGWRWSRPGDRILDIDIPLSVGILDPRASPTQLNAVEFLWDPAKRAS
       ::::::::::::::::::.::::::::::::.::::.::::.:::::.::::::::::.:
CCDS55 HDRRLQYTEHQQLEGWRWNRPGDRILDIDIPMSVGIIDPRANPTQLNTVEFLWDPAKRTS
          130       140       150       160       170       180    

          170       180       190       200       210       220    
pF1KB7 AFIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHLHSASCQIKVFKPKGAD
       .:::                                                   :::::
CCDS55 VFIQ---------------------------------------------------PKGAD
                                                             190   

          230       240       250       260       270       280    
pF1KB7 RKQKTDREKMEKRTAQEKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGL
       :::::::::::::: .:::::::::::::::::::::...: ::..:::..:.: .::.:
CCDS55 RKQKTDREKMEKRTPHEKEKYQPSYETTILTECSPWPEITY-VNNSPSPGFNSSHSSFSL
           200       210       220       230        240       250  

          290       300       310       320       330       340    
pF1KB7 GEGNASPTHPVEALPVGSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRD
       ::::.::.:  :  :  .:.:::... :.::::::::::: : :::..::::::::..::
CCDS55 GEGNGSPNHQPEPPPPVTDNLLPTTTPQEAQQWLHRNRFSTFTRLFTNFSGADLLKLTRD
            260       270       280       290       300       310  

          350       360       370            380       390         
pF1KB7 DLVQICGPADGIRLFNAIKGRNVRPKMTIYVCQEL-----EQNRVPLQQKRDGSGDSNLS
       :..::::::::::::::.::: :::..:::::::      .:..   ::..  .:::: .
CCDS55 DVIQICGPADGIRLFNALKGRMVRPRLTIYVCQESLQLREQQQQQQQQQQKHEDGDSNGT
            320       330       340       350       360       370  

       400       410       420       430       440       450       
pF1KB7 --VYHAIFLEELTTLELIEKIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESC
         :::::.:::::..:: ::::.:.:::: .: ..:.::::::::..:.::.::::.:.:
CCDS55 FFVYHAIYLEELTAVELTEKIAQLFSISPCQISQIYKQGPTGIHVLISDEMIQNFQEEAC
            380       390       400       410       420       430  

       460       470         
pF1KB7 FVLSTIKAESNDGYHIILKCGL
       :.:.:.: :.::.::::::   
CCDS55 FILDTMK-ETNDSYHIILK   
             440       450   

>>CCDS33144.2 GRHL1 gene_id:29841|Hs108|chr2              (618 aa)
 initn: 231 init1: 107 opt: 366  Z-score: 403.9  bits: 84.5 E(32554): 3.6e-16
Smith-Waterman score: 383; 27.4% identity (55.5% similar) in 438 aa overlap (47-475:252-615)

         20        30        40        50        60        70      
pF1KB7 GSYLRDVLALPIFKQEEPQLSPENEARLPPLQYVLCAATSPAVKLHEETLTYLNQGQSYE
                                     ..:.: :. :   :  . :.::::.:: : 
CCDS33 QEVFFPSDLSLRMPGMNSEDYVFDSVSGNNFEYTLEASKSLRQKPGDSTMTYLNKGQFYP
             230       240       250       260       270       280 

         80        90       100       110       120            130 
pF1KB7 IRLLENRKLGDFQDLNTKYVKSIIRVVFHDRRLQYTEHQQLEGWR-W-SRPG---DRILD
       : : :  .   ..   .: :.:.: ::: . .   ....::. :. : ::     .: .:
CCDS33 ITLKEVSSSEGIHHPISK-VRSVIMVVFAEDK---SREDQLRHWKYWHSRQHTAKQRCID
             290        300       310          320       330       

              140       150       160       170       180       190
pF1KB7 I-DIPLSVGILDPRASPTQLNAVEFLWDPAKRASAFIQVHCISTEFTPRKHGGEKGVPFR
       : :   : . ..        ::. : ::   .:..::.:.:.::.:. .:  : ::.:. 
CCDS33 IADYKESFNTIS-NIEEIAYNAISFTWDINDEAKVFISVNCLSTDFSSQK--GVKGLPLN
       340        350       360       370       380         390    

              200       210       220       230       240          
pF1KB7 VQIDTFKQNENGEYTEHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAQE-KEKYQPSY
       .:.::.. :. .  .. .: : ::::::  :::.:: . ...:. :: ... :    ::.
CCDS33 IQVDTYSYNNRS--NKPVHRAYCQIKVFCDKGAERKIRDEERKQSKRKVSDVKVPLLPSH
          400         410       420       430       440       450  

     250       260        270       280       290       300        
pF1KB7 ETTILTECSPWPDVAYQ-VNSAPSPSYNGSPNSFGLGEGNASPTHPVEALPVGSDHLLPS
       .   .:  .:. :.  : :   :.  . .      : .:    ::   .::..:..:   
CCDS33 KRMDITVFKPFIDLDTQPVLFIPDVHFAN------LQRG----TH---VLPIASEELEGE
            460       470       480                    490         

      310       320       330       340       350       360        
pF1KB7 ASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQICGPADGIRLFNAIKGRNVR
       .:.      :.:. ..                 ..::..    :.  .       .:  .
CCDS33 GSV------LKRGPYG-----------------TEDDFA--VPPSTKL-------ARIEE
     500                              510         520              

      370        380       390       400       410       420       
pF1KB7 PK-MTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAIFLEELTTLELIEKIANLYSISPQ
       :: . .:: .: :.                  :. :..:.  .   :.: :.. :..  .
CCDS33 PKRVLLYVRKESEE------------------VFDALMLKTPSLKGLMEAISDKYDVPHD
       530       540                         550       560         

       430       440       450       460       470         
pF1KB7 HIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESNDGYHIILKCGL
       .: .....   :: : .....:.....:. : :.    :.. .:.. :    
CCDS33 KIGKIFKKCKKGILVNMDDNIVKHYSNEDTFQLQI--EEAGGSYKLTLTEI 
     570       580       590       600         610         

>>CCDS83312.1 GRHL2 gene_id:79977|Hs108|chr8              (609 aa)
 initn: 326 init1: 108 opt: 355  Z-score: 391.8  bits: 82.2 E(32554): 1.7e-15
Smith-Waterman score: 396; 28.9% identity (55.7% similar) in 436 aa overlap (47-475:232-606)

         20        30        40        50        60        70      
pF1KB7 GSYLRDVLALPIFKQEEPQLSPENEARLPPLQYVLCAATSPAVKLHEETLTYLNQGQSYE
                                     .::.: :. :   :  :  .::::.:: : 
CCDS83 ESFKDAATEKFRSASVGAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYA
             210       220       230       240       250       260 

         80        90       100       110       120            130 
pF1KB7 IRLLENRKLGDFQDLNTKYVKSIIRVVFHDRRLQYTEHQQLEGWR-W-SRPG---DRILD
       : : :.     :.   .: :.:.. ::: . .   .. .::. :. : ::     .:.::
CCDS83 ITLSETGDNKCFRHPISK-VRSVVMVVFSEDK---NRDEQLKYWKYWHSRQHTAKQRVLD
             270        280       290          300       310       

              140       150       160       170       180       190
pF1KB7 I-DIPLSVGILDPRASPTQLNAVEFLWDPAKRASAFIQVHCISTEFTPRKHGGEKGVPFR
       : :   : . .         ::: : ::  ..:. :: :.:.::.:. .:  : ::.:. 
CCDS83 IADYKESFNTIG-NIEEIAYNAVSFTWDVNEEAKIFITVNCLSTDFSSQK--GVKGLPLM
       320        330       340       350       360         370    

              200       210       220       230       240       250
pF1KB7 VQIDTFKQNENGEYTEHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAQEKEKYQPSYE
       .::::.. :. ..  . .: : ::::::  :::.:: . :.:. ..:   .: : : :  
CCDS83 IQIDTYSYNNRSN--KPIHRAYCQIKVFCDKGAERKIR-DEERKQNR---KKGKGQASQ-
          380         390       400       410           420        

              260       270       280       290       300       310
pF1KB7 TTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGLGEGNASPTHPVEALPVGSDHLLPSAS
           :.:          ::    : .:.  .. : .   :     ...:  . :  :   
CCDS83 ----TQC----------NS----SSDGKLAAIPLQK--KSDITYFKTMP--DLHSQPVLF
           430                     440         450         460     

              320       330       340       350       360       370
pF1KB7 IQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQICGPADGIRLFNAIKGRNVRPK
       : :..       :... :    . ..:  . . . ::.        :.:  .. ..  : 
CCDS83 IPDVH-------FANLQRTGQVYYNTDDEREGGSVLVK--------RMFRPME-EEFGPV
         470              480       490               500          

              380       390       400       410       420       430
pF1KB7 MTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAIFLEELTTLELIEKIANLYSISPQHIH
        .  . .:  . :: :  ... . :    :. :..:.  :.  :.: :.. :..  ..: 
CCDS83 PSKQMKEEGTK-RVLLYVRKE-TDD----VFDALMLKSPTVKGLMEAISEKYGLPVEKIA
     510       520         530           540       550       560   

              440       450       460        470         
pF1KB7 RVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESN-DGYHIILKCGL
       ..:...  :: : ...........:. :.:.    ::  .:... :    
CCDS83 KLYKKSKKGILVNMDDNIIEHYSNEDTFILN---MESMVEGFKVTLMEI 
           570       580       590          600          

>>CCDS34931.1 GRHL2 gene_id:79977|Hs108|chr8              (625 aa)
 initn: 353 init1: 108 opt: 355  Z-score: 391.6  bits: 82.2 E(32554): 1.7e-15
Smith-Waterman score: 396; 28.9% identity (55.7% similar) in 436 aa overlap (47-475:248-622)

         20        30        40        50        60        70      
pF1KB7 GSYLRDVLALPIFKQEEPQLSPENEARLPPLQYVLCAATSPAVKLHEETLTYLNQGQSYE
                                     .::.: :. :   :  :  .::::.:: : 
CCDS34 ESFKDAATEKFRSASVGAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYA
       220       230       240       250       260       270       

         80        90       100       110       120            130 
pF1KB7 IRLLENRKLGDFQDLNTKYVKSIIRVVFHDRRLQYTEHQQLEGWR-W-SRPG---DRILD
       : : :.     :.   .: :.:.. ::: . .   .. .::. :. : ::     .:.::
CCDS34 ITLSETGDNKCFRHPISK-VRSVVMVVFSEDK---NRDEQLKYWKYWHSRQHTAKQRVLD
       280       290        300          310       320       330   

              140       150       160       170       180       190
pF1KB7 I-DIPLSVGILDPRASPTQLNAVEFLWDPAKRASAFIQVHCISTEFTPRKHGGEKGVPFR
       : :   : . .         ::: : ::  ..:. :: :.:.::.:. .:  : ::.:. 
CCDS34 IADYKESFNTIG-NIEEIAYNAVSFTWDVNEEAKIFITVNCLSTDFSSQK--GVKGLPLM
           340        350       360       370       380         390

              200       210       220       230       240       250
pF1KB7 VQIDTFKQNENGEYTEHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAQEKEKYQPSYE
       .::::.. :. ..  . .: : ::::::  :::.:: . :.:. ..:   .: : : :  
CCDS34 IQIDTYSYNNRSN--KPIHRAYCQIKVFCDKGAERKIR-DEERKQNR---KKGKGQASQ-
              400         410       420        430          440    

              260       270       280       290       300       310
pF1KB7 TTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGLGEGNASPTHPVEALPVGSDHLLPSAS
           :.:          ::    : .:.  .. : .   :     ...:  . :  :   
CCDS34 ----TQC----------NS----SSDGKLAAIPLQK--KSDITYFKTMP--DLHSQPVLF
                             450       460         470         480 

              320       330       340       350       360       370
pF1KB7 IQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQICGPADGIRLFNAIKGRNVRPK
       : :..       :... :    . ..:  . . . ::.        :.:  .. ..  : 
CCDS34 IPDVH-------FANLQRTGQVYYNTDDEREGGSVLVK--------RMFRPME-EEFGPV
                    490       500       510                520     

              380       390       400       410       420       430
pF1KB7 MTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAIFLEELTTLELIEKIANLYSISPQHIH
        .  . .:  . :: :  ... . :    :. :..:.  :.  :.: :.. :..  ..: 
CCDS34 PSKQMKEEGTK-RVLLYVRKE-TDD----VFDALMLKSPTVKGLMEAISEKYGLPVEKIA
         530        540            550       560       570         

              440       450       460        470         
pF1KB7 RVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESN-DGYHIILKCGL
       ..:...  :: : ...........:. :.:.    ::  .:... :    
CCDS34 KLYKKSKKGILVNMDDNIIEHYSNEDTFILN---MESMVEGFKVTLMEI 
     580       590       600       610          620      

>>CCDS53284.1 GRHL3 gene_id:57822|Hs108|chr1              (556 aa)
 initn: 189 init1:  97 opt: 352  Z-score: 389.1  bits: 81.6 E(32554): 2.4e-15
Smith-Waterman score: 381; 25.6% identity (55.3% similar) in 465 aa overlap (21-476:157-554)

                         10        20         30        40         
pF1KB7           MLFWHTQPEHYNQHNSGSYLRDVLALP-IFKQEEPQLSPENEARLPP-LQ
                                     .. . .: :.:       ::.   :   ..
CCDS53 NGSLNSLFESIHGVPPTQRWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFE
        130       140       150       160       170       180      

       50        60        70        80        90       100        
pF1KB7 YVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVFHDRR
       :.: .  .  .:  :  ..:::.:: : . : ..   :    :... :::.. ::: ...
CCDS53 YTLGSPKAIHIKSGESPMAYLNKGQFYPVTL-RTPAGGKGLALSSNKVKSVVMVVFDNEK
        190       200       210        220       230       240     

      110       120            130        140       150       160  
pF1KB7 LQYTEHQQLEGWR-W-SR-PG--DRILDI-DIPLSVGILDPRASPTQLNAVEFLWDPAKR
       .     .::. :. : :: :   .:..:. :   . . .. .   .  ::. :.:.  ..
CCDS53 VPV---EQLRFWKHWHSRQPTAKQRVIDVADCKENFNTVE-HIEEVAYNALSFVWNVNEE
            250       260       270       280        290       300 

            170       180       190       200        210       220 
pF1KB7 ASAFIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHL-HSASCQIKVFKPK
       :..:: :.:.::.:. .:  : ::::. .::::.   . :  ::.: : : ::::.:  :
CCDS53 AKVFIGVNCLSTDFSSQK--GVKGVPLNLQIDTY---DCGLGTERLVHRAVCQIKIFCDK
             310         320       330          340       350      

             230       240       250       260       270       280 
pF1KB7 GADRKQKTDREKMEKRTAQEKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNS
       ::.::.. :..:. .: ..  .. . . .  .:.                  .. :. ..
CCDS53 GAERKMRDDERKQFRRKVKCPDSSNSGVKGCLLS------------------GFRGNETT
        360       370       380       390                          

             290       300       310       320       330       340 
pF1KB7 FGLGEGNASPTHPVEALPVGSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKM
       .        :   .:. ::    ..:.         .:   ::.. :  ..  .:   . 
CCDS53 Y------LRPETDLETPPV---LFIPN---------VH---FSSLQRSGGAAPSAGPSSS
            400       410                      420       430       

             350       360       370       380       390       400 
pF1KB7 SRDDLVQICGPADGIRLFNAIKGRNVRPKMTIYVCQELEQNRVPLQQKRDGSGDSNLSVY
       .:  : . :.:    . :. . .....         : . .:: :  .:.     .  :.
CCDS53 NRLPLKRTCSPFT--EEFEPLPSKQAK---------EGDLQRVLLYVRRE-----TEEVF
       440       450         460                470            480 

             410       420       430       440       450       460 
pF1KB7 HAIFLEELTTLELIEKIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLS
        :..:.      : . :.. :..  ..:..::..   :: : ..:...:.....  :.:.
CCDS53 DALMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLLD
             490       500       510       520       530       540 

             470         
pF1KB7 TIKAESNDGYHIILKCGL
          .: .   .::::   
CCDS53 M--GELDGKIQIILKEL 
               550       

>>CCDS44088.1 GRHL3 gene_id:57822|Hs108|chr1              (602 aa)
 initn: 189 init1:  97 opt: 352  Z-score: 388.6  bits: 81.6 E(32554): 2.5e-15
Smith-Waterman score: 381; 25.6% identity (55.3% similar) in 465 aa overlap (21-476:203-600)

                         10        20         30        40         
pF1KB7           MLFWHTQPEHYNQHNSGSYLRDVLALP-IFKQEEPQLSPENEARLPP-LQ
                                     .. . .: :.:       ::.   :   ..
CCDS44 NGSLNSLFESIHGVPPTQRWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFE
            180       190       200       210       220       230  

       50        60        70        80        90       100        
pF1KB7 YVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVFHDRR
       :.: .  .  .:  :  ..:::.:: : . : ..   :    :... :::.. ::: ...
CCDS44 YTLGSPKAIHIKSGESPMAYLNKGQFYPVTL-RTPAGGKGLALSSNKVKSVVMVVFDNEK
            240       250       260        270       280       290 

      110       120            130        140       150       160  
pF1KB7 LQYTEHQQLEGWR-W-SR-PG--DRILDI-DIPLSVGILDPRASPTQLNAVEFLWDPAKR
       .     .::. :. : :: :   .:..:. :   . . .. .   .  ::. :.:.  ..
CCDS44 VPV---EQLRFWKHWHSRQPTAKQRVIDVADCKENFNTVE-HIEEVAYNALSFVWNVNEE
                300       310       320        330       340       

            170       180       190       200        210       220 
pF1KB7 ASAFIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHL-HSASCQIKVFKPK
       :..:: :.:.::.:. .:  : ::::. .::::.   . :  ::.: : : ::::.:  :
CCDS44 AKVFIGVNCLSTDFSSQK--GVKGVPLNLQIDTY---DCGLGTERLVHRAVCQIKIFCDK
       350       360         370          380       390       400  

             230       240       250       260       270       280 
pF1KB7 GADRKQKTDREKMEKRTAQEKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNS
       ::.::.. :..:. .: ..  .. . . .  .:.                  .. :. ..
CCDS44 GAERKMRDDERKQFRRKVKCPDSSNSGVKGCLLS------------------GFRGNETT
            410       420       430                         440    

             290       300       310       320       330       340 
pF1KB7 FGLGEGNASPTHPVEALPVGSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKM
       .        :   .:. ::    ..:.         .:   ::.. :  ..  .:   . 
CCDS44 Y------LRPETDLETPPV---LFIPN---------VH---FSSLQRSGGAAPSAGPSSS
                450          460                   470       480   

             350       360       370       380       390       400 
pF1KB7 SRDDLVQICGPADGIRLFNAIKGRNVRPKMTIYVCQELEQNRVPLQQKRDGSGDSNLSVY
       .:  : . :.:    . :. . .....         : . .:: :  .:.     .  :.
CCDS44 NRLPLKRTCSPFT--EEFEPLPSKQAK---------EGDLQRVLLYVRRE-----TEEVF
           490         500                510       520            

             410       420       430       440       450       460 
pF1KB7 HAIFLEELTTLELIEKIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLS
        :..:.      : . :.. :..  ..:..::..   :: : ..:...:.....  :.:.
CCDS44 DALMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLLD
       530       540       550       560       570       580       

             470         
pF1KB7 TIKAESNDGYHIILKCGL
          .: .   .::::   
CCDS44 M--GELDGKIQIILKEL 
         590       600   




479 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Mon Nov  7 04:46:22 2016 done: Mon Nov  7 04:46:23 2016
 Total Scan time:  3.200 Total Display time:  0.090

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com