Result of FASTA (ccds) for pF1KA0808
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KA0808, 526 aa
  1>>>pF1KA0808 526 - 526 aa - 526 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 9.9648+/-0.000882; mu= -1.2273+/- 0.053
 mean_var=256.4546+/-51.148, 0's: 0 Z-trim(115.7): 25  B-trim: 0 in 0/51
 Lambda= 0.080088
 statistics sampled from 16196 (16220) to 16196 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.795), E-opt: 0.2 (0.498), width:  16
 Scan time:  3.950

The best scores are:                                      opt bits E(32554)
CCDS34897.1 TOX gene_id:9760|Hs108|chr8            ( 526) 3660 435.7 6.1e-122
CCDS54009.1 TOX3 gene_id:27324|Hs108|chr16         ( 576) 1320 165.4 1.6e-40
CCDS54008.1 TOX3 gene_id:27324|Hs108|chr16         ( 571) 1259 158.3 2.1e-38
CCDS32043.1 TOX4 gene_id:9878|Hs108|chr14          ( 621)  926 119.9 8.7e-27
CCDS46603.1 TOX2 gene_id:84969|Hs108|chr20         ( 506)  906 117.5 3.7e-26
CCDS13324.1 TOX2 gene_id:84969|Hs108|chr20         ( 464)  885 115.1 1.8e-25
CCDS42875.1 TOX2 gene_id:84969|Hs108|chr20         ( 488)  722 96.2 8.9e-20


>>CCDS34897.1 TOX gene_id:9760|Hs108|chr8                 (526 aa)
 initn: 3660 init1: 3660 opt: 3660  Z-score: 2302.7  bits: 435.7 E(32554): 6.1e-122
Smith-Waterman score: 3660; 100.0% identity (100.0% similar) in 526 aa overlap (1-526:1-526)

               10        20        30        40        50        60
pF1KA0 MDVRFYPPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MDVRFYPPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPG
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KA0 PSLESEDFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMNHNGLLPFHPQNMDLPEITV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PSLESEDFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMNHNGLLPFHPQNMDLPEITV
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KA0 SNMLGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQLT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 SNMLGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQLT
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KA0 TINQSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRPA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 TINQSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRPA
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KA0 SDMGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 SDMGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWD
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KA0 GLGEEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQPPQLINSKPSVFH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 GLGEEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQPPQLINSKPSVFH
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KA0 GPSQAHSALYLSSHYHQQPGMNPHLTAMHPSLPRNIAPKPNNQMPVTVSIANMAVSPPPP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 GPSQAHSALYLSSHYHQQPGMNPHLTAMHPSLPRNIAPKPNNQMPVTVSIANMAVSPPPP
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KA0 LQISPPLHQHLNMQQHQPLTMQQPLGNQLPMQVQSALHSPTMQQGFTLQPDYQTIINPTS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LQISPPLHQHLNMQQHQPLTMQQPLGNQLPMQVQSALHSPTMQQGFTLQPDYQTIINPTS
              430       440       450       460       470       480

              490       500       510       520      
pF1KA0 TAAQVVTQAMEYVRSGCRNPPPQPVDWNNDYCSSGGMQRDKALYLT
       ::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 TAAQVVTQAMEYVRSGCRNPPPQPVDWNNDYCSSGGMQRDKALYLT
              490       500       510       520      

>>CCDS54009.1 TOX3 gene_id:27324|Hs108|chr16              (576 aa)
 initn: 924 init1: 641 opt: 1320  Z-score: 840.9  bits: 165.4 E(32554): 1.6e-40
Smith-Waterman score: 1328; 49.2% identity (69.6% similar) in 494 aa overlap (1-464:1-476)

               10        20        30        40        50          
pF1KA0 MDVRFYPPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPAS-QSYP
       :::::::     ::: :   :  . ::  :  .:: ..: ::.:.: .. .  :: :.. 
CCDS54 MDVRFYP-----AAAGDPASLDFAQCLGYYGYSKFGNNNNYMNMAEANNAFFAASEQTFH
                    10        20        30        40        50     

      60        70        80        90       100          110      
pF1KA0 GPSLESEDFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMNHNG--LLP-FHPQNMDLP
        ::: .:.:.:::::::   : .:  . .:   ...:  :.  .:  . : : ::..:::
CCDS54 TPSLGDEEFEIPPITPPPESDPAL-GMPDVLLPFQALSDPLPSQGSEFTPQFPPQSLDLP
          60        70         80        90       100       110    

        120        130       140       150       160       170     
pF1KA0 EITVS-NMLGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMP
        ::.: :.. :::.: :... .  :  . . .:: . :..  ::   . .:  .. :.::
CCDS54 SITISRNLVEQDGVLHSSGLHM--DQSHTQVSQYRQDPSLI-MRSIVHMTDAARS-GVMP
          120       130         140       150        160        170

         180       190       200       210       220       230     
pF1KA0 HGQLTTINQSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGG
        .:::::::::::::::::.::...::.:::::.:::::::::::..:...:....  : 
CCDS54 PAQLTTINQSQLSAQLGLNLGGASMPHTSPSPPASKSATPSPSSSINEEDADEANRAIG-
              180       190       200       210       220          

         240       250       260       270       280       290     
pF1KA0 EKRPASDMGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIV
       ::: : : ::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 EKRAAPDSGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIV
     230       240       250       260       270       280         

         300       310       320       330       340       350     
pF1KA0 ASMWDGLGEEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQPPQLINSK
       :::::.::::::::::.::::::::::: :::::::::::. .: ....: .  :   ..
CCDS54 ASMWDSLGEEQKQVYKRKTEAAKKEYLKALAAYRASLVSKAAAESAEAQTIRSVQQTLAS
     290       300       310       320       330       340         

         360       370       380       390       400               
pF1KA0 PSVFHGPSQAHSALYLSSHYHQQPGMNPHLTAMHPSLPRNIAPKP------NNQMPVTVS
        ..        :.: :..   :.  ..    ... ::::.:::::       ::. ..:.
CCDS54 TNLT-------SSLLLNTPLSQHGTVSASPQTLQQSLPRSIAPKPLTMRLPMNQIVTSVT
     350              360       370       380       390       400  

     410                       420         430        440       450
pF1KA0 IA-NMA--VSPP-------------PPLQISPPLH--QH-LNMQQHQPLTMQQPLGNQLP
       :: ::   .. :             :  :.:: ..  :: ...::.:   .::    :  
CCDS54 IAANMPSNIGAPLISSMGTTMVGSAPSTQVSPSVQTQQHQMQLQQQQQQQQQQMQQMQQQ
            410       420       430       440       450       460  

              460       470       480       490       500       510
pF1KA0 MQVQSALHSPTMQQGFTLQPDYQTIINPTSTAAQVVTQAMEYVRSGCRNPPPQPVDWNND
       .  :  .:.  .::                                              
CCDS54 QLQQHQMHQQIQQQMQQQHFQHHMQQHLQQQQQHLQQQINQQQLQQQLQQRLQLQQLQHM
            470       480       490       500       510       520  

>>CCDS54008.1 TOX3 gene_id:27324|Hs108|chr16              (571 aa)
 initn: 925 init1: 641 opt: 1259  Z-score: 802.9  bits: 158.3 E(32554): 2.1e-38
Smith-Waterman score: 1267; 49.3% identity (71.1% similar) in 460 aa overlap (34-464:25-471)

            10        20        30        40        50        60   
pF1KA0 RFYPPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPGPSL
                                     :: ..: ::.:.: .. .  ::...  :::
CCDS54       MKCQPRSGARRIEERLHYLITTYLKFGNNNNYMNMAEANNAFFAASETFHTPSL
                     10        20        30        40        50    

            70        80        90       100          110       120
pF1KA0 ESEDFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMNHNG--LLP-FHPQNMDLPEITV
        .:.:.:::::::   : .:  . .:   ...:  :.  .:  . : : ::..::: ::.
CCDS54 GDEEFEIPPITPPPESDPAL-GMPDVLLPFQALSDPLPSQGSEFTPQFPPQSLDLPSITI
           60        70         80        90       100       110   

               130       140       150       160       170         
pF1KA0 S-NMLGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQL
       : :.. :::.: :... .  :  . . .:: . :..  ::   . .:  .. :.:: .::
CCDS54 SRNLVEQDGVLHSSGLHM--DQSHTQVSQYRQDPSLI-MRSIVHMTDAARS-GVMPPAQL
           120       130         140        150       160          

     180       190       200       210       220       230         
pF1KA0 TTINQSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRP
       :::::::::::::::.::...::.:::::.:::::::::::..:...:....  : ::: 
CCDS54 TTINQSQLSAQLGLNLGGASMPHTSPSPPASKSATPSPSSSINEEDADEANRAIG-EKRA
     170       180       190       200       210       220         

     240       250       260       270       280       290         
pF1KA0 ASDMGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMW
       : : ::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 APDSGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMW
      230       240       250       260       270       280        

     300       310       320       330       340       350         
pF1KA0 DGLGEEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQPPQLINSKPSVF
       :.::::::::::.::::::::::: :::::::::::. .: ....: .  :   .. .. 
CCDS54 DSLGEEQKQVYKRKTEAAKKEYLKALAAYRASLVSKAAAESAEAQTIRSVQQTLASTNLT
      290       300       310       320       330       340        

     360       370       380       390       400             410   
pF1KA0 HGPSQAHSALYLSSHYHQQPGMNPHLTAMHPSLPRNIAPKP------NNQMPVTVSIA-N
              :.: :..   :.  ..    ... ::::.:::::       ::. ..:.:: :
CCDS54 -------SSLLLNTPLSQHGTVSASPQTLQQSLPRSIAPKPLTMRLPMNQIVTSVTIAAN
             350       360       370       380       390       400 

                           420         430        440       450    
pF1KA0 MA--VSPP-------------PPLQISPPLH--QH-LNMQQHQPLTMQQPLGNQLPMQVQ
       :   .. :             :  :.:: ..  :: ...::.:   .::    :  .  :
CCDS54 MPSNIGAPLISSMGTTMVGSAPSTQVSPSVQTQQHQMQLQQQQQQQQQQMQQMQQQQLQQ
             410       420       430       440       450       460 

          460       470       480       490       500       510    
pF1KA0 SALHSPTMQQGFTLQPDYQTIINPTSTAAQVVTQAMEYVRSGCRNPPPQPVDWNNDYCSS
         .:.  .::                                                  
CCDS54 HQMHQQIQQQMQQQHFQHHMQQHLQQQQQHLQQQINQQQLQQQLQQRLQLQQLQHMQHQS
             470       480       490       500       510       520 

>>CCDS32043.1 TOX4 gene_id:9878|Hs108|chr14               (621 aa)
 initn: 1060 init1: 748 opt: 926  Z-score: 594.4  bits: 119.9 E(32554): 8.7e-27
Smith-Waterman score: 962; 38.8% identity (64.6% similar) in 492 aa overlap (37-508:6-483)

         10        20        30        40        50        60      
pF1KA0 PPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPGPSLESE
                                     :.. :...: ::. .. .....  ::: .:
CCDS32                          MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDE
                                        10        20        30     

         70        80        90       100          110       120   
pF1KA0 DFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMN-HNGLLP--FHPQNMDLPEITVSNM
       .:.::::.  :  : ::. ...: . . .:  : . ..: .   .  :..:.:   . ..
CCDS32 EFEIPPISLDS--DPSLA-VSDVVGHFDDLADPSSSQDGSFSAQYGVQTLDMPVGMTHGL
          40          50         60        70        80        90  

           130       140       150       160       170       180   
pF1KA0 LGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQLTTIN
       . : : :::.....  :. .  :::::..: ..   :    .:. .  :.: :.:::::.
CCDS32 MEQGGGLLSGGLTM--DLDHSIGTQYSANPPVTIDVPM---TDMTS--GLMGHSQLTTID
            100         110       120          130         140     

           190       200       210       220       230       240   
pF1KA0 QSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRPASDM
       ::.::.::::..::...   . ::    :.::::.::.:::  .:  .   ..:  . . 
CCDS32 QSELSSQLGLSLGGGTILPPAQSPEDRLSTTPSPTSSLHEDGVEDFRRQLPSQKTVVVEA
         150       160       170       180       190       200     

           250       260       270       280       290       300   
pF1KA0 GKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDGLG
       ::: :.:::.:::::::::::::::::::::::::::::::::::::::::::::::.::
CCDS32 GKKQKAPKKRKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLG
         210       220       230       240       250       260     

           310       320       330       340             350       
pF1KA0 EEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDV------KTSQPPQLI-----
       ::::::::.::::::::::: ::::. .   ..  : :..      .: .:: .      
CCDS32 EEQKQVYKRKTEAAKKEYLKALAAYKDNQECQATVETVELDPAPPSQTPSPPPMATVDPA
         270       280       290       300       310       320     

            360       370          380       390       400         
pF1KA0 NSKPSVFHGPSQAHSALY---LSSHYHQQPGMNPHLTAMHPSLPRNIAPKPNNQMPVTVS
       .  :. .. :. . : .    :::.  .: . .   .. .:.. . :  :      .:.:
CCDS32 SPAPASIEPPALSPSIVVNSTLSSYVANQASSG---AGGQPNITKLIITKQMLPSSITMS
         330       340       350          360       370       380  

     410       420        430       440       450       460        
pF1KA0 IANMAVSPPPPLQISPPLHQ-HLNMQQHQPLTMQQPLGNQLPMQVQSALHSPTMQ-QGFT
        ..:..  :  .  :  :.  . .    ::  . : .  .. . . .:  . .::     
CCDS32 QGGMVTVIPATVVTSRGLQLGQTSTATIQPSQQAQIVTRSVLQAAAAAAAAASMQLPPPR
            390       400       410       420       430       440  

       470        480       490       500       510       520      
pF1KA0 LQPD-YQTIINPTSTAAQVVTQAMEYVRSGCRNPPPQPVDWNNDYCSSGGMQRDKALYLT
       :::   : . .:  :  ::.   .    .. ..:::: :  :                  
CCDS32 LQPPPLQQMPQPP-TQQQVTILQQPPPLQAMQQPPPQKVRINLQQQPPPLQIKSVPLPTL
            450        460       470       480       490       500 

CCDS32 KMQTTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEMITDVVPEVESPSQMDVELVSG
             510       520       530       540       550       560 

>>CCDS46603.1 TOX2 gene_id:84969|Hs108|chr20              (506 aa)
 initn: 1110 init1: 629 opt: 906  Z-score: 583.2  bits: 117.5 E(32554): 3.7e-26
Smith-Waterman score: 1389; 46.1% identity (69.5% similar) in 544 aa overlap (1-526:1-506)

               10        20        30        40        50        60
pF1KA0 MDVRFYPPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPG
       ::::.::     .: : :   : .  :: :. .::::.. :..:.. . . . .::.: :
CCDS46 MDVRLYPSAPAVGARPGAEPAGLAH-LDYYHGGKFDGDSAYVGMSDGNPELLSTSQTYNG
               10        20         30        40        50         

               70        80        90       100        110         
pF1KA0 PSLESEDFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMNHNGLLP-FHPQNMDLPEIT
        : ..::..:::::::.::. ::.::.. :..:::::: .. ::::: .  : :::: : 
CCDS46 QSENNEDYEIPPITPPNLPEPSLLHLGDHEASYHSLCHGLTPNGLLPAYSYQAMDLPAIM
      60        70        80        90       100       110         

     120       130       140       150       160       170         
pF1KA0 VSNMLGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQL
       :::::.::. :::..   .: :      :   : ..::.   :.:. .  .:.:.  ...
CCDS46 VSNMLAQDSHLLSGQ---LPTI------QEMVHSEVAAY-DSGRPGPLLGRPAMLA-SHM
     120       130                140        150       160         

     180       190       200       210       220       230         
pF1KA0 TTINQSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRP
       ....:::: .:.:.    :.. :.:::::::::::::::::..:.:..   ::.: ::::
CCDS46 SALSQSQLISQMGIR---SSIAHSSPSPPGSKSATPSPSSSTQEEESEVHFKISG-EKRP
      170       180          190       200       210       220     

     240       250       260       270       280       290         
pF1KA0 ASDMGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMW
       ..: ::: :.:::::::::::::::::::::::::::::::::::.::::.:::::::::
CCDS46 SADPGKKAKNPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPSATFGDVSKIVASMW
          230       240       250       260       270       280    

     300       310       320       330       340          350      
pF1KA0 DGLGEEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQ--PP-QLINSKP
       :.:::::::.::.::::::::::: ::::::::::::  .  ..:..:  :: ...  : 
CCDS46 DSLGEEQKQAYKRKTEAAKKEYLKALAAYRASLVSKSSPDQGETKSTQANPPAKMLPPKQ
          290       300       310       320       330       340    

        360       370       380       390       400       410      
pF1KA0 SVFHGPSQAHSALYLSSHYHQQPGMNPHLTAMHPSLPRNIAPKPNNQMPVTVSIANMAVS
        ..  :. : : :  :.    . : .:       :: :... :  . .:      ....:
CCDS46 PMYAMPGLA-SFLTPSDLQAFRSGASP------ASLARTLGSK--SLLP------GLSAS
          350        360       370             380                 

        420         430       440       450       460       470    
pF1KA0 PPPP--LQISPPLHQHLNMQQHQPLTMQQPLGNQLPMQVQSALHSPTMQQGFTLQPDYQT
       ::::  . .:: :::.:..  :   .. .:     :.... : . :..   ..::   : 
CCDS46 PPPPPSFPLSPTLHQQLSLPPHAQGALLSP-----PVSMSPAPQPPVLPTPMALQ--VQL
     390       400       410            420       430         440  

          480       490         500          510              520  
pF1KA0 IINPTSTAAQVVTQAMEYVRSG--CRNPPPQPV---DWNNDY----C---SSGGMQRDKA
        ..:.  . :   .  :.  :.  :   : .:.   ::...:    :   . . . :::.
CCDS46 AMSPSPPGPQDFPHISEFPSSSGSCSPGPSNPTSSGDWDSSYPSGECGISTCSLLPRDKS
            450       460       470       480       490       500  

           
pF1KA0 LYLT
       ::::
CCDS46 LYLT
           

>>CCDS13324.1 TOX2 gene_id:84969|Hs108|chr20              (464 aa)
 initn: 1052 init1: 629 opt: 885  Z-score: 570.6  bits: 115.1 E(32554): 1.8e-25
Smith-Waterman score: 1291; 46.5% identity (70.1% similar) in 501 aa overlap (44-526:1-464)

            20        30        40        50        60        70   
pF1KA0 AAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPGPSLESEDFNIPPI
                                     :.. . . . .::.: : : ..::..::::
CCDS13                               MSDGNPELLSTSQTYNGQSENNEDYEIPPI
                                             10        20        30

            80        90       100        110       120       130  
pF1KA0 TPPSLPDHSLVHLNEVESGYHSLCHPMNHNGLLP-FHPQNMDLPEITVSNMLGQDGTLLS
       :::.::. ::.::.. :..:::::: .. ::::: .  : :::: : :::::.::. :::
CCDS13 TPPNLPEPSLLHLGDHEASYHSLCHGLTPNGLLPAYSYQAMDLPAIMVSNMLAQDSHLLS
               40        50        60        70        80        90

            140       150       160       170       180       190  
pF1KA0 NSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQLTTINQSQLSAQLG
       ..   .: :      :   : ..::.   :.:. .  .:.:.  .......:::: .:.:
CCDS13 GQ---LPTI------QEMVHSEVAAY-DSGRPGPLLGRPAMLA-SHMSALSQSQLISQMG
                       100        110       120        130         

            200       210       220       230       240       250  
pF1KA0 LNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRPASDMGKKPKTPKK
       .    :.. :.:::::::::::::::::..:.:..   ::.: ::::..: ::: :.:::
CCDS13 IR---SSIAHSSPSPPGSKSATPSPSSSTQEEESEVHFKISG-EKRPSADPGKKAKNPKK
     140          150       160       170        180       190     

            260       270       280       290       300       310  
pF1KA0 KKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDGLGEEQKQVYKK
       ::::::::::::::::::::::::::::::::.::::.::::::::::.:::::::.::.
CCDS13 KKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPSATFGDVSKIVASMWDSLGEEQKQAYKR
         200       210       220       230       240       250     

            320       330       340          350       360         
pF1KA0 KTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQ--PP-QLINSKPSVFHGPSQAHSAL
       ::::::::::: ::::::::::::  .  ..:..:  :: ...  :  ..  :. : : :
CCDS13 KTEAAKKEYLKALAAYRASLVSKSSPDQGETKSTQANPPAKMLPPKQPMYAMPGLA-SFL
         260       270       280       290       300       310     

     370       380       390       400       410       420         
pF1KA0 YLSSHYHQQPGMNPHLTAMHPSLPRNIAPKPNNQMPVTVSIANMAVSPPPP--LQISPPL
         :.    . : .:       :: :... :  . .:      ....:::::  . .:: :
CCDS13 TPSDLQAFRSGASP------ASLARTLGSK--SLLP------GLSASPPPPPSFPLSPTL
          320             330         340             350       360

       430       440       450       460       470       480       
pF1KA0 HQHLNMQQHQPLTMQQPLGNQLPMQVQSALHSPTMQQGFTLQPDYQTIINPTSTAAQVVT
       ::.:..  :   .. .:     :.... : . :..   ..::   :  ..:.  . :   
CCDS13 HQQLSLPPHAQGALLSP-----PVSMSPAPQPPVLPTPMALQ--VQLAMSPSPPGPQDFP
              370            380       390         400       410   

       490         500          510              520      
pF1KA0 QAMEYVRSG--CRNPPPQPV---DWNNDY----C---SSGGMQRDKALYLT
       .  :.  :.  :   : .:.   ::...:    :   . . . :::.::::
CCDS13 HISEFPSSSGSCSPGPSNPTSSGDWDSSYPSGECGISTCSLLPRDKSLYLT
           420       430       440       450       460    

>>CCDS42875.1 TOX2 gene_id:84969|Hs108|chr20              (488 aa)
 initn: 934 init1: 470 opt: 722  Z-score: 468.5  bits: 96.2 E(32554): 8.9e-20
Smith-Waterman score: 1145; 41.3% identity (65.5% similar) in 516 aa overlap (26-526:34-488)

                    10        20        30        40        50     
pF1KA0      MDVRFYPPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPAS
                                     :.   . .::::.. :..:.. . . . .:
CCDS42 TRTEAVAGAFSRCLGFCGMRLGLLLLARHWCIAGVFPQKFDGDSAYVGMSDGNPELLSTS
            10        20        30        40        50        60   

          60        70        80        90       100        110    
pF1KA0 QSYPGPSLESEDFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMNHNGLLP-FHPQNMD
       :.: : : ..::..:::::::.::. ::.::.. :..:::::: .. ::::: .  : ::
CCDS42 QTYNGQSENNEDYEIPPITPPNLPEPSLLHLGDHEASYHSLCHGLTPNGLLPAYSYQAMD
            70        80        90       100       110       120   

          120       130       140       150       160       170    
pF1KA0 LPEITVSNMLGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMM
       :: : :::::.::. :::..   .: :      :   : ..::.   :.:. .  .:.:.
CCDS42 LPAIMVSNMLAQDSHLLSGQ---LPTI------QEMVHSEVAAY-DSGRPGPLLGRPAML
           130       140                150        160       170   

          180       190       200       210       220       230    
pF1KA0 PHGQLTTINQSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKING
         .......:::: .:.:.    :.. :.:::::::::::::::::..:.:..   ::.:
CCDS42 A-SHMSALSQSQLISQMGIR---SSIAHSSPSPPGSKSATPSPSSSTQEEESEVHFKISG
            180       190          200       210       220         

          240       250       260       270       280       290    
pF1KA0 GEKRPASDMGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKI
        ::::..: ::: :.:::::::::::::::::::::::::::::::::::.::::.::::
CCDS42 -EKRPSADPGKKAKNPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPSATFGDVSKI
      230       240       250       260       270       280        

          300       310       320       330       340       350    
pF1KA0 VASMWDGLGEEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQPPQLINS
       ::::::.:::::::                         : . .:  ..... : ...  
CCDS42 VASMWDSLGEEQKQS------------------------SPDQGETKSTQANPPAKMLPP
      290       300                               310       320    

          360       370       380       390       400       410    
pF1KA0 KPSVFHGPSQAHSALYLSSHYHQQPGMNPHLTAMHPSLPRNIAPKPNNQMPVTVSIANMA
       :  ..  :. : : :  :.    . : .:       :: :... :  . .:      ...
CCDS42 KQPMYAMPGLA-SFLTPSDLQAFRSGASP------ASLARTLGSK--SLLP------GLS
          330        340       350             360                 

          420         430       440       450       460       470  
pF1KA0 VSPPPP--LQISPPLHQHLNMQQHQPLTMQQPLGNQLPMQVQSALHSPTMQQGFTLQPDY
       .:::::  . .:: :::.:..  :   .. .:     :.... : . :..   ..::   
CCDS42 ASPPPPPSFPLSPTLHQQLSLPPHAQGALLSP-----PVSMSPAPQPPVLPTPMALQ--V
     370       380       390       400            410       420    

            480       490         500          510              520
pF1KA0 QTIINPTSTAAQVVTQAMEYVRSG--CRNPPPQPV---DWNNDY----C---SSGGMQRD
       :  ..:.  . :   .  :.  :.  :   : .:.   ::...:    :   . . . ::
CCDS42 QLAMSPSPPGPQDFPHISEFPSSSGSCSPGPSNPTSSGDWDSSYPSGECGISTCSLLPRD
            430       440       450       460       470       480  

             
pF1KA0 KALYLT
       :.::::
CCDS42 KSLYLT
             




526 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Wed Nov  2 19:45:50 2016 done: Wed Nov  2 19:45:51 2016
 Total Scan time:  3.950 Total Display time:  0.070

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com