Result of FASTA (ccds) for pF1KA0737
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KA0737, 621 aa
  1>>>pF1KA0737 621 - 621 aa - 621 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 11.5256+/-0.00104; mu= -6.8788+/- 0.062
 mean_var=391.3651+/-80.877, 0's: 0 Z-trim(115.4): 33  B-trim: 432 in 1/55
 Lambda= 0.064831
 statistics sampled from 15891 (15921) to 15891 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.772), E-opt: 0.2 (0.489), width:  16
 Scan time:  4.580

The best scores are:                                      opt bits E(32554)
CCDS32043.1 TOX4 gene_id:9878|Hs108|chr14          ( 621) 4134 400.8 2.8e-111
CCDS54008.1 TOX3 gene_id:27324|Hs108|chr16         ( 571) 1181 124.6 3.7e-28
CCDS54009.1 TOX3 gene_id:27324|Hs108|chr16         ( 576) 1169 123.4 8.1e-28
CCDS34897.1 TOX gene_id:9760|Hs108|chr8            ( 526)  926 100.7 5.2e-21
CCDS46603.1 TOX2 gene_id:84969|Hs108|chr20         ( 506)  749 84.1 4.9e-16
CCDS13324.1 TOX2 gene_id:84969|Hs108|chr20         ( 464)  734 82.7 1.2e-15
CCDS42875.1 TOX2 gene_id:84969|Hs108|chr20         ( 488)  618 71.8 2.3e-12


>>CCDS32043.1 TOX4 gene_id:9878|Hs108|chr14               (621 aa)
 initn: 4134 init1: 4134 opt: 4134  Z-score: 2111.3  bits: 400.8 E(32554): 2.8e-111
Smith-Waterman score: 4134; 100.0% identity (100.0% similar) in 621 aa overlap (1-621:1-621)

               10        20        30        40        50        60
pF1KA0 MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDEEFEIPPISLDSDPSLAVSDVVGHFD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDEEFEIPPISLDSDPSLAVSDVVGHFD
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KA0 DLADPSSSQDGSFSAQYGVQTLDMPVGMTHGLMEQGGGLLSGGLTMDLDHSIGTQYSANP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 DLADPSSSQDGSFSAQYGVQTLDMPVGMTHGLMEQGGGLLSGGLTMDLDHSIGTQYSANP
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KA0 PVTIDVPMTDMTSGLMGHSQLTTIDQSELSSQLGLSLGGGTILPPAQSPEDRLSTTPSPT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 PVTIDVPMTDMTSGLMGHSQLTTIDQSELSSQLGLSLGGGTILPPAQSPEDRLSTTPSPT
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KA0 SSLHEDGVEDFRRQLPSQKTVVVEAGKKQKAPKKRKKKDPNEPQKPVSAYALFFRDTQAA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 SSLHEDGVEDFRRQLPSQKTVVVEAGKKQKAPKKRKKKDPNEPQKPVSAYALFFRDTQAA
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KA0 IKGQNPNATFGEVSKIVASMWDSLGEEQKQVYKRKTEAAKKEYLKALAAYKDNQECQATV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 IKGQNPNATFGEVSKIVASMWDSLGEEQKQVYKRKTEAAKKEYLKALAAYKDNQECQATV
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KA0 ETVELDPAPPSQTPSPPPMATVDPASPAPASIEPPALSPSIVVNSTLSSYVANQASSGAG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 ETVELDPAPPSQTPSPPPMATVDPASPAPASIEPPALSPSIVVNSTLSSYVANQASSGAG
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KA0 GQPNITKLIITKQMLPSSITMSQGGMVTVIPATVVTSRGLQLGQTSTATIQPSQQAQIVT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 GQPNITKLIITKQMLPSSITMSQGGMVTVIPATVVTSRGLQLGQTSTATIQPSQQAQIVT
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KA0 RSVLQAAAAAAAAASMQLPPPRLQPPPLQQMPQPPTQQQVTILQQPPPLQAMQQPPPQKV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 RSVLQAAAAAAAAASMQLPPPRLQPPPLQQMPQPPTQQQVTILQQPPPLQAMQQPPPQKV
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KA0 RINLQQQPPPLQIKSVPLPTLKMQTTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 RINLQQQPPPLQIKSVPLPTLKMQTTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEM
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KA0 ITDVVPEVESPSQMDVELVSGSPVALSPQPRCVRSGCENPPIVSKDWDNEYCSNECVVKH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 ITDVVPEVESPSQMDVELVSGSPVALSPQPRCVRSGCENPPIVSKDWDNEYCSNECVVKH
              550       560       570       580       590       600

              610       620 
pF1KA0 CRDVFLAWVASRNSNTVVFVK
       :::::::::::::::::::::
CCDS32 CRDVFLAWVASRNSNTVVFVK
              610       620 

>>CCDS54008.1 TOX3 gene_id:27324|Hs108|chr16              (571 aa)
 initn: 915 init1: 566 opt: 1181  Z-score: 619.1  bits: 124.6 E(32554): 3.7e-28
Smith-Waterman score: 1208; 42.7% identity (67.0% similar) in 548 aa overlap (5-536:27-549)

                                     10        20        30        
pF1KA0                       MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDEEFE
                                 :.:.::....  .. :....::::::::::::::
CCDS54 MKCQPRSGARRIEERLHYLITTYLKFGNNNNYMNMAEANNAFFAASETFHTPSLGDEEFE
               10        20        30        40        50        60

       40          50        60        70        80         90     
pF1KA0 IPPISL--DSDPSLAVSDVVGHFDDLADPSSSQDGSFSAQYGVQTLDMP-VGMTHGLMEQ
       ::::.   .:::.:.. ::.  :. :.::  :: . :. :.  :.::.: . ....:.::
CCDS54 IPPITPPPESDPALGMPDVLLPFQALSDPLPSQGSEFTPQFPPQSLDLPSITISRNLVEQ
               70        80        90       100       110       120

         100       110       120         130        140       150  
pF1KA0 GGGLLSGGLTMDLDHSIGTQYSANPPVTID--VPMTDMT-SGLMGHSQLTTIDQSELSSQ
        : : :.:: :: .:.  .::  .: . .   : ::: . ::.:  .:::::.::.::.:
CCDS54 DGVLHSSGLHMDQSHTQVSQYRQDPSLIMRSIVHMTDAARSGVMPPAQLTTINQSQLSAQ
              130       140       150       160       170       180

            160       170       180       190       200       210  
pF1KA0 LGLSLGGGTILPPAQSPEDRLSTTPSPTSSLHEDGVEDFRRQLPSQKTVVVEAGKKQKAP
       :::.:::...   . ::    :.::::.::..:. ...  : . ..: .. ..::: :.:
CCDS54 LGLNLGGASMPHTSPSPPASKSATPSPSSSINEEDADEANRAI-GEKRAAPDSGKKPKTP
              190       200       210       220        230         

            220       230       240       250       260       270  
pF1KA0 KKRKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLGEEQKQVY
       ::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 KKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLGEEQKQVY
     240       250       260       270       280       290         

            280       290       300       310       320       330  
pF1KA0 KRKTEAAKKEYLKALAAYKDNQECQATVETVELDPAPPSQTPSPPPMATVDPASPAPASI
       ::::::::::::::::::. .   .:..:..:      .::     . .:.       ..
CCDS54 KRKTEAAKKEYLKALAAYRASLVSKAAAESAE------AQT-----IRSVQQ------TL
     300       310       320       330                  340        

            340       350       360       370               380    
pF1KA0 EPPALSPSIVVNSTLSSYVANQASSGAGGQPNITKLIITKQM---LP-----SSITMSQG
           :. :...:. ::.. . .::  .  : .. . :  : .   ::     .:.:.. .
CCDS54 ASTNLTSSLLLNTPLSQHGTVSASPQTL-QQSLPRSIAPKPLTMRLPMNQIVTSVTIA-A
            350       360       370        380       390        400

          390       400        410       420       430       440   
pF1KA0 GMVTVIPATVVTSRGLQL-GQTSTATIQPSQQAQIVTRSVLQAAAAAAAAASMQLPPPRL
       .: . : : ...: :  . :.. .. ..:: :.:   .  ::          .:.   .:
CCDS54 NMPSNIGAPLISSMGTTMVGSAPSTQVSPSVQTQQ-HQMQLQQQQQQQQQQMQQMQQQQL
              410       420       430        440       450         

           450       460       470       480       490       500   
pF1KA0 QPPPLQQMPQPPTQQQVTILQQPPPLQAMQQPPPQKVRINLQQQPPPLQIKSVPLPTLK-
       :   ..:. :   :::    ..   :: .::   :.  :: ::    :: . . :  :. 
CCDS54 QQHQMHQQIQQQMQQQHFQHHMQQHLQQQQQHLQQQ--INQQQLQQQLQ-QRLQLQQLQH
     460       470       480       490         500        510      

            510       520       530       540       550       560  
pF1KA0 MQTTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEMITDVVPEVESPSQMDVELVSGS
       ::    :   . ::   . .::   .. .:.: .                          
CCDS54 MQHQSQPSPRQHSPVASQITSP-IPAIGSPQPASQQHQSQIQSQTQTQVLSQVSIF    
        520       530        540       550       560       570     

            570       580       590       600       610       620 
pF1KA0 PVALSPQPRCVRSGCENPPIVSKDWDNEYCSNECVVKHCRDVFLAWVASRNSNTVVFVK

>>CCDS54009.1 TOX3 gene_id:27324|Hs108|chr16              (576 aa)
 initn: 872 init1: 566 opt: 1169  Z-score: 612.9  bits: 123.4 E(32554): 8.1e-28
Smith-Waterman score: 1196; 42.6% identity (66.8% similar) in 549 aa overlap (5-536:31-554)

                                         10        20         30   
pF1KA0                           MEFPGGNDNYLTITGPSHPFLSGAE-TFHTPSLG
                                     :.:.::....  .. :....: ::::::::
CCDS54 MDVRFYPAAAGDPASLDFAQCLGYYGYSKFGNNNNYMNMAEANNAFFAASEQTFHTPSLG
               10        20        30        40        50        60

            40          50        60        70        80         90
pF1KA0 DEEFEIPPISL--DSDPSLAVSDVVGHFDDLADPSSSQDGSFSAQYGVQTLDMP-VGMTH
       :::::::::.   .:::.:.. ::.  :. :.::  :: . :. :.  :.::.: . ...
CCDS54 DEEFEIPPITPPPESDPALGMPDVLLPFQALSDPLPSQGSEFTPQFPPQSLDLPSITISR
               70        80        90       100       110       120

              100       110       120         130        140       
pF1KA0 GLMEQGGGLLSGGLTMDLDHSIGTQYSANPPVTID--VPMTDMT-SGLMGHSQLTTIDQS
       .:.:: : : :.:: :: .:.  .::  .: . .   : ::: . ::.:  .:::::.::
CCDS54 NLVEQDGVLHSSGLHMDQSHTQVSQYRQDPSLIMRSIVHMTDAARSGVMPPAQLTTINQS
              130       140       150       160       170       180

       150       160       170       180       190       200       
pF1KA0 ELSSQLGLSLGGGTILPPAQSPEDRLSTTPSPTSSLHEDGVEDFRRQLPSQKTVVVEAGK
       .::.::::.:::...   . ::    :.::::.::..:. ...  : . ..: .. ..::
CCDS54 QLSAQLGLNLGGASMPHTSPSPPASKSATPSPSSSINEEDADEANRAI-GEKRAAPDSGK
              190       200       210       220        230         

       210       220       230       240       250       260       
pF1KA0 KQKAPKKRKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLGEE
       : :.:::.::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 KPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLGEE
     240       250       260       270       280       290         

       270       280       290       300       310       320       
pF1KA0 QKQVYKRKTEAAKKEYLKALAAYKDNQECQATVETVELDPAPPSQTPSPPPMATVDPASP
       :::::::::::::::::::::::. .   .:..:..:      .::     . .:.    
CCDS54 QKQVYKRKTEAAKKEYLKALAAYRASLVSKAAAESAE------AQT-----IRSVQQ---
     300       310       320       330                  340        

       330       340       350       360       370                 
pF1KA0 APASIEPPALSPSIVVNSTLSSYVANQASSGAGGQPNITKLIITKQM---LP-----SSI
          ..    :. :...:. ::.. . .::  .  : .. . :  : .   ::     .:.
CCDS54 ---TLASTNLTSSLLLNTPLSQHGTVSASPQTL-QQSLPRSIAPKPLTMRLPMNQIVTSV
            350       360       370        380       390       400 

     380       390       400        410       420       430        
pF1KA0 TMSQGGMVTVIPATVVTSRGLQL-GQTSTATIQPSQQAQIVTRSVLQAAAAAAAAASMQL
       :.. ..: . : : ...: :  . :.. .. ..:: :.:   .  ::          .:.
CCDS54 TIA-ANMPSNIGAPLISSMGTTMVGSAPSTQVSPSVQTQQ-HQMQLQQQQQQQQQQMQQM
              410       420       430       440        450         

      440       450       460       470       480       490        
pF1KA0 PPPRLQPPPLQQMPQPPTQQQVTILQQPPPLQAMQQPPPQKVRINLQQQPPPLQIKSVPL
          .::   ..:. :   :::    ..   :: .::   :.  :: ::    :: . . :
CCDS54 QQQQLQQHQMHQQIQQQMQQQHFQHHMQQHLQQQQQHLQQQ--INQQQLQQQLQ-QRLQL
     460       470       480       490       500         510       

      500        510       520       530       540       550       
pF1KA0 PTLK-MQTTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEMITDVVPEVESPSQMDVE
         :. ::    :   . ::   . .::   .. .:.: .                     
CCDS54 QQLQHMQHQSQPSPRQHSPVASQITSP-IPAIGSPQPASQQHQSQIQSQTQTQVLSQVSI
        520       530       540        550       560       570     

       560       570       580       590       600       610       
pF1KA0 LVSGSPVALSPQPRCVRSGCENPPIVSKDWDNEYCSNECVVKHCRDVFLAWVASRNSNTV
                                                                   
CCDS54 F                                                           
                                                                   

>>CCDS34897.1 TOX gene_id:9760|Hs108|chr8                 (526 aa)
 initn: 1060 init1: 748 opt: 926  Z-score: 490.6  bits: 100.7 E(32554): 5.2e-21
Smith-Waterman score: 989; 36.5% identity (59.3% similar) in 600 aa overlap (6-594:37-514)

                                        10        20        30     
pF1KA0                          MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDE
                                     :.. :...: ::. .. .....  ::: .:
CCDS34 PPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPGPSLESE
         10        20        30        40        50        60      

          40          50         60        70        80        90  
pF1KA0 EFEIPPISLDSDP--SLA-VSDVVGHFDDLADPSSSQDGSFSAQYGVQTLDMPVGMTHGL
       .:.::::.  : :  ::. ...: . . .:  : . ..: .   .  :..:.:   . ..
CCDS34 DFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMN-HNGLL--PFHPQNMDLPEITVSNM
         70        80        90       100          110       120   

            100         110       120          130         140     
pF1KA0 MEQGGGLLSGGLTM--DLDHSIGTQYSANPPVTIDVPM---TDMTS--GLMGHSQLTTID
       . : : :::.....  :. .  :::::..: ..   :    .:. .  :.: :.:::::.
CCDS34 LGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQLTTIN
           130       140       150       160       170       180   

         150       160       170       180       190       200     
pF1KA0 QSELSSQLGLSLGGGTILPPAQSPEDRLSTTPSPTSSLHEDGVEDFRRQLPSQKTVVVEA
       ::.::.::::..::...   . ::    :.::::.::.:::  .:  .   ..:  . . 
CCDS34 QSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRPASDM
           190       200       210       220       230       240   

         210       220       230       240       250       260     
pF1KA0 GKKQKAPKKRKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLG
       ::: :.:::.:::::::::::::::::::::::::::::::::::::::::::::::.::
CCDS34 GKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDGLG
           250       260       270       280       290       300   

         270       280       290       300       310       320     
pF1KA0 EEQKQVYKRKTEAAKKEYLKALAAYKDNQECQATVETVELDPAPPSQTPSPPPMATVDPA
       ::::::::.::::::::::: ::::. .   ..  : :..      .: .:: .      
CCDS34 EEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDV------KTSQPPQLI-----
           310       320       330       340             350       

         330       340       350       360       370       380     
pF1KA0 SPAPASIEPPALSPSIVVNSTLSSYVANQASSGAGGQPNITKLIITKQMLPSSITMSQGG
       .  :. .. :. . : .    :::.  .:     : .:..:       : ::        
CCDS34 NSKPSVFHGPSQAHSALY---LSSHYHQQP----GMNPHLT------AMHPS--------
            360       370              380             390         

         390       400       410       420       430       440     
pF1KA0 MVTVIPATVVTSRGLQLGQTSTATIQPSQQAQIVTRSVLQAAAAAAAAASMQLPPPRLQP
           .: ...               .:..:   :: :.          :.: . ::    
CCDS34 ----LPRNIAP--------------KPNNQMP-VTVSI----------ANMAVSPP----
                               400        410                      

         450       460       470       480       490        500    
pF1KA0 PPLQQMPQPPTQQQVTILQQPPPLQAMQQPPPQKVRINLQQQPPPLQIKS-VPLPTLKMQ
       ::::   .:: .:... .::  :: .::::  ...         :.:..: .  ::... 
CCDS34 PPLQI--SPPLHQHLN-MQQHQPL-TMQQPLGNQL---------PMQVQSALHSPTMQQG
      420         430         440                450       460     

          510       520       530       540       550       560    
pF1KA0 TTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEMITDVVPEVESPSQMDVELVSGSPV
        ::               .:. .:.  :.  :  ...:...  :                
CCDS34 FTL---------------QPDYQTIINPTS-TAAQVVTQAMEYV----------------
                        470       480        490                   

          570       580       590       600       610       620 
pF1KA0 ALSPQPRCVRSGCENPPIVSKDWDNEYCSNECVVKHCRDVFLAWVASRNSNTVVFVK
                ::::.:::    ::.:.:::.                           
CCDS34 ---------RSGCRNPPPQPVDWNNDYCSSGGMQRDKALYLT               
                    500       510       520                     

>>CCDS46603.1 TOX2 gene_id:84969|Hs108|chr20              (506 aa)
 initn: 699 init1: 528 opt: 749  Z-score: 401.4  bits: 84.1 E(32554): 4.9e-16
Smith-Waterman score: 811; 36.1% identity (61.8% similar) in 477 aa overlap (6-477:36-471)

                                        10        20        30     
pF1KA0                          MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDE
                                     :.. :. ..  .  .:: ..:..  : ..:
CCDS46 YPSAPAVGARPGAEPAGLAHLDYYHGGKFDGDSAYVGMSDGNPELLSTSQTYNGQSENNE
          10        20        30        40        50        60     

          40          50         60        70        80        90  
pF1KA0 EFEIPPISLDS--DPSLA-VSDVVGHFDDLADPSSSQDGSFSAQYGVQTLDMPVGMTHGL
       ..:::::.  .  .:::  ..:  . . .:   . . .: . : :. :..:.:. :. ..
CCDS46 DYEIPPITPPNLPEPSLLHLGDHEASYHSLCH-GLTPNGLLPA-YSYQAMDLPAIMVSNM
          70        80        90        100        110       120   

            100         110       120       130       140       150
pF1KA0 MEQGGGLLSGGLT--MDLDHSIGTQYSANPPVTIDVPMTDMTSGLMGHSQLTTIDQSELS
       . : . :::: :   ... ::  . :... :     :.    . : .:  .....::.: 
CCDS46 LAQDSHLLSGQLPTIQEMVHSEVAAYDSGRPG----PLLGRPAMLASH--MSALSQSQLI
           130       140       150           160         170       

              160       170       180       190       200       210
pF1KA0 SQLGLSLGGGTILPPAQSPEDRLSTTPSPTSSLHEDGVEDFRRQLPSQKTVVVEAGKKQK
       ::.:.    ..:   . ::    :.::::.:: .:.  :  . .. ..:   .. ::: :
CCDS46 SQMGIR---SSIAHSSPSPPGSKSATPSPSSSTQEEESE-VHFKISGEKRPSADPGKKAK
       180          190       200       210        220       230   

              220       230       240       250       260       270
pF1KA0 APKKRKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLGEEQKQ
        :::.:::::::::::::::::::::::::::::::.::::.::::::::::::::::::
CCDS46 NPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPSATFGDVSKIVASMWDSLGEEQKQ
           240       250       260       270       280       290   

              280       290       300       310       320       330
pF1KA0 VYKRKTEAAKKEYLKALAAYKDNQECQATVETVELDPAPPSQTPSPPPMATVDPASPAPA
       .:::::::::::::::::::. .   ...      : .  ..: . ::   . : .:  :
CCDS46 AYKRKTEAAKKEYLKALAAYRASLVSKSSP-----DQGETKSTQANPPAKMLPPKQPMYA
           300       310       320            330       340        

              340       350       360       370       380       390
pF1KA0 SIEPPALSPSIVVNSTLSSYVANQASSGAGGQPNITKLIITKQMLPSSITMSQGGMVTVI
           :.:. :... : :...      :::.   .... . .:..::        :. .  
CCDS46 M---PGLA-SFLTPSDLQAF-----RSGAS-PASLARTLGSKSLLP--------GLSASP
         350        360             370       380               390

              400       410       420       430       440       450
pF1KA0 PATVVTSRGLQLGQTSTATIQPSQQAQIVTRSVLQAAAAAAAAASMQLPPPRLQPPPLQQ
       :     :  :.    .  .. :  :. ...  : .. :    .    :: :      : .
CCDS46 PPP--PSFPLSPTLHQQLSLPPHAQGALLSPPVSMSPAPQPPV----LPTPMALQVQLAM
                400       410       420       430           440    

              460       470       480       490       500       510
pF1KA0 MPQPPTQQQVTILQQPPPLQAMQQPPPQKVRINLQQQPPPLQIKSVPLPTLKMQTTLVPP
        :.::  :.   ... :  ..  .: :                                 
CCDS46 SPSPPGPQDFPHISEFPSSSGSCSPGPSNPTSSGDWDSSYPSGECGISTCSLLPRDKSLY
          450       460       470       480       490       500    

>>CCDS13324.1 TOX2 gene_id:84969|Hs108|chr20              (464 aa)
 initn: 699 init1: 528 opt: 734  Z-score: 394.3  bits: 82.7 E(32554): 1.2e-15
Smith-Waterman score: 796; 36.9% identity (61.3% similar) in 463 aa overlap (20-477:8-429)

               10        20        30        40          50        
pF1KA0 MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDEEFEIPPISLDS--DPSLA-VSDVVG
                          .:: ..:..  : ..:..:::::.  .  .:::  ..:  .
CCDS13             MSDGNPELLSTSQTYNGQSENNEDYEIPPITPPNLPEPSLLHLGDHEA
                           10        20        30        40        

        60        70        80        90       100         110     
pF1KA0 HFDDLADPSSSQDGSFSAQYGVQTLDMPVGMTHGLMEQGGGLLSGGLT--MDLDHSIGTQ
        . .:   . . .: . : :. :..:.:. :. ... : . :::: :   ... ::  . 
CCDS13 SYHSLCH-GLTPNGLLPA-YSYQAMDLPAIMVSNMLAQDSHLLSGQLPTIQEMVHSEVAA
       50         60         70        80        90       100      

         120       130       140       150       160       170     
pF1KA0 YSANPPVTIDVPMTDMTSGLMGHSQLTTIDQSELSSQLGLSLGGGTILPPAQSPEDRLST
       :... :     :.    . : .:  .....::.: ::.:.    ..:   . ::    :.
CCDS13 YDSGRP----GPLLGRPAMLASH--MSALSQSQLISQMGIR---SSIAHSSPSPPGSKSA
        110           120         130       140          150       

         180       190       200       210       220       230     
pF1KA0 TPSPTSSLHEDGVEDFRRQLPSQKTVVVEAGKKQKAPKKRKKKDPNEPQKPVSAYALFFR
       ::::.:: .:.  :  . .. ..:   .. ::: : :::.::::::::::::::::::::
CCDS13 TPSPSSSTQEEESE-VHFKISGEKRPSADPGKKAKNPKKKKKKDPNEPQKPVSAYALFFR
       160       170        180       190       200       210      

         240       250       260       270       280       290     
pF1KA0 DTQAAIKGQNPNATFGEVSKIVASMWDSLGEEQKQVYKRKTEAAKKEYLKALAAYKDNQE
       :::::::::::.::::.::::::::::::::::::.:::::::::::::::::::.    
CCDS13 DTQAAIKGQNPSATFGDVSKIVASMWDSLGEEQKQAYKRKTEAAKKEYLKALAAYR----
        220       230       240       250       260       270      

         300       310       320       330       340       350     
pF1KA0 CQATVETVELDPAPPSQTPSPPPMATVDPASPAPASIEPPALSPSIVVNSTLSSYVANQA
         . :     : .  ..: . ::   . : .:  :    :.:. :... : :...     
CCDS13 -ASLVSKSSPDQGETKSTQANPPAKMLPPKQPMYAM---PGLA-SFLTPSDLQAF-----
             280       290       300          310        320       

         360       370       380       390       400       410     
pF1KA0 SSGAGGQPNITKLIITKQMLPSSITMSQGGMVTVIPATVVTSRGLQLGQTSTATIQPSQQ
        :::.   .... . .:..::        :. .  :       .  : :    .. :  :
CCDS13 RSGAS-PASLARTLGSKSLLP--------GLSASPPPPPSFPLSPTLHQQ--LSLPPHAQ
             330       340               350       360         370 

         420       430       440       450       460       470     
pF1KA0 AQIVTRSVLQAAAAAAAAASMQLPPPRLQPPPLQQMPQPPTQQQVTILQQPPPLQAMQQP
       . ...  : .. :    .    :: :      : . :.::  :.   ... :  ..  .:
CCDS13 GALLSPPVSMSPAPQPPV----LPTPMALQVQLAMSPSPPGPQDFPHISEFPSSSGSCSP
             380           390       400       410       420       

         480       490       500       510       520       530     
pF1KA0 PPQKVRINLQQQPPPLQIKSVPLPTLKMQTTLVPPTVESSPERPMNNSPEAHTVEAPSPE
        :                                                          
CCDS13 GPSNPTSSGDWDSSYPSGECGISTCSLLPRDKSLYLT                       
       430       440       450       460                           

>>CCDS42875.1 TOX2 gene_id:84969|Hs108|chr20              (488 aa)
 initn: 583 init1: 412 opt: 618  Z-score: 335.4  bits: 71.8 E(32554): 2.3e-12
Smith-Waterman score: 649; 32.9% identity (57.1% similar) in 483 aa overlap (3-477:39-453)

                                              10        20         
pF1KA0                             MEFP---GGNDNYLTITGPSHPFLSGAETFHT
                                     ::    :.. :. ..  .  .:: ..:.. 
CCDS42 VAGAFSRCLGFCGMRLGLLLLARHWCIAGVFPQKFDGDSAYVGMSDGNPELLSTSQTYNG
       10        20        30        40        50        60        

      30        40          50         60        70        80      
pF1KA0 PSLGDEEFEIPPISLDS--DPSLA-VSDVVGHFDDLADPSSSQDGSFSAQYGVQTLDMPV
        : ..:..:::::.  .  .:::  ..:  . . .:   . . .: . : :. :..:.:.
CCDS42 QSENNEDYEIPPITPPNLPEPSLLHLGDHEASYHSLCH-GLTPNGLLPA-YSYQAMDLPA
       70        80        90       100        110        120      

         90       100         110       120       130       140    
pF1KA0 GMTHGLMEQGGGLLSGGLT--MDLDHSIGTQYSANPPVTIDVPMTDMTSGLMGHSQLTTI
        :. ... : . :::: :   ... ::  . :... :     :.    . : .:  ....
CCDS42 IMVSNMLAQDSHLLSGQLPTIQEMVHSEVAAYDSGRPG----PLLGRPAMLASH--MSAL
        130       140       150       160           170         180

          150       160       170       180       190       200    
pF1KA0 DQSELSSQLGLSLGGGTILPPAQSPEDRLSTTPSPTSSLHEDGVEDFRRQLPSQKTVVVE
       .::.: ::.:.    ..:   . ::    :.::::.:: .:.  :  . .. ..:   ..
CCDS42 SQSQLISQMGIR---SSIAHSSPSPPGSKSATPSPSSSTQEEESE-VHFKISGEKRPSAD
              190          200       210       220        230      

          210       220       230       240       250       260    
pF1KA0 AGKKQKAPKKRKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSL
        ::: : :::.:::::::::::::::::::::::::::::::.::::.::::::::::::
CCDS42 PGKKAKNPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPSATFGDVSKIVASMWDSL
        240       250       260       270       280       290      

          270       280       290       300       310       320    
pF1KA0 GEEQKQVYKRKTEAAKKEYLKALAAYKDNQECQATVETVELDPAPPSQTPSPPPMATVDP
       ::::::                  .  :. : ..:    . .: : .. :   ::     
CCDS42 GEEQKQ------------------SSPDQGETKST----QANP-PAKMLPPKQPMY----
        300                         310            320             

          330       340       350       360       370       380    
pF1KA0 ASPAPASIEPPALSPSIVVNSTLSSYVANQASSGAGGQPNITKLIITKQMLPSSITMSQG
       : :. ::.    :.::      :...      :::.   .... . .:..::        
CCDS42 AMPGLASF----LTPS-----DLQAF-----RSGAS-PASLARTLGSKSLLP--------
     330           340                 350        360              

          390       400       410       420       430       440    
pF1KA0 GMVTVIPATVVTSRGLQLGQTSTATIQPSQQAQIVTRSVLQAAAAAAAAASMQLPPPRLQ
       :. .  :     :  :.    .  .. :  :. ...  : .. :    .    :: :   
CCDS42 GLSASPPPP--PSFPLSPTLHQQLSLPPHAQGALLSPPVSMSPAPQPPV----LPTPMAL
        370         380       390       400       410           420

          450       460       470       480       490       500    
pF1KA0 PPPLQQMPQPPTQQQVTILQQPPPLQAMQQPPPQKVRINLQQQPPPLQIKSVPLPTLKMQ
          : . :.::  :.   ... :  ..  .: :                           
CCDS42 QVQLAMSPSPPGPQDFPHISEFPSSSGSCSPGPSNPTSSGDWDSSYPSGECGISTCSLLP
              430       440       450       460       470       480

          510       520       530       540       550       560    
pF1KA0 TTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEMITDVVPEVESPSQMDVELVSGSPV
                                                                   
CCDS42 RDKSLYLT                                                    
                                                                   




621 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Wed Nov  2 19:37:45 2016 done: Wed Nov  2 19:37:45 2016
 Total Scan time:  4.580 Total Display time:  0.080

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com