Result of FASTA (ccds) for pF1KSDA1034
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KSDA1034, 733 aa
  1>>>pF1KSDA1034 733 - 733 aa - 733 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 8.4546+/-0.000855; mu= 7.9193+/- 0.053
 mean_var=171.9547+/-34.096, 0's: 0 Z-trim(113.5): 10  B-trim: 14 in 1/53
 Lambda= 0.097806
 statistics sampled from 14128 (14138) to 14128 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.736), E-opt: 0.2 (0.434), width:  16
 Scan time:  3.780

The best scores are:                                      opt bits E(32554)
CCDS2327.1 SATB2 gene_id:23314|Hs108|chr2          ( 733) 4855 697.1 2.4e-200
CCDS2631.1 SATB1 gene_id:6304|Hs108|chr3           ( 763) 2371 346.7 8.1e-95
CCDS56242.1 SATB1 gene_id:6304|Hs108|chr3          ( 795) 2312 338.3 2.7e-92


>>CCDS2327.1 SATB2 gene_id:23314|Hs108|chr2               (733 aa)
 initn: 4855 init1: 4855 opt: 4855  Z-score: 3710.3  bits: 697.1 E(32554): 2.4e-200
Smith-Waterman score: 4855; 100.0% identity (100.0% similar) in 733 aa overlap (1-733:1-733)

               10        20        30        40        50        60
pF1KSD MERRSESPCLRDSPDRRSGSPDVKGPPPVKVARLEQNGSPMGARGRPNGAVAKAVGGLMI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 MERRSESPCLRDSPDRRSGSPDVKGPPPVKVARLEQNGSPMGARGRPNGAVAKAVGGLMI
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KSD PVFCVVEQLDGSLEYDNREEHAEFVLVRKDVLFSQLVETALLALGYSHSSAAQAQGIIKL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 PVFCVVEQLDGSLEYDNREEHAEFVLVRKDVLFSQLVETALLALGYSHSSAAQAQGIIKL
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KSD GRWNPLPLSYVTDAPDATVADMLQDVYHVVTLKIQLQSCSKLEDLPAEQWNHATVRNALK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 GRWNPLPLSYVTDAPDATVADMLQDVYHVVTLKIQLQSCSKLEDLPAEQWNHATVRNALK
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KSD ELLKEMNQSTLAKECPLSQSMISSIVNSTYYANVSATKCQEFGRWYKKYKKIKVERVERE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 ELLKEMNQSTLAKECPLSQSMISSIVNSTYYANVSATKCQEFGRWYKKYKKIKVERVERE
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KSD NLSDYCVLGQRPMHLPNMNQLASLGKTNEQSPHSQIHHSTPIRNQVPALQPIMSPGLLSP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 NLSDYCVLGQRPMHLPNMNQLASLGKTNEQSPHSQIHHSTPIRNQVPALQPIMSPGLLSP
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KSD QLSPQLVRQQIAMAHLINQQIAVSRLLAHQHPQAINQQFLNHPPIPRAVKPEPTNSSVEV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 QLSPQLVRQQIAMAHLINQQIAVSRLLAHQHPQAINQQFLNHPPIPRAVKPEPTNSSVEV
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KSD SPDIYQQVRDELKRASVSQAVFARVAFNRTQGLLSEILRKEEDPRTASQSLLVNLRAMQN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 SPDIYQQVRDELKRASVSQAVFARVAFNRTQGLLSEILRKEEDPRTASQSLLVNLRAMQN
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KSD FLNLPEVERDRIYQDERERSMNPNVSMVSSASSSPSSSRTPQAKTSTPTTDLPIKVDGAN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 FLNLPEVERDRIYQDERERSMNPNVSMVSSASSSPSSSRTPQAKTSTPTTDLPIKVDGAN
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KSD INITAAIYDEIQQEMKRAKVSQALFAKVAANKSQGWLCELLRWKENPSPENRTLWENLCT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 INITAAIYDEIQQEMKRAKVSQALFAKVAANKSQGWLCELLRWKENPSPENRTLWENLCT
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KSD IRRFLNLPQHERDVIYEEESRHHHSERMQHVVQLPPEPVQVLHRQQSQPAKESSPPREEA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 IRRFLNLPQHERDVIYEEESRHHHSERMQHVVQLPPEPVQVLHRQQSQPAKESSPPREEA
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KSD PPPPPPTEDSCAKKPRSRTKISLEALGILQSFIHDVGLYPDQEAIHTLSAQLDLPKHTII
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 PPPPPPTEDSCAKKPRSRTKISLEALGILQSFIHDVGLYPDQEAIHTLSAQLDLPKHTII
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KSD KFFQNQRYHVKHHGKLKEHLGSAVDVAEYKDEELLTESEENDSEEGSEEMYKVEAEEENA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 KFFQNQRYHVKHHGKLKEHLGSAVDVAEYKDEELLTESEENDSEEGSEEMYKVEAEEENA
              670       680       690       700       710       720

              730   
pF1KSD DKSKAAPAEIDQR
       :::::::::::::
CCDS23 DKSKAAPAEIDQR
              730   

>>CCDS2631.1 SATB1 gene_id:6304|Hs108|chr3                (763 aa)
 initn: 2339 init1: 1042 opt: 2371  Z-score: 1815.8  bits: 346.7 E(32554): 8.1e-95
Smith-Waterman score: 2873; 62.1% identity (80.4% similar) in 760 aa overlap (1-718:1-748)

               10        20        30        40        50          
pF1KSD MERRSESPCLRDSPDRRSGSPDVKGPPPVKVARLEQNGSPMGARGRPNGAVAKAVG----
       :.. .:.   ..  .  ..  : :::: .:.:::::::::.: ::: ... ::  :    
CCDS26 MDHLNEATQGKEHSEMSNNVSDPKGPP-AKIARLEQNGSPLG-RGRLGSTGAKMQGVPLK
               10        20         30        40         50        

                     60        70        80        90       100    
pF1KSD ------------GLMIPVFCVVEQLDGSLEYDNREEHAEFVLVRKDVLFSQLVETALLAL
                   : :.:::::::. ....::: .::::::::::::.::.::.: :::.:
CCDS26 HSGHLMKTNLRKGTMLPVFCVVEHYENAIEYDCKEEHAEFVLVRKDMLFNQLIEMALLSL
       60        70        80        90       100       110        

          110       120       130       140       150       160    
pF1KSD GYSHSSAAQAQGIIKLGRWNPLPLSYVTDAPDATVADMLQDVYHVVTLKIQLQSCSKLED
       ::::::::::.:.:..:.:::.::::::::::::::::::::::::::::::.:: ::::
CCDS26 GYSHSSAAQAKGLIQVGKWNPVPLSYVTDAPDATVADMLQDVYHVVTLKIQLHSCPKLED
      120       130       140       150       160       170        

          170       180       190       200       210       220    
pF1KSD LPAEQWNHATVRNALKELLKEMNQSTLAKECPLSQSMISSIVNSTYYANVSATKCQEFGR
       :: :::.:.:::::::.:::.::::.::::::::::::::::::::::::::.:::::::
CCDS26 LPPEQWSHTTVRNALKDLLKDMNQSSLAKECPLSQSMISSIVNSTYYANVSAAKCQEFGR
      180       190       200       210       220       230        

          230       240       250       260       270         280  
pF1KSD WYKKYKKIKVERVERENLSDYCVLGQRPMHLPNMNQLASLGKTNEQSPH-SQIHH-STP-
       :::..:: :   :: ..::.   :.:.  .  :..:    :.: :: :  .:. : : : 
CCDS26 WYKHFKKTKDMMVEMDSLSE---LSQQGANHVNFGQQPVPGNTAEQPPSPAQLSHGSQPS
      240       250          260       270       280       290     

             290       300       310       320       330       340 
pF1KSD IRNQVPALQPIMSPGLLSPQLSPQLVRQQIAMAHLINQQIAVSRLLAHQHPQAINQQFLN
       .:. .: :.:    ::.:  .::::: ::..::.:.::: ::.::::.:   ..:::.::
CCDS26 VRTPLPNLHP----GLVSTPISPQLVNQQLVMAQLLNQQYAVNRLLAQQ---SLNQQYLN
         300           310       320       330       340           

               350         360       370       380       390       
pF1KSD HPP-IPRAV-KP--EPTNSSVEVSPDIYQQVRDELKRASVSQAVFARVAFNRTQGLLSEI
       ::: . :.. ::  . .....::: .::: ::::::::..::::::::::::::::::::
CCDS26 HPPPVSRSMNKPLEQQVSTNTEVSSEIYQWVRDELKRAGISQAVFARVAFNRTQGLLSEI
      350       360       370       380       390       400        

       400       410       420       430       440       450       
pF1KSD LRKEEDPRTASQSLLVNLRAMQNFLNLPEVERDRIYQDERERSMNPNVSMVSSASSSPSS
       :::::::.:::::::::::::::::.:::.:::::::::::::.:   .:  .   :   
CCDS26 LRKEEDPKTASQSLLVNLRAMQNFLQLPEAERDRIYQDERERSLNAASAMGPAPLISTPP
      410       420       430       440       450       460        

       460       470       480       490       500       510       
pF1KSD SRTPQAKTSTPTTDLPIKVDGANINITAAIYDEIQQEMKRAKVSQALFAKVAANKSQGWL
       :: ::.::.: .:.   : .. ..::.:.::::::::::::::::::::::::.::::::
CCDS26 SRPPQVKTATIATERNGKPENNTMNINASIYDEIQQEMKRAKVSQALFAKVAATKSQGWL
      470       480       490       500       510       520        

       520       530       540       550       560         570     
pF1KSD CELLRWKENPSPENRTLWENLCTIRRFLNLPQHERDVIYEEESR--HHHSERMQHVVQLP
       ::::::::.::::::::::::  :::::.::: :::.:::.::   :::..:  :....:
CCDS26 CELLRWKEDPSPENRTLWENLSMIRRFLSLPQPERDAIYEQESNAVHHHGDRPPHIIHVP
      530       540       550       560       570       580        

         580       590          600              610               
pF1KSD PEPVQVLHRQQSQPAKESS---PPREEAPP---P--PP--PTEDSCA-------KKPRSR
        : .:  ..::.:  ....   ::. .  :   :  ::  ::  : :       .: : :
CCDS26 AEQIQQQQQQQQQQQQQQQAPPPPQPQQQPQTGPRLPPRQPTVASPAESDEENRQKTRPR
      590       600       610       620       630       640        

      620       630       640       650       660       670        
pF1KSD TKISLEALGILQSFIHDVGLYPDQEAIHTLSAQLDLPKHTIIKFFQNQRYHVKHHGKLKE
       ::::.::::::::::.:::::::.:::.::::::::::.:::::::::::..:::::::.
CCDS26 TKISVEALGILQSFIQDVGLYPDEEAIQTLSAQLDLPKYTIIKFFQNQRYYLKHHGKLKD
      650       660       670       680       690       700        

      680       690       700       710       720       730   
pF1KSD HLGSAVDVAEYKDEELLTESEENDSEEGSEEMYKVEAEEENADKSKAAPAEIDQR
       . :  :::::::.:::: . ::. ...... ...:. :::               
CCDS26 NSGLEVDVAEYKEEELLKDLEESVQDKNTNTLFSVKLEEELSVEGNTDINTDLKD
      710       720       730       740       750       760   

>>CCDS56242.1 SATB1 gene_id:6304|Hs108|chr3               (795 aa)
 initn: 2744 init1: 1042 opt: 2312  Z-score: 1770.5  bits: 338.3 E(32554): 2.7e-92
Smith-Waterman score: 2820; 59.4% identity (77.4% similar) in 791 aa overlap (1-717:1-779)

               10        20        30        40        50          
pF1KSD MERRSESPCLRDSPDRRSGSPDVKGPPPVKVARLEQNGSPMGARGRPNGAVAKAVG----
       :.. .:.   ..  .  ..  : :::: .:.:::::::::.: ::: ... ::  :    
CCDS56 MDHLNEATQGKEHSEMSNNVSDPKGPP-AKIARLEQNGSPLG-RGRLGSTGAKMQGVPLK
               10        20         30        40         50        

                     60        70        80        90       100    
pF1KSD ------------GLMIPVFCVVEQLDGSLEYDNREEHAEFVLVRKDVLFSQLVETALLAL
                   : :.:::::::. ....::: .::::::::::::.::.::.: :::.:
CCDS56 HSGHLMKTNLRKGTMLPVFCVVEHYENAIEYDCKEEHAEFVLVRKDMLFNQLIEMALLSL
       60        70        80        90       100       110        

          110       120       130       140       150       160    
pF1KSD GYSHSSAAQAQGIIKLGRWNPLPLSYVTDAPDATVADMLQDVYHVVTLKIQLQSCSKLED
       ::::::::::.:.:..:.:::.::::::::::::::::::::::::::::::.:: ::::
CCDS56 GYSHSSAAQAKGLIQVGKWNPVPLSYVTDAPDATVADMLQDVYHVVTLKIQLHSCPKLED
      120       130       140       150       160       170        

          170       180       190       200       210       220    
pF1KSD LPAEQWNHATVRNALKELLKEMNQSTLAKECPLSQSMISSIVNSTYYANVSATKCQEFGR
       :: :::.:.:::::::.:::.::::.::::::::::::::::::::::::::.:::::::
CCDS56 LPPEQWSHTTVRNALKDLLKDMNQSSLAKECPLSQSMISSIVNSTYYANVSAAKCQEFGR
      180       190       200       210       220       230        

          230       240       250       260       270         280  
pF1KSD WYKKYKKIKVERVERENLSDYCVLGQRPMHLPNMNQLASLGKTNEQSPH-SQIHH-STP-
       :::..:: :   :: ..::.   :.:.  .  :..:    :.: :: :  .:. : : : 
CCDS56 WYKHFKKTKDMMVEMDSLSE---LSQQGANHVNFGQQPVPGNTAEQPPSPAQLSHGSQPS
      240       250          260       270       280       290     

             290       300       310       320       330       340 
pF1KSD IRNQVPALQPIMSPGLLSPQLSPQLVRQQIAMAHLINQQIAVSRLLAHQHPQAINQQFLN
       .:. .: :.:    ::.:  .::::: ::..::.:.::: ::.::::.   :..:::.::
CCDS56 VRTPLPNLHP----GLVSTPISPQLVNQQLVMAQLLNQQYAVNRLLAQ---QSLNQQYLN
         300           310       320       330          340        

               350         360       370       380       390       
pF1KSD HPP-IPRAV-KP--EPTNSSVEVSPDIYQQVRDELKRASVSQAVFARVAFNRTQGLLSEI
       ::: . :.. ::  . .....::: .::: ::::::::..::::::::::::::::::::
CCDS56 HPPPVSRSMNKPLEQQVSTNTEVSSEIYQWVRDELKRAGISQAVFARVAFNRTQGLLSEI
      350       360       370       380       390       400        

       400       410       420       430       440       450       
pF1KSD LRKEEDPRTASQSLLVNLRAMQNFLNLPEVERDRIYQDERERSMNPNVSMVSSASSSPSS
       :::::::.:::::::::::::::::.:::.:::::::::::::.:   .:  .   :   
CCDS56 LRKEEDPKTASQSLLVNLRAMQNFLQLPEAERDRIYQDERERSLNAASAMGPAPLISTPP
      410       420       430       440       450       460        

       460       470       480       490       500       510       
pF1KSD SRTPQAKTSTPTTDLPIKVDGANINITAAIYDEIQQEMKRAKVSQALFAKVAANKSQGWL
       :: ::.::.: .:.   : .. ..::.:.::::::::::::::::::::::::.::::::
CCDS56 SRPPQVKTATIATERNGKPENNTMNINASIYDEIQQEMKRAKVSQALFAKVAATKSQGWL
      470       480       490       500       510       520        

       520       530       540       550       560         570     
pF1KSD CELLRWKENPSPENRTLWENLCTIRRFLNLPQHERDVIYEEESR--HHHSERMQHVVQLP
       ::::::::.::::::::::::  :::::.::: :::.:::.::   :::..:  :....:
CCDS56 CELLRWKEDPSPENRTLWENLSMIRRFLSLPQPERDAIYEQESNAVHHHGDRPPHIIHVP
      530       540       550       560       570       580        

         580                                  590       600        
pF1KSD PEPVQ-----VLHR----------------------QQSQPAKESSPPREEAPPPP----
        : .:     .: .                      ::.:  ....  ...:::::    
CCDS56 AEQIQSPSPTTLGKGESRGVFLPGLPTPAPWLGAAPQQQQQQQQQQQQQQQAPPPPQPQQ
      590       600       610       620       630       640        

                  610                 620       630       640      
pF1KSD --------PPTEDSCA----------KKPRSRTKISLEALGILQSFIHDVGLYPDQEAIH
               :: . . :          .: : :::::.::::::::::.:::::::.:::.
CCDS56 QPQTGPRLPPRQPTVASPAESDEENRQKTRPRTKISVEALGILQSFIQDVGLYPDEEAIQ
      650       660       670       680       690       700        

        650       660       670       680       690       700      
pF1KSD TLSAQLDLPKHTIIKFFQNQRYHVKHHGKLKEHLGSAVDVAEYKDEELLTESEENDSEEG
       ::::::::::.:::::::::::..:::::::.. :  :::::::.:::: . ::. ....
CCDS56 TLSAQLDLPKYTIIKFFQNQRYYLKHHGKLKDNSGLEVDVAEYKEEELLKDLEESVQDKN
      710       720       730       740       750       760        

        710       720       730   
pF1KSD SEEMYKVEAEEENADKSKAAPAEIDQR
       .. ...:. ::                
CCDS56 TNTLFSVKLEEELSVEGNTDINTDLKD
      770       780       790     




733 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Thu Nov  3 04:41:08 2016 done: Thu Nov  3 04:41:09 2016
 Total Scan time:  3.780 Total Display time:  0.040

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com