Result of FASTA (ccds) for pFN21AB5309
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB5309, 423 aa
  1>>>pF1KB5309 423 - 423 aa - 423 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 5.4663+/-0.000775; mu= 16.3280+/- 0.047
 mean_var=66.2267+/-13.197, 0's: 0 Z-trim(108.4): 13  B-trim: 0 in 0/49
 Lambda= 0.157601
 statistics sampled from 10185 (10193) to 10185 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.687), E-opt: 0.2 (0.313), width:  16
 Scan time:  3.070

The best scores are:                                      opt bits E(32554)
CCDS13879.1 GAL3ST1 gene_id:9514|Hs108|chr22       ( 423) 2908 669.9 1.3e-192
CCDS33427.1 GAL3ST2 gene_id:64090|Hs108|chr2       ( 398)  824 196.1 5.2e-50
CCDS8128.1 GAL3ST3 gene_id:89792|Hs108|chr11       ( 431)  759 181.3 1.6e-45
CCDS5688.1 GAL3ST4 gene_id:79690|Hs108|chr7        ( 486)  295 75.8   1e-13


>>CCDS13879.1 GAL3ST1 gene_id:9514|Hs108|chr22            (423 aa)
 initn: 2908 init1: 2908 opt: 2908  Z-score: 3571.7  bits: 669.9 E(32554): 1.3e-192
Smith-Waterman score: 2908; 99.8% identity (100.0% similar) in 423 aa overlap (1-423:1-423)

               10        20        30        40        50        60
pF1KB5 MLPPQKKPWESMAKGLVLGALFTSFLLLMYSYAVPPLHAGLASTTPEAAASCSPPALEPE
       ::::::::::::::::::::::::::::.:::::::::::::::::::::::::::::::
CCDS13 MLPPQKKPWESMAKGLVLGALFTSFLLLVYSYAVPPLHAGLASTTPEAAASCSPPALEPE
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB5 AVIRANGSAGECQPRRNIVFLKTHKTASSTLLNILFRFGQKHRLKFAFPNGRNDFDYPTF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 AVIRANGSAGECQPRRNIVFLKTHKTASSTLLNILFRFGQKHRLKFAFPNGRNDFDYPTF
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB5 FARSLVQDYRPGACFNIICNHMRFHYDEVRGLVPTNAIFITVLRDPARLFESSFHYFGPV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 FARSLVQDYRPGACFNIICNHMRFHYDEVRGLVPTNAIFITVLRDPARLFESSFHYFGPV
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB5 VPLTWKLSAGDKLTEFLQDPDRYYDPNGFNAHYLRNLLFFDLGYDNSLDPSSPQVQEHIL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 VPLTWKLSAGDKLTEFLQDPDRYYDPNGFNAHYLRNLLFFDLGYDNSLDPSSPQVQEHIL
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB5 EVERRFHLVLLQEYFDESLVLLKDLLCWELEDVLYFKLNARRDSPVPRLSGELYGRATAW
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 EVERRFHLVLLQEYFDESLVLLKDLLCWELEDVLYFKLNARRDSPVPRLSGELYGRATAW
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB5 NMLDSHLYRHFNASFWRKVEAFGRERMAREVAALRHANERMRTICIDGGHAVDAAAIQDE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 NMLDSHLYRHFNASFWRKVEAFGRERMAREVAALRHANERMRTICIDGGHAVDAAAIQDE
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB5 AMQPWQPLGTKSILGYNLKKSIGQRHAQLCRRMLTPEIQYLMDLGANLWVTKLWKFIRDF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 AMQPWQPLGTKSILGYNLKKSIGQRHAQLCRRMLTPEIQYLMDLGANLWVTKLWKFIRDF
              370       380       390       400       410       420

          
pF1KB5 LRW
       :::
CCDS13 LRW
          

>>CCDS33427.1 GAL3ST2 gene_id:64090|Hs108|chr2            (398 aa)
 initn: 736 init1: 323 opt: 824  Z-score: 1011.3  bits: 196.1 E(32554): 5.2e-50
Smith-Waterman score: 824; 39.8% identity (66.6% similar) in 344 aa overlap (67-406:43-382)

         40        50        60        70        80        90      
pF1KB5 LHAGLASTTPEAAASCSPPALEPEAVIRANGSAGECQPRRNIVFLKTHKTASSTLLNILF
                                     :. .:  :  ::.:::::::::::.::::.
CCDS33 RVILLLLLALTLLLLAGFLHSDLELDTPLFGGQAEGPPVTNIMFLKTHKTASSTVLNILY
             20        30        40        50        60        70  

        100       110        120       130       140       150     
pF1KB5 RFGQKHRLKFAFPNG-RNDFDYPTFFARSLVQDYRPGACFNIICNHMRFHYDEVRGLVPT
       ::.. : :. :.: : :  . :: .:    :.       :::.:::.::.  .:. ..:.
CCDS33 RFAETHNLSVALPAGSRVHLGYPWLFLARYVEGVGSQQRFNIMCNHLRFNLPQVQKVMPN
             80        90       100       110       120       130  

         160       170       180       190       200        210    
pF1KB5 NAIFITVLRDPARLFESSFHYFGPVVPLTWKLSAGDKLTEFLQDPDRYY-DPNGFNAHYL
       .......::.:.  .:::: :.   .:    . .. .:  :: .:  .: :   .   : 
CCDS33 DTFYFSILRNPVFQLESSFIYYKTYAP---AFRGAPSLDAFLASPRTFYNDSRHLRNVYA
            140       150          160       170       180         

          220       230       240       250       260       270    
pF1KB5 RNLLFFDLGYDNSLDPSSPQVQEHILEVERRFHLVLLQEYFDESLVLLKDLLCWELEDVL
       .: ..::.:.: . .     :. .: ::::::.:::. :..:::::::.  : : :.::.
CCDS33 KNNMWFDFGFDPNAQCEEGYVRARIAEVERRFRLVLIAEHLDESLVLLRRRLRWALDDVV
     190       200       210       220       230       240         

          280       290       300       310       320        330   
pF1KB5 YFKLNARRDSPVPRLSGELYGRATAWNMLDSHLYRHFNASFWRKVEA-FGRERMAREVAA
        :.::.:    : ::: :   :: .:  :: .::.::: ..: ...: .: .:.  ::  
CCDS33 AFRLNSRSARSVARLSPETRERARSWCALDWRLYEHFNRTLWAQLRAELGPRRLRGEVER
     250       260       270       280       290       300         

           340        350       360       370       380       390  
pF1KB5 LRHANERMRTICI-DGGHAVDAAAIQDEAMQPWQPLGTKSILGYNLKKSIGQRHAQLCRR
       ::   ... ..:. :::   . . :.:  ..:.:  :  .::::::. .. ..   .:.:
CCDS33 LRARRRELASLCLQDGGALKNHTQIRDPRLRPYQS-GKADILGYNLRPGLDNQTLGVCQR
     310       320       330       340        350       360        

            400       410       420   
pF1KB5 MLTPEIQYLMDLGANLWVTKLWKFIRDFLRW
       .. ::.::.  : :                 
CCDS33 LVMPELQYMARLYALQFPEKPLKNIPFLGA 
      370       380       390         

>>CCDS8128.1 GAL3ST3 gene_id:89792|Hs108|chr11            (431 aa)
 initn: 734 init1: 238 opt: 759  Z-score: 930.9  bits: 181.3 E(32554): 1.6e-45
Smith-Waterman score: 762; 39.1% identity (62.9% similar) in 345 aa overlap (72-400:51-391)

              50        60        70                 80        90  
pF1KB5 ASTTPEAAASCSPPALEPEAVIRANGSAGECQPRRN---------IVFLKTHKTASSTLL
                                     : : ::         ..::::::::..:. 
CCDS81 LLLVLGCSTVSLLIHQGAQLSWYPKLFPLSCPPLRNSPPRPKHMTVAFLKTHKTAGTTVQ
               30        40        50        60        70        80

            100       110         120        130       140         
pF1KB5 NILFRFGQKHRLKFAFPNG--RNDFDYPTFFARSLVQDY-RPGACFNIICNHMRFHYDEV
       ::::::...: :  :.:.   ...: ::  :.  .:.   ::    ... .:.::   :.
CCDS81 NILFRFAERHNLTVALPHPSCEHQFCYPRNFSAHFVHPATRPP---HVLASHLRFDRAEL
               90       100       110       120          130       

     150       160       170       180       190       200         
pF1KB5 RGLVPTNAIFITVLRDPARLFESSFHYFGPVVPLTWKLSAGDKLTEFLQDPDRYYDPNGF
       . :.: .....:.::.:: .::: : :..   : ...   . .:  ::. :. ::  .  
CCDS81 ERLMPPSTVYVTILREPAAMFESLFSYYNQYCP-AFRRVPNASLEAFLRAPEAYYRAGEH
       140       150       160       170        180       190      

     210       220       230         240       250       260       
pF1KB5 NAHYLRNLLFFDLGYDNSLDP--SSPQVQEHILEVERRFHLVLLQEYFDESLVLLKDLLC
        : . .: : .::: ::  .:  ..  .   : .::. : ::.. ::::::::::. :: 
CCDS81 FAMFAHNTLAYDLGGDNERSPRDDAAYLAGLIRQVEEVFSLVMIAEYFDESLVLLRRLLA
        200       210       220       230       240       250      

       270       280        290       300       310       320      
pF1KB5 WELEDVLYFKLNARRDSP-VPRLSGELYGRATAWNMLDSHLYRHFNASFWRKVEAFGRER
       :.:.:::: :::::  :  .  . . :   : .:: ::. :: ::::.:::.:   ::  
CCDS81 WDLDDVLYAKLNARAASSRLAAIPAALARAARTWNALDAGLYDHFNATFWRHVARAGRAC
        260       270       280       290       300       310      

        330       340        350       360       370       380     
pF1KB5 MAREVAALRHANERMRTICI-DGGHAVDAAAIQDEAMQPWQPLGTKSILGYNLKKSIGQR
       . ::.  ::.: .:.   :. :      :: :. . .:::::    .:.::.:  . .  
CCDS81 VEREARELREARQRLLRRCFGDEPLLRPAAQIRTKQLQPWQPSRKVDIMGYDLPGGGAGP
        320       330       340       350       360       370      

         390       400       410       420                    
pF1KB5 HAQLCRRMLTPEIQYLMDLGANLWVTKLWKFIRDFLRW                 
        .. : ..  ::.::                                        
CCDS81 ATEACLKLAMPEVQYSNYLLRKQKRRGGARARPEPVLDNPPPRPIRVLPRGPQGP
        380       390       400       410       420       430 

>>CCDS5688.1 GAL3ST4 gene_id:79690|Hs108|chr7             (486 aa)
 initn: 817 init1: 203 opt: 295  Z-score: 359.9  bits: 75.8 E(32554): 1e-13
Smith-Waterman score: 735; 34.6% identity (56.8% similar) in 410 aa overlap (72-406:63-467)

              50        60        70        80        90       100 
pF1KB5 ASTTPEAAASCSPPALEPEAVIRANGSAGECQPRRNIVFLKTHKTASSTLLNILFRFGQK
                                     : ::. .:::::::..::..:..: :.:..
CCDS56 QLLGGPFQRRLPGLQLRQPSAPSLRPALPSCPPRQRLVFLKTHKSGSSSVLSLLHRYGDQ
             40        50        60        70        80        90  

             110       120       130            140       150      
pF1KB5 HRLKFAFPNGRNDFDYPTFFARSLVQDYRP--GAC---FNIICNHMRFHYDEVRGLVPTN
       : :.::.: .: .: :: .:  : :. :::  :.    :.:.:.::::.  ::  ..:..
CCDS56 HGLRFALP-ARYQFGYPKLFQASRVKGYRPQGGGTQLPFHILCHHMRFNLKEVLQVMPSD
            100        110       120       130       140       150 

        160       170       180       190       200       210      
pF1KB5 AIFITVLRDPARLFESSFHYFGPVVPLTWKLSAGDKLTEFLQDPDRYYDPNGFNAHYLRN
       ..:....:::: : .:.: :.  .   .  .  . .:. :: .:  .: :.. . :: ::
CCDS56 SFFFSIVRDPAALARSAFSYYKST---SSAFRKSPSLAAFLANPRGFYRPGARGDHYARN
             160       170          180       190       200        

        220                    230                                 
pF1KB5 LLFFDLGYD-------------NSLDPSSPQVQ--------------------------E
       ::.::.:                  ::. ::.:                          .
CCDS56 LLWFDFGLPFPPEKRAKRGNIHPPRDPNPPQLQVLPSGAGPRAQTLNPNALIHPVSTVTD
      210       220       230       240       250       260        

       240                            250       260       270      
pF1KB5 HILEV---------------------ERRFHLVLLQEYFDESLVLLKDLLCWELEDVLYF
       :  ..                     .  : ::.. :::::::::: : ::: :.::. :
CCDS56 HRSQISSPASFDLGSSSFIQWGLAWLDSVFDLVMVAEYFDESLVLLADALCWGLDDVVGF
      270       280       290       300       310       320        

        280                 290       300       310       320      
pF1KB5 KLNAR----------RDSPVPRLSGELYGRATAWNMLDSHLYRHFNASFWRKVEAFGRER
         ::.           .: .   . .: .:: ::: ::  :: ::: :.: ..: .:. :
CCDS56 MHNAQAGHKQGLSTVSNSGLTAEDRQLTARARAWNNLDWALYVHFNRSLWARIEKYGQGR
      330       340       350       360       370       380        

        330       340       350       360       370       380      
pF1KB5 MAREVAALRHANERMRTICIDGGHAVDAAAIQDEAMQPWQPLGTKSILGYNLKKSIGQRH
       .   :: ::   : .   :. ::.: :   : :. ..:.: .:. ..::: :..... . 
CCDS56 LQTAVAELRARREALAKHCLVGGEASDPKYITDRRFRPFQ-FGSAKVLGYILRSGLSPQD
      390       400       410       420        430       440       

        390       400       410       420     
pF1KB5 AQLCRRMLTPEIQYLMDLGANLWVTKLWKFIRDFLRW  
        . :.:. :::.::   : :                   
CCDS56 QEECERLATPELQYKDKLDAKQFPPTVSLPLKTSRPLSP
       450       460       470       480      




423 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Fri Nov  4 03:32:55 2016 done: Fri Nov  4 03:32:56 2016
 Total Scan time:  3.070 Total Display time:  0.030

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com