Result of FASTA (ccds) for pFN21AE2214
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KE2214, 530 aa
  1>>>pF1KE2214 530 - 530 aa - 530 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 6.0983+/-0.000662; mu= 17.0612+/- 0.040
 mean_var=117.4231+/-23.659, 0's: 0 Z-trim(114.7): 18  B-trim: 0 in 0/51
 Lambda= 0.118358
 statistics sampled from 15269 (15284) to 15269 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.787), E-opt: 0.2 (0.469), width:  16
 Scan time:  4.080

The best scores are:                                      opt bits E(32554)
CCDS8301.1 FUT4 gene_id:2526|Hs108|chr11           ( 530) 3839 666.1 2.8e-191
CCDS12153.1 FUT3 gene_id:2525|Hs108|chr19          ( 361)  863 157.8   2e-38
CCDS12154.1 FUT5 gene_id:2527|Hs108|chr19          ( 374)  855 156.4 5.2e-38
CCDS12152.1 FUT6 gene_id:2528|Hs108|chr19          ( 359)  850 155.6 9.2e-38
CCDS7022.1 FUT7 gene_id:2529|Hs108|chr9            ( 342)  732 135.4   1e-31
CCDS5033.1 FUT9 gene_id:10690|Hs108|chr6           ( 359)  659 122.9   6e-28


>>CCDS8301.1 FUT4 gene_id:2526|Hs108|chr11                (530 aa)
 initn: 3839 init1: 3839 opt: 3839  Z-score: 3547.6  bits: 666.1 E(32554): 2.8e-191
Smith-Waterman score: 3839; 99.8% identity (100.0% similar) in 530 aa overlap (1-530:1-530)

               10        20        30        40        50        60
pF1KE2 MRRLWGAARKPSGAGWEKEWAEAPQEAPGAWSGRLGPGRSGRKGRAVPGWASWPAHLALA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 MRRLWGAARKPSGAGWEKEWAEAPQEAPGAWSGRLGPGRSGRKGRAVPGWASWPAHLALA
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KE2 ARPARHLGGAGQGPRPLHSGTAPFHSRASGERQRRLEPQLQHESRCRSSTPADAWRAEAA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 ARPARHLGGAGQGPRPLHSGTAPFHSRASGERQRRLEPQLQHESRCRSSTPADAWRAEAA
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KE2 LPVRAMGAPWGSPTAAAGGRRGWRRGRGLPWTVCVLAAAGLTCTALITYACWGQLPPLPW
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 LPVRAMGAPWGSPTAAAGGRRGWRRGRGLPWTVCVLAAAGLTCTALITYACWGQLPPLPW
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KE2 ASPTPSRPVGVLLWWEPFGGRDSAPRPPPDCRLRFNISGCRLLTDRASYGEAQAVLFHHR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 ASPTPSRPVGVLLWWEPFGGRDSAPRPPPDCRLRFNISGCRLLTDRASYGEAQAVLFHHR
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KE2 DLVKGPPDWPPPWGVQAHTAEEVDLRVLDYEEAAAAAEALATSSPRPPGQRWVWMNFESP
       ::::::::::::::.:::::::::::::::::::::::::::::::::::::::::::::
CCDS83 DLVKGPPDWPPPWGIQAHTAEEVDLRVLDYEEAAAAAEALATSSPRPPGQRWVWMNFESP
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KE2 SHSPGLRSLASNLFNWTLSYRADSDVFVPYGYLYPRSHPGDPPSGLAPPLSRKQGLVAWV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 SHSPGLRSLASNLFNWTLSYRADSDVFVPYGYLYPRSHPGDPPSGLAPPLSRKQGLVAWV
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KE2 VSHWDERQARVRYYHQLSQHVTVDVFGRGGPGQPVPEIGLLHTVARYKFYLAFENSQHLD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 VSHWDERQARVRYYHQLSQHVTVDVFGRGGPGQPVPEIGLLHTVARYKFYLAFENSQHLD
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KE2 YITEKLWRNALLAGAVPVVLGPDRANYERFVPRGAFIHVDDFPSASSLASYLLFLDRNPA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 YITEKLWRNALLAGAVPVVLGPDRANYERFVPRGAFIHVDDFPSASSLASYLLFLDRNPA
              430       440       450       460       470       480

              490       500       510       520       530
pF1KE2 VYRRYFHWRRSYAVHITSFWDEPWCRVCQAVQRAGDRPKSIRNLASWFER
       ::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 VYRRYFHWRRSYAVHITSFWDEPWCRVCQAVQRAGDRPKSIRNLASWFER
              490       500       510       520       530

>>CCDS12153.1 FUT3 gene_id:2525|Hs108|chr19               (361 aa)
 initn: 828 init1: 401 opt: 863  Z-score: 803.4  bits: 157.8 E(32554): 2e-38
Smith-Waterman score: 896; 43.7% identity (65.1% similar) in 350 aa overlap (184-528:57-360)

           160       170       180       190         200       210 
pF1KE2 CVLAAAGLTCTALITYACWGQLPPLPWASPTPSRPVGVLLW--WEPFGGRDSAPRPPPDC
                                     ::.::. ..:   : ::      :     :
CCDS12 AVCFFSYLRVSRDDATGSPRAPSGSSRQDTTPTRPTLLILLRTW-PF----HIPVALSRC
         30        40        50        60        70             80 

              220       230       240       250       260       270
pF1KE2 -RLRFNISGCRLLTDRASYGEAQAVLFHHRDLVKGPPDWPPPWGVQAHTAEEVDLRVLDY
        ..  . . :.. .::  : .:. :. :: :....: .  ::                  
CCDS12 SEMVPGTADCHITADRKVYPQADMVIVHHWDIMSNPKSRLPP------------------
              90       100       110       120                     

              280       290       300       310       320       330
pF1KE2 EEAAAAAEALATSSPRPPGQRWVWMNFESPSHSPGLRSLASNLFNWTLSYRADSDVFVPY
                    :::: ::::.:.:.: : .   :..: .  :: :.:::.:::.:.::
CCDS12 -------------SPRPQGQRWIWFNLEPPPNCQHLEAL-DRYFNLTMSYRSDSDIFTPY
                        130       140        150       160         

               340       350       360       370       380         
pF1KE2 GYLYPRS-HPGDPPSGLAPPLSRKQGLVAWVVSHWDERQARVRYYHQLSQHVTVDVFGRG
       :.: : : .:. :: .    :: :  ::::.::.:   .::::::..:. :. :::.::.
CCDS12 GWLEPWSGQPAHPPLN----LSAKTELVAWAVSNWKPDSARVRYYQSLQAHLKVDVYGRS
     170       180           190       200       210       220     

     390       400       410       420       430       440         
pF1KE2 GPGQPVPEIGLLHTVARYKFYLAFENSQHLDYITEKLWRNALLAGAVPVVLGPDRANYER
          .:.:.  ...:..::::::::::: : :::::::::::: : ::::::::.:.::::
CCDS12 H--KPLPKGTMMETLSRYKFYLAFENSLHPDYITEKLWRNALEAWAVPVVLGPSRSNYER
           230       240       250       260       270       280   

     450       460       470       480       490        500        
pF1KE2 FVPRGAFIHVDDFPSASSLASYLLFLDRNPAVYRRYFHWRRSYAVHITSF-WDEPWCRVC
       :.:  :::::::: : ..:: ::  ::.. : :  ::.::..  ..  :: :   .:..:
CCDS12 FLPPDAFIHVDDFQSPKDLARYLQELDKDHARYLSYFRWRET--LRPRSFSWALDFCKAC
           290       300       310       320         330       340 

      510       520       530
pF1KE2 QAVQRAGDRPKSIRNLASWFER
         .:. . : ...:..:.::  
CCDS12 WKLQQES-RYQTVRSIAAWFT 
              350       360  

>>CCDS12154.1 FUT5 gene_id:2527|Hs108|chr19               (374 aa)
 initn: 854 init1: 411 opt: 855  Z-score: 795.8  bits: 156.4 E(32554): 5.2e-38
Smith-Waterman score: 917; 44.3% identity (66.3% similar) in 350 aa overlap (184-528:70-373)

           160       170       180        190       200       210  
pF1KE2 CVLAAAGLTCTALITYACWGQLPPLPWASPTPSRP-VGVLLWWEPFGGRDSAPRPPPDC-
                                     ::..: . .:::  ::    ..:   : : 
CCDS12 DATGSPRPGLMAVEPVTGAPNGSRCQDSMATPAHPTLLILLWTWPF----NTPVALPRCS
      40        50        60        70        80            90     

             220       230       240        250       260       270
pF1KE2 RLRFNISGCRLLTDRASYGEAQAVLFHHRDLVKGPP-DWPPPWGVQAHTAEEVDLRVLDY
       ..  . . : . .: . : .:.::. :: :.. .:  . :::                  
CCDS12 EMVPGAADCNITADSSVYPQADAVIVHHWDIMYNPSANLPPP------------------
         100       110       120       130                         

              280       290       300       310       320       330
pF1KE2 EEAAAAAEALATSSPRPPGQRWVWMNFESPSHSPGLRSLASNLFNWTLSYRADSDVFVPY
                      :: ::::.:...::::.   :..: .. :: :.:::.:::.:.::
CCDS12 --------------TRPQGQRWIWFSMESPSNCRHLEAL-DGYFNLTMSYRSDSDIFTPY
                     140       150       160        170       180  

               340       350       360       370       380         
pF1KE2 GYLYPRS-HPGDPPSGLAPPLSRKQGLVAWVVSHWDERQARVRYYHQLSQHVTVDVFGRG
       :.: : : .:. :: .    :: :  ::::.::.:   .::::::..:. :. :::.::.
CCDS12 GWLEPWSGQPAHPPLN----LSAKTELVAWAVSNWKPDSARVRYYQSLQAHLKVDVYGRS
            190           200       210       220       230        

     390       400       410       420       430       440         
pF1KE2 GPGQPVPEIGLLHTVARYKFYLAFENSQHLDYITEKLWRNALLAGAVPVVLGPDRANYER
          .:.:.  ...:..::::::::::: : :::::::::::: : ::::::::.:.::::
CCDS12 H--KPLPKGTMMETLSRYKFYLAFENSLHPDYITEKLWRNALEAWAVPVVLGPSRSNYER
        240       250       260       270       280       290      

     450       460       470       480       490        500        
pF1KE2 FVPRGAFIHVDDFPSASSLASYLLFLDRNPAVYRRYFHWRRSYAVHITSF-WDEPWCRVC
       :.:  :::::::: : ..:: ::  ::.. : :  :::::..  ..  :: :   .:..:
CCDS12 FLPPDAFIHVDDFQSPKDLARYLQELDKDHARYLSYFHWRET--LRPRSFSWALAFCKAC
        300       310       320       330         340       350    

      510       520       530
pF1KE2 QAVQRAGDRPKSIRNLASWFER
         .:. . : ...:..:.::  
CCDS12 WKLQQES-RYQTVRSIAAWFT 
          360        370     

>>CCDS12152.1 FUT6 gene_id:2528|Hs108|chr19               (359 aa)
 initn: 843 init1: 401 opt: 850  Z-score: 791.4  bits: 155.6 E(32554): 9.2e-38
Smith-Waterman score: 898; 43.5% identity (64.9% similar) in 359 aa overlap (173-528:47-358)

            150       160       170       180       190       200  
pF1KE2 WRRGRGLPWTVCVLAAAGLTCTALITYACWGQLPPLPWASPTPSRPVGVLLWWEPFGGRD
                                     :.  :   ..:. : :. .:::  ::    
CCDS12 LTTLLFQLLMAVCFFSYLRVSQDDPTVYPNGSRFPDSTGTPAHSIPL-ILLWTWPF----
         20        30        40        50        60         70     

            210        220       230       240       250       260 
pF1KE2 SAPRPPPDC-RLRFNISGCRLLTDRASYGEAQAVLFHHRDLVKGPPDWPPPWGVQAHTAE
       . :   : : ..  . . : . .::  : .:.::. :::... .:    :          
CCDS12 NKPIALPRCSEMVPGTADCNITADRKVYPQADAVIVHHREVMYNPSAQLP----------
              80        90       100       110       120           

             270       280       290       300       310       320 
pF1KE2 EVDLRVLDYEEAAAAAEALATSSPRPPGQRWVWMNFESPSHSPGLRSLASNLFNWTLSYR
                             :::  ::::.:...:::::   :... .. :: :.:::
CCDS12 ---------------------RSPRRQGQRWIWFSMESPSHCWQLKAM-DGYFNLTMSYR
                                  130       140        150         

             330        340       350       360       370       380
pF1KE2 ADSDVFVPYGYLYPRS-HPGDPPSGLAPPLSRKQGLVAWVVSHWDERQARVRYYHQLSQH
       .:::.:.:::.: : : .:. :: .:    : :  ::::.::.:   .::::::..:. :
CCDS12 SDSDIFTPYGWLEPWSGQPAHPPLNL----SAKTELVAWAVSNWGPNSARVRYYQSLQAH
     160       170       180           190       200       210     

              390       400       410       420       430       440
pF1KE2 VTVDVFGRGGPGQPVPEIGLLHTVARYKFYLAFENSQHLDYITEKLWRNALLAGAVPVVL
       . :::.::.   .:.:.  ...:..::::::::::: : :::::::::::: : ::::::
CCDS12 LKVDVYGRS--HKPLPQGTMMETLSRYKFYLAFENSLHPDYITEKLWRNALEAWAVPVVL
         220         230       240       250       260       270   

              450       460       470       480       490          
pF1KE2 GPDRANYERFVPRGAFIHVDDFPSASSLASYLLFLDRNPAVYRRYFHWRRSYAVHITSF-
       ::.:.:::::.:  :::::::: : ..:: ::  ::.. : :  ::.::..  ..  :: 
CCDS12 GPSRSNYERFLPPDAFIHVDDFQSPKDLARYLQELDKDHARYLSYFRWRET--LRPRSFS
           280       290       300       310       320         330 

     500       510       520       530
pF1KE2 WDEPWCRVCQAVQRAGDRPKSIRNLASWFER
       :   .:..:  .:. . : .. :..:.::  
CCDS12 WALAFCKACWKLQEES-RYQT-RGIAAWFT 
             340        350           

>>CCDS7022.1 FUT7 gene_id:2529|Hs108|chr9                 (342 aa)
 initn: 763 init1: 354 opt: 732  Z-score: 682.8  bits: 135.4 E(32554): 1e-31
Smith-Waterman score: 928; 44.3% identity (62.9% similar) in 388 aa overlap (144-529:10-341)

           120       130       140       150       160       170   
pF1KE2 AWRAEAALPVRAMGAPWGSPTAAAGGRRGWRRGRGLPWTVCVLAAAGLTCTALITYACWG
                                     :: :::     :::...:  .::  .  : 
CCDS70                      MNNAGHGPTRRLRGLG----VLAGVALL-AAL--WLLW-
                                    10            20           30  

           180       190       200       210       220       230   
pF1KE2 QLPPLPWASPTPSRPVGVLLWWEPFGGRDSAPRPPPDCRLRFNISGCRLLTDRASYGEAQ
        :   : ..:.:.  . .:.:  ::   :. :. : :   :..:. :.: ..:.  . :.
CCDS70 LLGSAPRGTPAPQPTITILVWHWPF--TDQPPELPSDTCTRYGIARCHLSANRSLLASAD
              40        50          60        70        80         

           240       250       260       270       280       290   
pF1KE2 AVLFHHRDLVKGPPDWPPPWGVQAHTAEEVDLRVLDYEEAAAAAEALATSSPRPPGQRWV
       ::.::::.:       :                             ::    :: :: ::
CCDS70 AVVFHHRELQTRRSHLP-----------------------------LA---QRPRGQPWV
      90       100                                       110       

           300       310       320       330       340       350   
pF1KE2 WMNFESPSHSPGLRSLASNLFNWTLSYRADSDVFVPYGYLYPRSHPGDPPSGLAPPLSRK
       : ..:::::. ::  :  ..:::.:::: :::.::::: : :  : :  ::   :::  :
CCDS70 WASMESPSHTHGLSHL-RGIFNWVLSYRRDSDIFVPYGRLEP--HWG--PS---PPLPAK
       120       130        140       150         160              

           360       370       380       390       400       410   
pF1KE2 QGLVAWVVSHWDERQARVRYYHQLSQHVTVDVFGRGGPGQPVPEIGLLHTVARYKFYLAF
       . ..:::::...::: :.: :.::. :. ::::::.. :.:.    :. :::.:.:::.:
CCDS70 SRVAAWVVSNFQERQLRARLYRQLAPHLRVDVFGRAN-GRPLCASCLVPTVAQYRFYLSF
     170       180       190       200        210       220        

           420       430       440       450       460       470   
pF1KE2 ENSQHLDYITEKLWRNALLAGAVPVVLGPDRANYERFVPRGAFIHVDDFPSASSLASYLL
       ::::: ::::::.:::::.::.::::::: ::.:: :::  ::.::::: ::  ::..: 
CCDS70 ENSQHRDYITEKFWRNALVAGTVPVVLGPPRATYEAFVPADAFVHVDDFGSARELAAFLT
      230       240       250       260       270       280        

           480       490       500       510       520         530
pF1KE2 FLDRNPAVYRRYFHWRRSYAVHITSFWDEPWCRVCQAVQRAGDRPKS--IRNLASWFER
        .  : . :.:.: ::    :.. . : : .: .:   .:    :.:   ..: .::. 
CCDS70 GM--NESRYQRFFAWRDRLRVRLFTDWRERFCAIC---DRYPHLPRSQVYEDLEGWFQA
      290         300       310       320          330       340  

>>CCDS5033.1 FUT9 gene_id:10690|Hs108|chr6                (359 aa)
 initn: 849 init1: 285 opt: 659  Z-score: 615.2  bits: 122.9 E(32554): 6e-28
Smith-Waterman score: 858; 41.7% identity (65.4% similar) in 338 aa overlap (191-528:66-357)

              170       180       190       200       210       220
pF1KE2 LTCTALITYACWGQLPPLPWASPTPSRPVGVLLWWEPFGGRDSAPRPPPDCRLRFNISGC
                                     .:.:  :::   .      .:.  :::.::
CCDS50 WIFSPMESASSVLKMKNFFSTKTDYFNETTILVWVWPFGQTFDLT----SCQAMFNIQGC
          40        50        60        70        80            90 

              230       240       250       260       270       280
pF1KE2 RLLTDRASYGEAQAVLFHHRDLVKGPPDWPPPWGVQAHTAEEVDLRVLDYEEAAAAAEAL
       .: :::. :....:::.::::.     .:              ::  :  .         
CCDS50 HLTTDRSLYNKSHAVLIHHRDI-----SW--------------DLTNLPQQA--------
             100       110                          120            

              290       300       310       320       330       340
pF1KE2 ATSSPRPPGQRWVWMNFESPSHSPGLRSLASNLFNWTLSYRADSDVFVPYGYLYPRSHPG
            ::: :.:.:::.:::.:.:  .:   .::: ::.:: :::. ::::.:   ..: 
CCDS50 -----RPPFQKWIWMNLESPTHTPQ-KSGIEHLFNLTLTYRRDSDIQVPYGFLTVSTNP-
               130       140        150       160       170        

              350       360       370       380       390       400
pF1KE2 DPPSGLAPPLSRKQGLVAWVVSHWDERQARVRYYHQLSQHVTVDVFGRGGPGQPVPEIGL
            ..  .  :. :: ::::.:. ..:::.::..::. . . ..:..  :. : . .:
CCDS50 -----FVFEVPSKEKLVCWVVSNWNPEHARVKYYNELSKSIEIHTYGQAF-GEYVNDKNL
            180       190       200       210       220        230 

              410       420       430       440       450       460
pF1KE2 LHTVARYKFYLAFENSQHLDYITEKLWRNALLAGAVPVVLGPDRANYERFVPRGAFIHVD
       . :..  ::::.:::: : :::::::. ::.:::.:::::::.: ::: ..:  .::::.
CCDS50 IPTISTCKFYLSFENSIHKDYITEKLY-NAFLAGSVPVVLGPSRENYENYIPADSFIHVE
             240       250        260       270       280       290

              470       480       490       500       510       520
pF1KE2 DFPSASSLASYLLFLDRNPAVYRRYFHWRRSYAVHITSFWDEPWCRVCQAVQRAGDRPKS
       :. : : ::.::  .:.:  .:  ::.::....:..  ::.   : .:. :.:  .  ::
CCDS50 DYNSPSELAKYLKEVDKNNKLYLSYFNWRKDFTVNLPRFWESHACLACDHVKRHQEY-KS
              300       310       320       330       340          

              530
pF1KE2 IRNLASWFER
       . :: .::  
CCDS50 VGNLEKWFWN
     350         




530 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Mon Nov  7 15:45:41 2016 done: Mon Nov  7 15:45:42 2016
 Total Scan time:  4.080 Total Display time:  0.030

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com