Result of FASTA (ccds) for pF1KB4161
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB4161, 471 aa
  1>>>pF1KB4161 471 - 471 aa - 471 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 12.5962+/-0.00117; mu= -12.6671+/- 0.071
 mean_var=529.0789+/-108.269, 0's: 0 Z-trim(116.3): 45  B-trim: 593 in 1/54
 Lambda= 0.055759
 statistics sampled from 16897 (16933) to 16897 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.787), E-opt: 0.2 (0.52), width:  16
 Scan time:  3.660

The best scores are:                                      opt bits E(32554)
CCDS44619.1 CPSF7 gene_id:79869|Hs108|chr11        ( 471) 3226 273.8 2.7e-73
CCDS8006.2 CPSF7 gene_id:79869|Hs108|chr11         ( 514) 3226 273.9 2.9e-73
CCDS44620.1 CPSF7 gene_id:79869|Hs108|chr11        ( 462) 2035 178.0 1.8e-44
CCDS8988.1 CPSF6 gene_id:11052|Hs108|chr12         ( 551)  812 79.7 8.6e-15
CCDS73494.1 CPSF6 gene_id:11052|Hs108|chr12        ( 588)  812 79.7   9e-15


>>CCDS44619.1 CPSF7 gene_id:79869|Hs108|chr11             (471 aa)
 initn: 3226 init1: 3226 opt: 3226  Z-score: 1429.4  bits: 273.8 E(32554): 2.7e-73
Smith-Waterman score: 3226; 100.0% identity (100.0% similar) in 471 aa overlap (1-471:1-471)

               10        20        30        40        50        60
pF1KB4 MSEGVDLIDIYADEEFNQDPEFNNTDQIDLYDDVLTATSQPSDDRSSSTEPPPPVRQEPS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MSEGVDLIDIYADEEFNQDPEFNNTDQIDLYDDVLTATSQPSDDRSSSTEPPPPVRQEPS
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB4 PKPNNKTPAILYTYSGLRNRRAAVYVGSFSWWTTDQQLIQVIRSIGVYDVVELKFAENRA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PKPNNKTPAILYTYSGLRNRRAAVYVGSFSWWTTDQQLIQVIRSIGVYDVVELKFAENRA
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB4 NGQSKGYAEVVVASENSVHKLLELLPGKVLNGEKVDVRPATRQNLSQFEAQARKRECVRV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 NGQSKGYAEVVVASENSVHKLLELLPGKVLNGEKVDVRPATRQNLSQFEAQARKRECVRV
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB4 PRGGIPPRAHSRDSSDSADGRATPSENLVPSSARVDKPPSVLPYFNRPPSALPLMGLPPP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PRGGIPPRAHSRDSSDSADGRATPSENLVPSSARVDKPPSVLPYFNRPPSALPLMGLPPP
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB4 PIPPPPPLSSSFGVPPPPPGIHYQHLMPPPPRLPPHLAVPPPGAIPPALHLNPAFFPPPN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PIPPPPPLSSSFGVPPPPPGIHYQHLMPPPPRLPPHLAVPPPGAIPPALHLNPAFFPPPN
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB4 ATVGPPPDTYMKASAPYNHHGSRDSGPPPSTVSEAEFEDIMKRNRAISSSAISKAVSGAS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ATVGPPPDTYMKASAPYNHHGSRDSGPPPSTVSEAEFEDIMKRNRAISSSAISKAVSGAS
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB4 AGDYSDAIETLLTAIAVIKQSRVANDERCRVLISSLKDCLHGIEAKSYSVGASGSSSRKR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AGDYSDAIETLLTAIAVIKQSRVANDERCRVLISSLKDCLHGIEAKSYSVGASGSSSRKR
              370       380       390       400       410       420

              430       440       450       460       470 
pF1KB4 HRSRERSPSRSRESSRRHRDLLHNEDRHDDYFQERNREHERHRDRERDRHH
       :::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 HRSRERSPSRSRESSRRHRDLLHNEDRHDDYFQERNREHERHRDRERDRHH
              430       440       450       460       470 

>>CCDS8006.2 CPSF7 gene_id:79869|Hs108|chr11              (514 aa)
 initn: 3226 init1: 3226 opt: 3226  Z-score: 1428.9  bits: 273.9 E(32554): 2.9e-73
Smith-Waterman score: 3226; 100.0% identity (100.0% similar) in 471 aa overlap (1-471:44-514)

                                             10        20        30
pF1KB4                               MSEGVDLIDIYADEEFNQDPEFNNTDQIDL
                                     ::::::::::::::::::::::::::::::
CCDS80 PFEGGGRARRAGGIFLTLSILRTRDLPSGAMSEGVDLIDIYADEEFNQDPEFNNTDQIDL
            20        30        40        50        60        70   

               40        50        60        70        80        90
pF1KB4 YDDVLTATSQPSDDRSSSTEPPPPVRQEPSPKPNNKTPAILYTYSGLRNRRAAVYVGSFS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS80 YDDVLTATSQPSDDRSSSTEPPPPVRQEPSPKPNNKTPAILYTYSGLRNRRAAVYVGSFS
            80        90       100       110       120       130   

              100       110       120       130       140       150
pF1KB4 WWTTDQQLIQVIRSIGVYDVVELKFAENRANGQSKGYAEVVVASENSVHKLLELLPGKVL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS80 WWTTDQQLIQVIRSIGVYDVVELKFAENRANGQSKGYAEVVVASENSVHKLLELLPGKVL
           140       150       160       170       180       190   

              160       170       180       190       200       210
pF1KB4 NGEKVDVRPATRQNLSQFEAQARKRECVRVPRGGIPPRAHSRDSSDSADGRATPSENLVP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS80 NGEKVDVRPATRQNLSQFEAQARKRECVRVPRGGIPPRAHSRDSSDSADGRATPSENLVP
           200       210       220       230       240       250   

              220       230       240       250       260       270
pF1KB4 SSARVDKPPSVLPYFNRPPSALPLMGLPPPPIPPPPPLSSSFGVPPPPPGIHYQHLMPPP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS80 SSARVDKPPSVLPYFNRPPSALPLMGLPPPPIPPPPPLSSSFGVPPPPPGIHYQHLMPPP
           260       270       280       290       300       310   

              280       290       300       310       320       330
pF1KB4 PRLPPHLAVPPPGAIPPALHLNPAFFPPPNATVGPPPDTYMKASAPYNHHGSRDSGPPPS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS80 PRLPPHLAVPPPGAIPPALHLNPAFFPPPNATVGPPPDTYMKASAPYNHHGSRDSGPPPS
           320       330       340       350       360       370   

              340       350       360       370       380       390
pF1KB4 TVSEAEFEDIMKRNRAISSSAISKAVSGASAGDYSDAIETLLTAIAVIKQSRVANDERCR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS80 TVSEAEFEDIMKRNRAISSSAISKAVSGASAGDYSDAIETLLTAIAVIKQSRVANDERCR
           380       390       400       410       420       430   

              400       410       420       430       440       450
pF1KB4 VLISSLKDCLHGIEAKSYSVGASGSSSRKRHRSRERSPSRSRESSRRHRDLLHNEDRHDD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS80 VLISSLKDCLHGIEAKSYSVGASGSSSRKRHRSRERSPSRSRESSRRHRDLLHNEDRHDD
           440       450       460       470       480       490   

              460       470 
pF1KB4 YFQERNREHERHRDRERDRHH
       :::::::::::::::::::::
CCDS80 YFQERNREHERHRDRERDRHH
           500       510    

>>CCDS44620.1 CPSF7 gene_id:79869|Hs108|chr11             (462 aa)
 initn: 3143 init1: 2009 opt: 2035  Z-score: 911.7  bits: 178.0 E(32554): 1.8e-44
Smith-Waterman score: 3129; 98.1% identity (98.1% similar) in 471 aa overlap (1-471:1-462)

               10        20        30        40        50        60
pF1KB4 MSEGVDLIDIYADEEFNQDPEFNNTDQIDLYDDVLTATSQPSDDRSSSTEPPPPVRQEPS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MSEGVDLIDIYADEEFNQDPEFNNTDQIDLYDDVLTATSQPSDDRSSSTEPPPPVRQEPS
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB4 PKPNNKTPAILYTYSGLRNRRAAVYVGSFSWWTTDQQLIQVIRSIGVYDVVELKFAENRA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PKPNNKTPAILYTYSGLRNRRAAVYVGSFSWWTTDQQLIQVIRSIGVYDVVELKFAENRA
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB4 NGQSKGYAEVVVASENSVHKLLELLPGKVLNGEKVDVRPATRQNLSQFEAQARKRECVRV
       :::::::::::::::::::::::::::::::::::::::::::::::::::::::     
CCDS44 NGQSKGYAEVVVASENSVHKLLELLPGKVLNGEKVDVRPATRQNLSQFEAQARKR-----
              130       140       150       160       170          

              190       200       210       220       230       240
pF1KB4 PRGGIPPRAHSRDSSDSADGRATPSENLVPSSARVDKPPSVLPYFNRPPSALPLMGLPPP
           ::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ----IPPRAHSRDSSDSADGRATPSENLVPSSARVDKPPSVLPYFNRPPSALPLMGLPPP
             180       190       200       210       220       230 

              250       260       270       280       290       300
pF1KB4 PIPPPPPLSSSFGVPPPPPGIHYQHLMPPPPRLPPHLAVPPPGAIPPALHLNPAFFPPPN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PIPPPPPLSSSFGVPPPPPGIHYQHLMPPPPRLPPHLAVPPPGAIPPALHLNPAFFPPPN
             240       250       260       270       280       290 

              310       320       330       340       350       360
pF1KB4 ATVGPPPDTYMKASAPYNHHGSRDSGPPPSTVSEAEFEDIMKRNRAISSSAISKAVSGAS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ATVGPPPDTYMKASAPYNHHGSRDSGPPPSTVSEAEFEDIMKRNRAISSSAISKAVSGAS
             300       310       320       330       340       350 

              370       380       390       400       410       420
pF1KB4 AGDYSDAIETLLTAIAVIKQSRVANDERCRVLISSLKDCLHGIEAKSYSVGASGSSSRKR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AGDYSDAIETLLTAIAVIKQSRVANDERCRVLISSLKDCLHGIEAKSYSVGASGSSSRKR
             360       370       380       390       400       410 

              430       440       450       460       470 
pF1KB4 HRSRERSPSRSRESSRRHRDLLHNEDRHDDYFQERNREHERHRDRERDRHH
       :::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 HRSRERSPSRSRESSRRHRDLLHNEDRHDDYFQERNREHERHRDRERDRHH
             420       430       440       450       460  

>>CCDS8988.1 CPSF6 gene_id:11052|Hs108|chr12              (551 aa)
 initn: 871 init1: 525 opt: 812  Z-score: 379.1  bits: 79.7 E(32554): 8.6e-15
Smith-Waterman score: 1228; 45.3% identity (63.1% similar) in 510 aa overlap (43-469:48-538)

             20        30        40        50        60        70  
pF1KB4 DEEFNQDPEFNNTDQIDLYDDVLTATSQPSDDRSSSTEPPPPVRQEPSPKPNNKTPAILY
                                     .::.     :: : .. .   .. .: ..:
CCDS89 FNQEAEYGGHDQIDLYDDVISPSANNGDAPEDRDYMDTLPPTVGDDVG---KGAAPNVVY
        20        30        40        50        60           70    

             80        90       100       110       120       130  
pF1KB4 TYSGLRNRRAAVYVGSFSWWTTDQQLIQVIRSIGVYDVVELKFAENRANGQSKGYAEVVV
       ::.:   .: :.:.:...:::::..: ....:.:: :..:.:: ::::::::::.: : :
CCDS89 TYTG---KRIALYIGNLTWWTTDEDLTEAVHSLGVNDILEIKFFENRANGQSKGFALVGV
              80        90       100       110       120       130 

            140       150       160       170       180            
pF1KB4 ASENSVHKLLELLPGKVLNGEKVDVRPATRQNLSQFEAQARKRECVRVPRG---GIPPRA
       .:: : .::..::: . :.:..  : : ..: ::::: :.::        :   . :: .
CCDS89 GSEASSKKLMDLLPKRELHGQNPVVTPCNKQFLSQFEMQSRKTTQSGQMSGEGKAGPPGG
             140       150       160       170       180       190 

     190        200            210       220       230       240   
pF1KB4 HSRDS-SDSADGR-----ATPSENLVPSSARVDKPPSVLPYFNRPPSALPLMGLPPPPIP
        :: .  ... ::     :.:. .  :. :    ::  .:  . ::   : .: : :: :
CCDS89 SSRAAFPQGGRGRGRFPGAVPGGDRFPGPAGPGGPPPPFPAGQTPPR--PPLGPPGPPGP
             200       210       220       230         240         

                    250                                        260 
pF1KB4 P---------PPPLSSS-----------------FGVPP----------------PPPGI
       :         ::::..                  :: ::                :::: 
CCDS89 PGPPPPGQVLPPPLAGPPNRGDRPPPPVLFPGQPFGQPPLGPLPPGPPPPVPGYGPPPGP
     250       260       270       280       290       300         

             270                         280       290       300   
pF1KB4 HYQHLMPPPP----------------RL--PPHLAVPPPGAIPPALHLNPAFFPPPNAT-
          .  ::::                 :  ::::  ::::: ::: :.::::::::. . 
CCDS89 PPPQQGPPPPPGPFPPRPPGPLGPPLTLAPPPHLPGPPPGAPPPAPHVNPAFFPPPTNSG
     310       320       330       340       350       360         

                  310       320              330       340         
pF1KB4 ------VGPPPDTYMKASAPYNHHGSRDSGPPP-------STVSEAEFEDIMKRNRAISS
              ::::   .    ::.. :  : :::        . .::::::.::.:::::::
CCDS89 MPTSDSRGPPPTDPYGRPPPYDR-G--DYGPPGREMDTARTPLSEAEFEEIMNRNRAISS
     370       380       390          400       410       420      

     350       360       370       380       390       400         
pF1KB4 SAISKAVSGASAGDYSDAIETLLTAIAVIKQSRVANDERCRVLISSLKDCLHGIEAKSYS
       ::::.::: ::::::..:::::.:::..::::.:. :.::.::::::.:::::::.::: 
CCDS89 SAISRAVSDASAGDYGSAIETLVTAISLIKQSKVSADDRCKVLISSLQDCLHGIESKSY-
        430       440       450       460       470       480      

     410       420       430       440       450       460         
pF1KB4 VGASGSSSRKRHRSRERSPSRSRESSRRHRDLLHNEDRHDDYFQERNREHERHRDRERDR
           ::.:: :.:::::. :::::.::::..  ...::::::..::.::.::::::.:::
CCDS89 ----GSGSR-RERSRERDHSRSREKSRRHKS--RSRDRHDDYYRERSRERERHRDRDRDR
             490        500       510         520       530        

     470            
pF1KB4 HH           
                    
CCDS89 DRERDREREYRHR
      540       550 

>>CCDS73494.1 CPSF6 gene_id:11052|Hs108|chr12             (588 aa)
 initn: 1094 init1: 525 opt: 812  Z-score: 378.7  bits: 79.7 E(32554): 9e-15
Smith-Waterman score: 1103; 44.2% identity (60.6% similar) in 505 aa overlap (84-469:83-575)

            60        70        80        90       100       110   
pF1KB4 PVRQEPSPKPNNKTPAILYTYSGLRNRRAAVYVGSFSWWTTDQQLIQVIRSIGVYDVVEL
                                     .:.:...:::::..: ....:.:: :..:.
CCDS73 MDTLPPTVGDDVGKGAAPNVVYTYTGKRIALYIGNLTWWTTDEDLTEAVHSLGVNDILEI
             60        70        80        90       100       110  

           120       130       140       150       160       170   
pF1KB4 KFAENRANGQSKGYAEVVVASENSVHKLLELLPGKVLNGEKVDVRPATRQNLSQFEAQAR
       :: ::::::::::.: : :.:: : .::..::: . :.:..  : : ..: ::::: :.:
CCDS73 KFFENRANGQSKGFALVGVGSEASSKKLMDLLPKRELHGQNPVVTPCNKQFLSQFEMQSR
            120       130       140       150       160       170  

           180          190        200            210       220    
pF1KB4 KRECVRVPRG---GIPPRAHSRDS-SDSADGR-----ATPSENLVPSSARVDKPPSVLP-
       :        :   . :: . :: .  ... ::     :.:. .  :. :    ::  .: 
CCDS73 KTTQSGQMSGEGKAGPPGGSSRAAFPQGGRGRGRFPGAVPGGDRFPGPAGPGGPPPPFPG
            180       190       200       210       220       230  

                                230                            240 
pF1KB4 -------YFNRP-------P-------SALPLMGL---------------------PPPP
                .::       :         .:..::                     ::::
CCDS73 NLIKHLVKGTRPLFLETRIPWHMGHSIEEIPIFGLKAGQTPPRPPLGPPGPPGPPGPPPP
            240       250       260       270       280       290  

                               250                       260       
pF1KB4 ---IPPP------------PPL---SSSFGVPP----------------PPPGIHYQHLM
          .:::            ::.   .. :: ::                ::::    .  
CCDS73 GQVLPPPLAGPPNRGDRPPPPVLFPGQPFGQPPLGPLPPGPPPPVPGYGPPPGPPPPQQG
            300       310       320       330       340       350  

       270                         280       290       300         
pF1KB4 PPPP----------------RL--PPHLAVPPPGAIPPALHLNPAFFPPPNAT-------
       ::::                 :  ::::  ::::: ::: :.::::::::. .       
CCDS73 PPPPPGPFPPRPPGPLGPPLTLAPPPHLPGPPPGAPPPAPHVNPAFFPPPTNSGMPTSDS
            360       370       380       390       400       410  

             310       320              330       340       350    
pF1KB4 VGPPP-DTYMKASAPYNHHGSRDSGPPP-------STVSEAEFEDIMKRNRAISSSAISK
        :::: : : .   ::.. :  : :::        . .::::::.::.:::::::::::.
CCDS73 RGPPPTDPYGRPP-PYDR-G--DYGPPGREMDTARTPLSEAEFEEIMNRNRAISSSAISR
            420         430         440       450       460        

          360       370       380       390       400       410    
pF1KB4 AVSGASAGDYSDAIETLLTAIAVIKQSRVANDERCRVLISSLKDCLHGIEAKSYSVGASG
       ::: ::::::..:::::.:::..::::.:. :.::.::::::.:::::::.:::     :
CCDS73 AVSDASAGDYGSAIETLVTAISLIKQSKVSADDRCKVLISSLQDCLHGIESKSY-----G
      470       480       490       500       510       520        

          420       430       440       450       460       470    
pF1KB4 SSSRKRHRSRERSPSRSRESSRRHRDLLHNEDRHDDYFQERNREHERHRDRERDRHH   
       :.:: :.:::::. :::::.::::..  ...::::::..::.::.::::::.:::     
CCDS73 SGSR-RERSRERDHSRSREKSRRHKS--RSRDRHDDYYRERSRERERHRDRDRDRDRERD
            530       540         550       560       570       580

CCDS73 REREYRHR
               




471 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Sat Nov  5 05:40:34 2016 done: Sat Nov  5 05:40:34 2016
 Total Scan time:  3.660 Total Display time:  0.040

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com