Result of FASTA (ccds) for pFN21AB7765
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB7765, 450 aa
  1>>>pF1KB7765 450 - 450 aa - 450 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 8.2772+/-0.00092; mu= 5.0690+/- 0.055
 mean_var=173.8064+/-36.010, 0's: 0 Z-trim(112.1): 14  B-trim: 332 in 1/52
 Lambda= 0.097284
 statistics sampled from 12939 (12947) to 12939 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.742), E-opt: 0.2 (0.398), width:  16
 Scan time:  3.540

The best scores are:                                      opt bits E(32554)
CCDS13454.1 TFAP2C gene_id:7022|Hs108|chr20        ( 450) 3038 438.4 7.2e-123
CCDS4934.2 TFAP2B gene_id:7021|Hs108|chr6          ( 460) 1653 244.0 2.4e-64
CCDS34337.1 TFAP2A gene_id:7020|Hs108|chr6         ( 431) 1468 218.0 1.5e-56
CCDS43422.1 TFAP2A gene_id:7020|Hs108|chr6         ( 433) 1468 218.0 1.5e-56
CCDS4510.1 TFAP2A gene_id:7020|Hs108|chr6          ( 437) 1468 218.0 1.5e-56
CCDS393.2 TFAP2E gene_id:339488|Hs108|chr1         ( 442) 1367 203.8 2.8e-52
CCDS4933.1 TFAP2D gene_id:83741|Hs108|chr6         ( 452) 1008 153.5 4.2e-37


>>CCDS13454.1 TFAP2C gene_id:7022|Hs108|chr20             (450 aa)
 initn: 3038 init1: 3038 opt: 3038  Z-score: 2319.4  bits: 438.4 E(32554): 7.2e-123
Smith-Waterman score: 3038; 100.0% identity (100.0% similar) in 450 aa overlap (1-450:1-450)

               10        20        30        40        50        60
pF1KB7 MLWKITDNVKYEEDCEDRHDGSSNGNPRVPHLSSAGQHLYSPAPPLSHTGVAEYQPPPYF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MLWKITDNVKYEEDCEDRHDGSSNGNPRVPHLSSAGQHLYSPAPPLSHTGVAEYQPPPYF
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB7 PPPYQQLAYSQSADPYSHLGEAYAAAINPLHQPAPTGSQQQAWPGRQSQEGAGLPSHHGR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 PPPYQQLAYSQSADPYSHLGEAYAAAINPLHQPAPTGSQQQAWPGRQSQEGAGLPSHHGR
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB7 PAGLLPHLSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAENLGLHDMPHQMDEVQNV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 PAGLLPHLSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAENLGLHDMPHQMDEVQNV
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB7 DDQHLLLHDQTVIRKGPISMTKNPLNLPCQKELVGAVMNPTEVFCSVPGRLSLLSSTSKY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 DDQHLLLHDQTVIRKGPISMTKNPLNLPCQKELVGAVMNPTEVFCSVPGRLSLLSSTSKY
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB7 KVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAGRRKAAHVT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 KVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAGRRKAAHVT
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB7 LLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGRNEMAARKNMLLAAQQLCK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGRNEMAARKNMLLAAQQLCK
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB7 EFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGSQAICAAVSALQNYIKEAL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 EFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGSQAICAAVSALQNYIKEAL
              370       380       390       400       410       420

              430       440       450
pF1KB7 IVIDKSYMNPGDQSPADSNKTLEKMEKHRK
       ::::::::::::::::::::::::::::::
CCDS13 IVIDKSYMNPGDQSPADSNKTLEKMEKHRK
              430       440       450

>>CCDS4934.2 TFAP2B gene_id:7021|Hs108|chr6               (460 aa)
 initn: 1468 init1: 685 opt: 1653  Z-score: 1268.7  bits: 244.0 E(32554): 2.4e-64
Smith-Waterman score: 1653; 59.6% identity (77.2% similar) in 465 aa overlap (1-450:12-460)

                          10        20        30        40         
pF1KB7            MLWKITDNVKYEEDCEDRHDGSSNGNPRVPHLSSAGQHLYSPAPPLSHT
                  ::::...:::::.  ::::::  . . :. .:.:..:  :: :::::::
CCDS49 MHSPPRDQAAIMLWKLVENVKYEDIYEDRHDGVPSHSSRLSQLGSVSQGPYSSAPPLSHT
               10        20        30        40        50        60

      50        60        70        80        90       100         
pF1KB7 GVAEYQPPPYFPPPYQQLAYSQSADPYSHLGEAYAAAINPLHQPAPTGSQQQAWPGRQSQ
         ...::: ::::::: : : :: :::::... :.  .::::::     ::. :  :: :
CCDS49 PSSDFQPP-YFPPPYQPLPYHQSQDPYSHVNDPYS--LNPLHQP-----QQHPWGQRQRQ
                70        80        90         100            110  

     110        120       130       140         150        160     
pF1KB7 E-GAGLPSHHGRPAGLLPHLSGLEAGAVSARRDAY--RRSDLLLPHAH-ALDAAGLAENL
       : :.   :   .: . ::.::::.      ::: .  :: :.::  :: .::: :....:
CCDS49 EVGSEAGSLLPQPRAALPQLSGLDP-----RRDYHSVRRPDVLLHSAHHGLDA-GMGDSL
            120       130            140       150       160       

         170        180          190       200       210           
pF1KB7 GLHDMPHQ-MDEVQNVDDQH---LLLHDQTVIRKGPISMTKNPLNLPCQKE--LVGAVMN
       .:: . :  :..::.:.: .   . : ::.::.: :.   :.  .:  .:.  : :  .:
CCDS49 SLHGLGHPGMEDVQSVEDANNSGMNLLDQSVIKKVPVP-PKSVTSLMMNKDGFLGGMSVN
        170       180       190       200        210       220     

     220       230       240       250       260       270         
pF1KB7 PTEVFCSVPGRLSLLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLR
         :::::::::::::::::::::::.::::::::::::::::::::::::::::::::::
CCDS49 TGEVFCSVPGRLSLLSSTSKYKVTVGEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLR
         230       240       250       260       270       280     

     280       290       300       310       320       330         
pF1KB7 EKLDKIGLNLPAGRRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHL
       :.:.::::::::::::::.:::::::::::::::::::.:.::.:::.: :.:::.: : 
CCDS49 ERLEKIGLNLPAGRRKAANVTLLTSLVEGEAVHLARDFGYICETEFPAKAVSEYLNRQHT
         290       300       310       320       330       340     

     340       350       360       370       380       390         
pF1KB7 GGRNEMAARKNMLLAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHG
          ... .:::::::..:::::::.::.::::: :.:: .:.:: .::.::.::::::::
CCDS49 DP-SDLHSRKNMLLATKQLCKEFTDLLAQDRTPIGNSRPSPILEPGIQSCLTHFSLITHG
          350       360       370       380       390       400    

     400       410       420       430            440       450
pF1KB7 FGSQAICAAVSALQNYIKEALIVIDKSYMNPGDQSPADS-----NKTLEKMEKHRK
       ::. :::::..:::::. :::  .:: ..:    .   :     .:: .: :::::
CCDS49 FGAPAICAALTALQNYLTEALKGMDKMFLNNTTTNRHTSGEGPGSKTGDKEEKHRK
          410       420       430       440       450       460

>>CCDS34337.1 TFAP2A gene_id:7020|Hs108|chr6              (431 aa)
 initn: 1551 init1: 743 opt: 1468  Z-score: 1128.8  bits: 218.0 E(32554): 1.5e-56
Smith-Waterman score: 1740; 63.4% identity (82.6% similar) in 443 aa overlap (17-450:10-431)

               10        20        30        40        50        60
pF1KB7 MLWKITDNVKYEEDCEDRHDGSSNGNPRVPHLSSAGQHLYSPAPPLSHTGVAEYQPPPYF
                       :::::.:::. :.:.:...::  :. :::::::  :..::: ::
CCDS34        MLVHSFSAMDRHDGTSNGTARLPQLGTVGQSPYTSAPPLSHTPNADFQPP-YF
                      10        20        30        40        50   

               70        80        90        100        110        
pF1KB7 PPPYQQLAYSQSADPYSHLGEAYAAAINPLH-QPAPTGSQQQAWPG-RQSQEGAGLPSHH
       ::::: . : :: :::::... :.  .:::: :: :   :. .::: :::::.. : .:.
CCDS34 PPPYQPI-YPQSQDPYSHVNDPYS--LNPLHAQPQP---QHPGWPGQRQSQESGLLHTHR
              60        70          80           90       100      

      120        130       140       150       160       170       
pF1KB7 GRPAGLLPH-LSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAENLGLHDMPHQMDEV
       :     ::: ::::.      ::: ::: . ::   ::: ..::.. :..:..:: ..::
CCDS34 G-----LPHQLSGLD-----PRRD-YRRHEDLLHGPHAL-SSGLGD-LSIHSLPHAIEEV
             110            120        130        140        150   

       180       190       200           210        220       230  
pF1KB7 QNVDDQHLLLHDQTVIRKGPISMTKNPLN----LPCQKE-LVGAVMNPTEVFCSVPGRLS
        .:.:  . . :::::.:::.:..:.  :    .: .:. : :.:.::.:::::::::::
CCDS34 PHVEDPGINIPDQTVIKKGPVSLSKSNSNAVSAIPINKDNLFGGVVNPNEVFCSVPGRLS
           160       170       180       190       200       210   

            240       250       260       270       280       290  
pF1KB7 LLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAG
           220       230       240       250       260       270   

            300       310       320       330       340       350  
pF1KB7 RRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGRNEMAARKNML
       :::::.:::::::::::::::::::.::::.:::.: :::.:.: : .  ::...:::::
CCDS34 RRKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAVAEFLNRQH-SDPNEQVTRKNML
           280       290       300       310        320       330  

            360       370       380       390       400       410  
pF1KB7 LAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGSQAICAAVSAL
       ::..:.:::::.::.:::.: :.::  :.:: .::.::.::.::.::::: :.::::.::
CCDS34 LATKQICKEFTDLLAQDRSPLGNSRPNPILEPGIQSCLTHFNLISHGFGSPAVCAAVTAL
            340       350       360       370       380       390  

            420       430        440       450
pF1KB7 QNYIKEALIVIDKSYMNPGDQSPADSN-KTLEKMEKHRK
       :::. ::: ..:: :.. . .: .:.: :. .: :::::
CCDS34 QNYLTEALKAMDKMYLSNNPNSHTDNNAKSSDKEEKHRK
            400       410       420       430 

>>CCDS43422.1 TFAP2A gene_id:7020|Hs108|chr6              (433 aa)
 initn: 1553 init1: 743 opt: 1468  Z-score: 1128.7  bits: 218.0 E(32554): 1.5e-56
Smith-Waterman score: 1745; 63.2% identity (82.5% similar) in 446 aa overlap (14-450:9-433)

               10        20        30        40        50        60
pF1KB7 MLWKITDNVKYEEDCEDRHDGSSNGNPRVPHLSSAGQHLYSPAPPLSHTGVAEYQPPPYF
                    : .:::::.:::. :.:.:...::  :. :::::::  :..::: ::
CCDS43      MSILAKMGDWQDRHDGTSNGTARLPQLGTVGQSPYTSAPPLSHTPNADFQPP-YF
                    10        20        30        40        50     

               70        80        90        100        110        
pF1KB7 PPPYQQLAYSQSADPYSHLGEAYAAAINPLH-QPAPTGSQQQAWPG-RQSQEGAGLPSHH
       ::::: . : :: :::::... :  ..:::: :: :   :. .::: :::::.. : .:.
CCDS43 PPPYQPI-YPQSQDPYSHVNDPY--SLNPLHAQPQP---QHPGWPGQRQSQESGLLHTHR
           60         70          80           90       100        

      120        130       140       150       160       170       
pF1KB7 GRPAGLLPH-LSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAENLGLHDMPHQMDEV
       :     ::: ::::.      ::: ::: . ::   ::: ..::.. :..:..:: ..::
CCDS43 G-----LPHQLSGLDP-----RRD-YRRHEDLLHGPHAL-SSGLGD-LSIHSLPHAIEEV
           110            120        130        140        150     

       180       190       200           210        220       230  
pF1KB7 QNVDDQHLLLHDQTVIRKGPISMTKNPLN----LPCQKE-LVGAVMNPTEVFCSVPGRLS
        .:.:  . . :::::.:::.:..:.  :    .: .:. : :.:.::.:::::::::::
CCDS43 PHVEDPGINIPDQTVIKKGPVSLSKSNSNAVSAIPINKDNLFGGVVNPNEVFCSVPGRLS
         160       170       180       190       200       210     

            240       250       260       270       280       290  
pF1KB7 LLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAG
         220       230       240       250       260       270     

            300       310       320       330       340       350  
pF1KB7 RRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGRNEMAARKNML
       :::::.:::::::::::::::::::.::::.:::.: :::.:.: : .  ::...:::::
CCDS43 RRKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAVAEFLNRQH-SDPNEQVTRKNML
         280       290       300       310       320        330    

            360       370       380       390       400       410  
pF1KB7 LAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGSQAICAAVSAL
       ::..:.:::::.::.:::.: :.::  :.:: .::.::.::.::.::::: :.::::.::
CCDS43 LATKQICKEFTDLLAQDRSPLGNSRPNPILEPGIQSCLTHFNLISHGFGSPAVCAAVTAL
          340       350       360       370       380       390    

            420       430        440       450
pF1KB7 QNYIKEALIVIDKSYMNPGDQSPADSN-KTLEKMEKHRK
       :::. ::: ..:: :.. . .: .:.: :. .: :::::
CCDS43 QNYLTEALKAMDKMYLSNNPNSHTDNNAKSSDKEEKHRK
          400       410       420       430   

>>CCDS4510.1 TFAP2A gene_id:7020|Hs108|chr6               (437 aa)
 initn: 1552 init1: 743 opt: 1468  Z-score: 1128.7  bits: 218.0 E(32554): 1.5e-56
Smith-Waterman score: 1834; 64.1% identity (83.0% similar) in 459 aa overlap (1-450:1-437)

               10        20        30        40        50        60
pF1KB7 MLWKITDNVKYEEDCEDRHDGSSNGNPRVPHLSSAGQHLYSPAPPLSHTGVAEYQPPPYF
       ::::.:::.::: ::::::::.:::. :.:.:...::  :. :::::::  :..::: ::
CCDS45 MLWKLTDNIKYE-DCEDRHDGTSNGTARLPQLGTVGQSPYTSAPPLSHTPNADFQPP-YF
               10         20        30        40        50         

               70        80        90        100        110        
pF1KB7 PPPYQQLAYSQSADPYSHLGEAYAAAINPLH-QPAPTGSQQQAWPG-RQSQEGAGLPSHH
       ::::: . : :: :::::... :.  .:::: :: :   :. .::: :::::.. : .:.
CCDS45 PPPYQPI-YPQSQDPYSHVNDPYS--LNPLHAQPQP---QHPGWPGQRQSQESGLLHTHR
       60         70        80          90          100       110  

      120        130       140       150       160       170       
pF1KB7 GRPAGLLPH-LSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAENLGLHDMPHQMDEV
       :     ::: ::::.      ::: ::: . ::   ::: ..::.. :..:..:: ..::
CCDS45 G-----LPHQLSGLDP-----RRD-YRRHEDLLHGPHAL-SSGLGD-LSIHSLPHAIEEV
                 120             130       140         150         

       180       190       200           210        220       230  
pF1KB7 QNVDDQHLLLHDQTVIRKGPISMTKNPLN----LPCQKE-LVGAVMNPTEVFCSVPGRLS
        .:.:  . . :::::.:::.:..:.  :    .: .:. : :.:.::.:::::::::::
CCDS45 PHVEDPGINIPDQTVIKKGPVSLSKSNSNAVSAIPINKDNLFGGVVNPNEVFCSVPGRLS
     160       170       180       190       200       210         

            240       250       260       270       280       290  
pF1KB7 LLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 LLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAG
     220       230       240       250       260       270         

            300       310       320       330       340       350  
pF1KB7 RRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGRNEMAARKNML
       :::::.:::::::::::::::::::.::::.:::.: :::.:.: : .  ::...:::::
CCDS45 RRKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAVAEFLNRQH-SDPNEQVTRKNML
     280       290       300       310       320        330        

            360       370       380       390       400       410  
pF1KB7 LAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGSQAICAAVSAL
       ::..:.:::::.::.:::.: :.::  :.:: .::.::.::.::.::::: :.::::.::
CCDS45 LATKQICKEFTDLLAQDRSPLGNSRPNPILEPGIQSCLTHFNLISHGFGSPAVCAAVTAL
      340       350       360       370       380       390        

            420       430        440       450
pF1KB7 QNYIKEALIVIDKSYMNPGDQSPADSN-KTLEKMEKHRK
       :::. ::: ..:: :.. . .: .:.: :. .: :::::
CCDS45 QNYLTEALKAMDKMYLSNNPNSHTDNNAKSSDKEEKHRK
      400       410       420       430       

>>CCDS393.2 TFAP2E gene_id:339488|Hs108|chr1              (442 aa)
 initn: 1238 init1: 714 opt: 1367  Z-score: 1052.0  bits: 203.8 E(32554): 2.8e-52
Smith-Waterman score: 1367; 54.6% identity (72.8% similar) in 452 aa overlap (17-450:10-442)

               10        20          30        40            50    
pF1KB7 MLWKITDNVKYEEDCEDRHDG--SSNGNPRVPHLSSAGQHLYSPAPPLSHT----GVAEY
                       .: ::  .. :. :   :::  :  :.::::: ::    ..::.
CCDS39        MLVHTYSAMERPDGLGAAAGGAR---LSSLPQAAYGPAPPLCHTPAATAAAEF
                      10        20           30        40        50

           60          70            80        90       100        
pF1KB7 QPPPYFPPPYQQ--LAYSQSADP---YSHL-GEAYAAAINPLHQPAPTGSQQQAWPGRQS
       ::: :::::: :  : :.:. :    . :: :. :.. . :: :: :    : :: . ..
CCDS39 QPP-YFPPPYPQPPLPYGQAPDAAAAFPHLAGDPYGG-LAPLAQPQPP---QAAWAAPRA
                60        70        80         90          100     

      110       120        130       140       150       160       
pF1KB7 QEGAGLPSHHGRPAGLL-PHLSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAEN-LG
          :     : .: ::: :   .:   ... :::       :: :. :  : :::.  ::
CCDS39 AARA-----HEEPPGLLAPPARAL---GLDPRRDYATAVPRLL-HGLADGAHGLADAPLG
              110       120          130       140        150      

        170         180       190       200        210        220  
pF1KB7 LHDMPHQ--MDEVQNVDDQHLLLHDQTVIRKGPISMTKNPLN-LPCQKE-LVGAVMNPTE
       :  .     ....: .:.  . : ::.::.: ::    . :. :   :. :::.. :: :
CCDS39 LPGLAAAPGLEDLQAMDEPGMSLLDQSVIKKVPIPSKASSLSALSLAKDSLVGGITNPGE
        160       170       180       190       200       210      

            230       240       250       260       270       280  
pF1KB7 VFCSVPGRLSLLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKL
       ::::::::::::::::::::::.::::::::::::::::::::::::::::::: :::.:
CCDS39 VFCSVPGRLSLLSSTSKYKVTVGEVQRRLSPPECLNASLLGGVLRRAKSKNGGRCLRERL
        220       230       240       250       260       270      

            290       300       310       320       330       340  
pF1KB7 DKIGLNLPAGRRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGR
       .::::::::::::::.:::::::::::::::::::.::::.:::.: .:::: : : .  
CCDS39 EKIGLNLPAGRRKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAAAEYLCRQH-ADP
        280       290       300       310       320       330      

            350       360       370       380       390       400  
pF1KB7 NEMAARKNMLLAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGS
       .:. .::.:::::.:.::::..:..:::.: :.:: : .:: ..:.::.::::::::::.
CCDS39 GELHSRKSMLLAAKQICKEFADLMAQDRSPLGNSRPALILEPGVQSCLTHFSLITHGFGG
         340       350       360       370       380       390     

            410       420       430       440       450
pF1KB7 QAICAAVSALQNYIKEALIVIDKSYMNPGDQSPADSNKTLEKMEKHRK
        :::::..:.:::. :.:  .:: ...   .. ... :. ::  ::::
CCDS39 PAICAALTAFQNYLLESLKGLDKMFLSSVGSGHGET-KASEKDAKHRK
         400       410       420       430        440  

>>CCDS4933.1 TFAP2D gene_id:83741|Hs108|chr6              (452 aa)
 initn: 1114 init1: 708 opt: 1008  Z-score: 779.5  bits: 153.5 E(32554): 4.2e-37
Smith-Waterman score: 1082; 46.9% identity (68.5% similar) in 454 aa overlap (14-447:11-432)

               10        20         30          40        50       
pF1KB7 MLWKITDNVKYEEDCEDRHDGSSNGN-PRVPHLSSAGQHL--YSPAPPLSHTGVAEYQPP
                    : : :::::..    ..  : :...    :: . ::... ..     
CCDS49    MSTTFPGLVHDAEIRHDGSNSYRLMQLGCLESVANSTVAYSSSSPLTYSTTGTEFAS
                  10        20        30        40        50       

        60        70        80        90       100       110       
pF1KB7 PYFPPPYQQLAYSQSADPYSHLGEAYAAAINPLHQPAPTGSQQQAWPGRQSQEGAGLPSH
       :::   .:   :.    :  :  ...   ..  : :: : .  .    ..::.      :
CCDS49 PYFSTNHQ---YT----PLHH--QSFHYEFQHSH-PAVTPDAYSLNSLHHSQQYYQ-QIH
        60               70          80         90       100       

       120         130       140              150           160    
pF1KB7 HGRPAGL--LPHLSGLEAGAVSARR------DAYRRSDL-LLPHAHAL----DAAGL-AE
       ::.:. .  : .  .:... .. .:      ::::: :: :. :.       :   : . 
CCDS49 HGEPTDFINLHNARALKSSCLDEQRRELGCLDAYRRHDLSLMSHGSQYGMHPDQRLLPGP
        110       120       130       140       150       160      

           170        180        190        200       210       220
pF1KB7 NLGLHDMPHQMDEVQ-NVDDQ-HLLLHDQT-VIRKGPISMTKNPLNLPCQKELVGAVMNP
       .:::       :..: .:. :  :.:. :  :::.:            :       :.::
CCDS49 SLGL--AAAGADDLQGSVEAQCGLVLNGQGGVIRRGGT----------C-------VVNP
        170         180       190       200                        

              230       240       250       260       270       280
pF1KB7 TEVFCSVPGRLSLLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLRE
       :..::::::::::::::::::::.:::.::::::::::::::::.::::::::::: :::
CCDS49 TDLFCSVPGRLSLLSSTSKYKVTIAEVKRRLSPPECLNASLLGGILRRAKSKNGGRCLRE
       210       220       230       240       250       260       

              290       300       310       320       330       340
pF1KB7 KLDKIGLNLPAGRRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLG
       :::..::::::::::::.::::::::::::.::::::.:.::.:::.: :.:.:.: :. 
CCDS49 KLDRLGLNLPAGRRKAANVTLLTSLVEGEALHLARDFGYTCETEFPAKAVGEHLARQHME
       270       280       290       300       310       320       

              350       360       370       380       390       400
pF1KB7 GRNEMAARKNMLLAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGF
        ..:..:::.:.::..:.:::: .::::::.: :.:: .:.:. .::  :.:::::::::
CCDS49 -QKEQTARKKMILATKQICKEFQDLLSQDRSPLGSSRPTPILDLDIQRHLTHFSLITHGF
        330       340       350       360       370       380      

              410       420       430       440       450          
pF1KB7 GSQAICAAVSALQNYIKEALIVIDKSYMNPGDQSPADSNKTLEKMEKHRK          
       :. :::::.:..:. ..: :  ..: . .  . . :::..   . ::             
CCDS49 GTPAICAALSTFQTVLSEMLNYLEK-HTTHKNGGAADSGQGHANSEKAPLRKTSEAAVKE
        390       400       410        420       430       440     

CCDS49 GKTEKTD
         450  




450 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Thu Nov  3 15:15:15 2016 done: Thu Nov  3 15:15:15 2016
 Total Scan time:  3.540 Total Display time:  0.060

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com