Result of FASTA (ccds) for pFN21AB7989
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB7989, 442 aa
  1>>>pF1KB7989 442 - 442 aa - 442 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 10.6067+/-0.00105; mu= -4.5829+/- 0.063
 mean_var=371.3590+/-75.663, 0's: 0 Z-trim(114.9): 13  B-trim: 0 in 0/53
 Lambda= 0.066554
 statistics sampled from 15489 (15498) to 15489 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.781), E-opt: 0.2 (0.476), width:  16
 Scan time:  3.240

The best scores are:                                      opt bits E(32554)
CCDS393.2 TFAP2E gene_id:339488|Hs108|chr1         ( 442) 2975 299.4 4.8e-81
CCDS4934.2 TFAP2B gene_id:7021|Hs108|chr6          ( 460) 1737 180.5   3e-45
CCDS34337.1 TFAP2A gene_id:7020|Hs108|chr6         ( 431) 1539 161.5 1.5e-39
CCDS43422.1 TFAP2A gene_id:7020|Hs108|chr6         ( 433) 1539 161.5 1.5e-39
CCDS4510.1 TFAP2A gene_id:7020|Hs108|chr6          ( 437) 1539 161.5 1.5e-39
CCDS13454.1 TFAP2C gene_id:7022|Hs108|chr20        ( 450) 1367 145.0 1.5e-34
CCDS4933.1 TFAP2D gene_id:83741|Hs108|chr6         ( 452) 1069 116.4 6.1e-26


>>CCDS393.2 TFAP2E gene_id:339488|Hs108|chr1              (442 aa)
 initn: 2975 init1: 2975 opt: 2975  Z-score: 1568.4  bits: 299.4 E(32554): 4.8e-81
Smith-Waterman score: 2975; 100.0% identity (100.0% similar) in 442 aa overlap (1-442:1-442)

               10        20        30        40        50        60
pF1KB7 MLVHTYSAMERPDGLGAAAGGARLSSLPQAAYGPAPPLCHTPAATAAAEFQPPYFPPPYP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 MLVHTYSAMERPDGLGAAAGGARLSSLPQAAYGPAPPLCHTPAATAAAEFQPPYFPPPYP
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB7 QPPLPYGQAPDAAAAFPHLAGDPYGGLAPLAQPQPPQAAWAAPRAAARAHEEPPGLLAPP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 QPPLPYGQAPDAAAAFPHLAGDPYGGLAPLAQPQPPQAAWAAPRAAARAHEEPPGLLAPP
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB7 ARALGLDPRRDYATAVPRLLHGLADGAHGLADAPLGLPGLAAAPGLEDLQAMDEPGMSLL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 ARALGLDPRRDYATAVPRLLHGLADGAHGLADAPLGLPGLAAAPGLEDLQAMDEPGMSLL
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB7 DQSVIKKVPIPSKASSLSALSLAKDSLVGGITNPGEVFCSVPGRLSLLSSTSKYKVTVGE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 DQSVIKKVPIPSKASSLSALSLAKDSLVGGITNPGEVFCSVPGRLSLLSSTSKYKVTVGE
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB7 VQRRLSPPECLNASLLGGVLRRAKSKNGGRCLRERLEKIGLNLPAGRRKAANVTLLTSLV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 VQRRLSPPECLNASLLGGVLRRAKSKNGGRCLRERLEKIGLNLPAGRRKAANVTLLTSLV
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB7 EGEAVHLARDFGYVCETEFPAKAAAEYLCRQHADPGELHSRKSMLLAAKQICKEFADLMA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 EGEAVHLARDFGYVCETEFPAKAAAEYLCRQHADPGELHSRKSMLLAAKQICKEFADLMA
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB7 QDRSPLGNSRPALILEPGVQSCLTHFSLITHGFGGPAICAALTAFQNYLLESLKGLDKMF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 QDRSPLGNSRPALILEPGVQSCLTHFSLITHGFGGPAICAALTAFQNYLLESLKGLDKMF
              370       380       390       400       410       420

              430       440  
pF1KB7 LSSVGSGHGETKASEKDAKHRK
       ::::::::::::::::::::::
CCDS39 LSSVGSGHGETKASEKDAKHRK
              430       440  

>>CCDS4934.2 TFAP2B gene_id:7021|Hs108|chr6               (460 aa)
 initn: 1510 init1: 1243 opt: 1737  Z-score: 925.8  bits: 180.5 E(32554): 3e-45
Smith-Waterman score: 1737; 63.9% identity (80.5% similar) in 452 aa overlap (10-442:28-460)

                                 10        20         30        40 
pF1KB7                   MLVHTYSAMERPDGLGAAAGG-ARLSSLPQAAYGPAPPLCHT
                                  .: ::. . ..  ..:.:. :. :. :::: ::
CCDS49 MHSPPRDQAAIMLWKLVENVKYEDIYEDRHDGVPSHSSRLSQLGSVSQGPYSSAPPLSHT
               10        20        30        40        50        60

              50        60        70        80        90       100 
pF1KB7 PAATAAAEFQPPYFPPPYPQPPLPYGQAPDAAAAFPHLAGDPYGGLAPLAQPQPPQAAWA
       :..    .::::::::::   :::: :. :    . :. .:::. : :: :::  :  :.
CCDS49 PSS----DFQPPYFPPPY--QPLPYHQSQDP---YSHV-NDPYS-LNPLHQPQ--QHPWG
                   70          80            90        100         

             110       120           130          140        150   
pF1KB7 APRAAARAHEEPPGLLAPPARAL----GLDPRRDYATAVPR---LLHGLADGAH-GLADA
         :   ..  :  .::  :  ::    :::::::: . : :   :::.   :   :..:.
CCDS49 Q-RQRQEVGSEAGSLLPQPRAALPQLSGLDPRRDYHS-VRRPDVLLHSAHHGLDAGMGDS
        110       120       130       140        150       160     

           160       170          180       190       200       210
pF1KB7 PLGLPGLAAAPGLEDLQAMDEP---GMSLLDQSVIKKVPIPSKASSLSALSLAKDSLVGG
        :.: ::.  ::.::.:....    ::.:::::::::::.: :  :...: . ::...::
CCDS49 -LSLHGLGH-PGMEDVQSVEDANNSGMNLLDQSVIKKVPVPPK--SVTSLMMNKDGFLGG
          170        180       190       200         210       220 

               220       230       240       250       260         
pF1KB7 IT-NPGEVFCSVPGRLSLLSSTSKYKVTVGEVQRRLSPPECLNASLLGGVLRRAKSKNGG
       .. : :::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS49 MSVNTGEVFCSVPGRLSLLSSTSKYKVTVGEVQRRLSPPECLNASLLGGVLRRAKSKNGG
             230       240       250       260       270       280 

     270       280       290       300       310       320         
pF1KB7 RCLRERLEKIGLNLPAGRRKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAAAEYLC
       : ::::::::::::::::::::::::::::::::::::::::::.:::::::::..::: 
CCDS49 RSLRERLEKIGLNLPAGRRKAANVTLLTSLVEGEAVHLARDFGYICETEFPAKAVSEYLN
             290       300       310       320       330       340 

     330       340       350       360       370       380         
pF1KB7 RQHADPGELHSRKSMLLAAKQICKEFADLMAQDRSPLGNSRPALILEPGVQSCLTHFSLI
       :::.::..:::::.::::.::.::::.::.::::.:.:::::. :::::.::::::::::
CCDS49 RQHTDPSDLHSRKNMLLATKQLCKEFTDLLAQDRTPIGNSRPSPILEPGIQSCLTHFSLI
             350       360       370       380       390       400 

     390       400       410       420            430        440  
pF1KB7 THGFGGPAICAALTAFQNYLLESLKGLDKMFLSSVG-----SGHGE-TKASEKDAKHRK
       :::::.:::::::::.:::: :.:::.:::::...      ::.:  .:...:. ::::
CCDS49 THGFGAPAICAALTALQNYLTEALKGMDKMFLNNTTTNRHTSGEGPGSKTGDKEEKHRK
             410       420       430       440       450       460

>>CCDS34337.1 TFAP2A gene_id:7020|Hs108|chr6              (431 aa)
 initn: 1613 init1: 1256 opt: 1539  Z-score: 823.4  bits: 161.5 E(32554): 1.5e-39
Smith-Waterman score: 1711; 62.2% identity (78.7% similar) in 455 aa overlap (1-442:1-431)

               10        20           30        40        50       
pF1KB7 MLVHTYSAMERPDGLGAAAGGARLSSLP---QAAYGPAPPLCHTPAATAAAEFQPPYFPP
       ::::..:::.: ::  .. : ::: .:    :. :  :::: ::: :    .::::::::
CCDS34 MLVHSFSAMDRHDG--TSNGTARLPQLGTVGQSPYTSAPPLSHTPNA----DFQPPYFPP
               10          20        30        40            50    

        60        70        80        90        100       110      
pF1KB7 PYPQPPLPYGQAPDAAAAFPHLAGDPYGGLAPL-AQPQPPQAAWAAPRAAARAHEEPPGL
       :: ::  : .: :     . :. .:::. : :: ::::: . .: . :     . .  ::
CCDS34 PY-QPIYPQSQDP-----YSHV-NDPYS-LNPLHAQPQPQHPGWPGQR-----QSQESGL
            60             70          80        90            100 

            120       130       140       150       160       170  
pF1KB7 LAP----PARALGLDPRRDYATAVPRLLHGLADGAHGLADAPLGLPGLAAAPGLEDLQAM
       :      : .  ::::::::      ::::    . ::.:  :.. .:  :  .:..  .
CCDS34 LHTHRGLPHQLSGLDPRRDYRRH-EDLLHGPHALSSGLGD--LSIHSLPHA--IEEVPHV
             110       120        130       140           150      

            180       190          200       210       220         
pF1KB7 DEPGMSLLDQSVIKKVPIP-SKASS--LSALSLAKDSLVGGITNPGEVFCSVPGRLSLLS
       ..::... ::.:::: :.  ::..:  .::. . ::.: ::..::.::::::::::::::
CCDS34 EDPGINIPDQTVIKKGPVSLSKSNSNAVSAIPINKDNLFGGVVNPNEVFCSVPGRLSLLS
        160       170       180       190       200       210      

     230       240       250       260       270       280         
pF1KB7 STSKYKVTVGEVQRRLSPPECLNASLLGGVLRRAKSKNGGRCLRERLEKIGLNLPAGRRK
       :::::::::.::::::::::::::::::::::::::::::: :::.:.::::::::::::
CCDS34 STSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAGRRK
        220       230       240       250       260       270      

     290       300       310       320       330       340         
pF1KB7 AANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAAAEYLCRQHADPGELHSRKSMLLAAK
       ::::::::::::::::::::::::::::::::::.::.: :::.::.:  .::.::::.:
CCDS34 AANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAVAEFLNRQHSDPNEQVTRKNMLLATK
        280       290       300       310       320       330      

     350       360       370       380       390       400         
pF1KB7 QICKEFADLMAQDRSPLGNSRPALILEPGVQSCLTHFSLITHGFGGPAICAALTAFQNYL
       ::::::.::.::::::::::::  :::::.:::::::.::.::::.::.:::.::.::::
CCDS34 QICKEFTDLLAQDRSPLGNSRPNPILEPGIQSCLTHFNLISHGFGSPAVCAAVTALQNYL
        340       350       360       370       380       390      

     410       420       430         440  
pF1KB7 LESLKGLDKMFLSSVGSGHGET--KASEKDAKHRK
        :.::..:::.::.  ..: ..  :.:.:. ::::
CCDS34 TEALKAMDKMYLSNNPNSHTDNNAKSSDKEEKHRK
        400       410       420       430 

>>CCDS43422.1 TFAP2A gene_id:7020|Hs108|chr6              (433 aa)
 initn: 1544 init1: 1256 opt: 1539  Z-score: 823.4  bits: 161.5 E(32554): 1.5e-39
Smith-Waterman score: 1661; 61.9% identity (78.3% similar) in 446 aa overlap (10-442:12-433)

                 10        20           30        40        50     
pF1KB7   MLVHTYSAMERPDGLGAAAGGARLSSLP---QAAYGPAPPLCHTPAATAAAEFQPPYF
                  .: :  :.. : ::: .:    :. :  :::: ::: :    .::::::
CCDS43 MSILAKMGDWQDRHD--GTSNGTARLPQLGTVGQSPYTSAPPLSHTPNA----DFQPPYF
               10          20        30        40            50    

          60        70        80        90        100       110    
pF1KB7 PPPYPQPPLPYGQAPDAAAAFPHLAGDPYGGLAPL-AQPQPPQAAWAAPRAAARAHEEPP
       :::: ::  : .: :     . :. .:::. : :: ::::: . .: . :     . .  
CCDS43 PPPY-QPIYPQSQDP-----YSHV-NDPYS-LNPLHAQPQPQHPGWPGQR-----QSQES
            60             70          80        90            100 

              120       130       140       150       160       170
pF1KB7 GLLAP----PARALGLDPRRDYATAVPRLLHGLADGAHGLADAPLGLPGLAAAPGLEDLQ
       :::      : .  ::::::::      ::::    . ::.:  :.. .:  :  .:.. 
CCDS43 GLLHTHRGLPHQLSGLDPRRDYRRH-EDLLHGPHALSSGLGD--LSIHSLPHA--IEEVP
             110       120        130       140         150        

              180       190          200       210       220       
pF1KB7 AMDEPGMSLLDQSVIKKVPIP-SKASS--LSALSLAKDSLVGGITNPGEVFCSVPGRLSL
        ...::... ::.:::: :.  ::..:  .::. . ::.: ::..::.::::::::::::
CCDS43 HVEDPGINIPDQTVIKKGPVSLSKSNSNAVSAIPINKDNLFGGVVNPNEVFCSVPGRLSL
        160       170       180       190       200       210      

       230       240       250       260       270       280       
pF1KB7 LSSTSKYKVTVGEVQRRLSPPECLNASLLGGVLRRAKSKNGGRCLRERLEKIGLNLPAGR
       :::::::::::.::::::::::::::::::::::::::::::: :::.:.::::::::::
CCDS43 LSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAGR
        220       230       240       250       260       270      

       290       300       310       320       330       340       
pF1KB7 RKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAAAEYLCRQHADPGELHSRKSMLLA
       ::::::::::::::::::::::::::::::::::::.::.: :::.::.:  .::.::::
CCDS43 RKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAVAEFLNRQHSDPNEQVTRKNMLLA
        280       290       300       310       320       330      

       350       360       370       380       390       400       
pF1KB7 AKQICKEFADLMAQDRSPLGNSRPALILEPGVQSCLTHFSLITHGFGGPAICAALTAFQN
       .:::::::.::.::::::::::::  :::::.:::::::.::.::::.::.:::.::.::
CCDS43 TKQICKEFTDLLAQDRSPLGNSRPNPILEPGIQSCLTHFNLISHGFGSPAVCAAVTALQN
        340       350       360       370       380       390      

       410       420       430         440  
pF1KB7 YLLESLKGLDKMFLSSVGSGHGET--KASEKDAKHRK
       :: :.::..:::.::.  ..: ..  :.:.:. ::::
CCDS43 YLTEALKAMDKMYLSNNPNSHTDNNAKSSDKEEKHRK
        400       410       420       430   

>>CCDS4510.1 TFAP2A gene_id:7020|Hs108|chr6               (437 aa)
 initn: 1544 init1: 1256 opt: 1539  Z-score: 823.3  bits: 161.5 E(32554): 1.5e-39
Smith-Waterman score: 1661; 61.9% identity (78.3% similar) in 446 aa overlap (10-442:16-437)

                     10        20           30        40        50 
pF1KB7       MLVHTYSAMERPDGLGAAAGGARLSSLP---QAAYGPAPPLCHTPAATAAAEFQ
                      .: :  :.. : ::: .:    :. :  :::: ::: :    .::
CCDS45 MLWKLTDNIKYEDCEDRHD--GTSNGTARLPQLGTVGQSPYTSAPPLSHTPNA----DFQ
               10          20        30        40        50        

              60        70        80        90        100       110
pF1KB7 PPYFPPPYPQPPLPYGQAPDAAAAFPHLAGDPYGGLAPL-AQPQPPQAAWAAPRAAARAH
       :::::::: ::  : .: :     . :. .:::. : :: ::::: . .: . :     .
CCDS45 PPYFPPPY-QPIYPQSQDP-----YSHV-NDPYS-LNPLHAQPQPQHPGWPGQR-----Q
           60         70              80         90       100      

                  120       130       140       150       160      
pF1KB7 EEPPGLLAP----PARALGLDPRRDYATAVPRLLHGLADGAHGLADAPLGLPGLAAAPGL
        .  :::      : .  ::::::::      ::::    . ::.:  :.. .:  :  .
CCDS45 SQESGLLHTHRGLPHQLSGLDPRRDYRRH-EDLLHGPHALSSGLGD--LSIHSLPHA--I
             110       120       130        140         150        

        170       180       190          200       210       220   
pF1KB7 EDLQAMDEPGMSLLDQSVIKKVPIP-SKASS--LSALSLAKDSLVGGITNPGEVFCSVPG
       :..  ...::... ::.:::: :.  ::..:  .::. . ::.: ::..::.::::::::
CCDS45 EEVPHVEDPGINIPDQTVIKKGPVSLSKSNSNAVSAIPINKDNLFGGVVNPNEVFCSVPG
        160       170       180       190       200       210      

           230       240       250       260       270       280   
pF1KB7 RLSLLSSTSKYKVTVGEVQRRLSPPECLNASLLGGVLRRAKSKNGGRCLRERLEKIGLNL
       :::::::::::::::.::::::::::::::::::::::::::::::: :::.:.::::::
CCDS45 RLSLLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNL
        220       230       240       250       260       270      

           290       300       310       320       330       340   
pF1KB7 PAGRRKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAAAEYLCRQHADPGELHSRKS
       ::::::::::::::::::::::::::::::::::::::::.::.: :::.::.:  .::.
CCDS45 PAGRRKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAVAEFLNRQHSDPNEQVTRKN
        280       290       300       310       320       330      

           350       360       370       380       390       400   
pF1KB7 MLLAAKQICKEFADLMAQDRSPLGNSRPALILEPGVQSCLTHFSLITHGFGGPAICAALT
       ::::.:::::::.::.::::::::::::  :::::.:::::::.::.::::.::.:::.:
CCDS45 MLLATKQICKEFTDLLAQDRSPLGNSRPNPILEPGIQSCLTHFNLISHGFGSPAVCAAVT
        340       350       360       370       380       390      

           410       420       430         440  
pF1KB7 AFQNYLLESLKGLDKMFLSSVGSGHGET--KASEKDAKHRK
       :.:::: :.::..:::.::.  ..: ..  :.:.:. ::::
CCDS45 ALQNYLTEALKAMDKMYLSNNPNSHTDNNAKSSDKEEKHRK
        400       410       420       430       

>>CCDS13454.1 TFAP2C gene_id:7022|Hs108|chr20             (450 aa)
 initn: 1238 init1: 714 opt: 1367  Z-score: 733.9  bits: 145.0 E(32554): 1.5e-34
Smith-Waterman score: 1367; 54.6% identity (72.8% similar) in 452 aa overlap (10-442:17-450)

                      10        20           30        40        50
pF1KB7        MLVHTYSAMERPDGLGAAAGGAR---LSSLPQAAYGPAPPLCHTPAATAAAEF
                       .: :  :.. :. :   :::  :  :.::::: ::    ..::.
CCDS13 MLWKITDNVKYEEDCEDRHD--GSSNGNPRVPHLSSAGQHLYSPAPPLSHT----GVAEY
               10        20          30        40            50    

                60        70        80         90          100     
pF1KB7 QPP-YFPPPYPQPPLPYGQAPDAAAAFPHLAGDPYGG-LAPLAQPQPP---QAAWAAPRA
       ::: :::::: :  : :.:. :    . :: :. :.. . :: :: :    : :: . ..
CCDS13 QPPPYFPPPYQQ--LAYSQSADP---YSHL-GEAYAAAINPLHQPAPTGSQQQAWPGRQS
           60          70            80        90       100        

              110       120          130       140        150      
pF1KB7 AARA-----HEEPPGLLAPPARAL---GLDPRRDYATAVPRLL-HGLADGAHGLADAPLG
          :     : .: ::: :   .:   ... :::       :: :. :  : :::.  ::
CCDS13 QEGAGLPSHHGRPAGLL-PHLSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAEN-LG
      110       120        130       140       150       160       

        160       170       180       190       200       210      
pF1KB7 LPGLAAAPGLEDLQAMDEPGMSLLDQSVIKKVPIPSKASSLSALSLAKDSLVGGITNPGE
       :  .     ....: .:.  . : ::.::.: ::    . :. :   :. :::.. :: :
CCDS13 LHDMPHQ--MDEVQNVDDQHLLLHDQTVIRKGPISMTKNPLN-LPCQKE-LVGAVMNPTE
        170         180       190       200        210        220  

        220       230       240       250       260       270      
pF1KB7 VFCSVPGRLSLLSSTSKYKVTVGEVQRRLSPPECLNASLLGGVLRRAKSKNGGRCLRERL
       ::::::::::::::::::::::.::::::::::::::::::::::::::::::: :::.:
CCDS13 VFCSVPGRLSLLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKL
            230       240       250       260       270       280  

        280       290       300       310       320       330      
pF1KB7 EKIGLNLPAGRRKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAAAEYLCRQH-ADP
       .::::::::::::::.:::::::::::::::::::.::::.:::.: .:::: : : .  
CCDS13 DKIGLNLPAGRRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGR
            290       300       310       320       330       340  

         340       350       360       370       380       390     
pF1KB7 GELHSRKSMLLAAKQICKEFADLMAQDRSPLGNSRPALILEPGVQSCLTHFSLITHGFGG
       .:. .::.:::::.:.::::..:..:::.: :.:: : .:: ..:.::.::::::::::.
CCDS13 NEMAARKNMLLAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGS
            350       360       370       380       390       400  

         400       410       420       430        440  
pF1KB7 PAICAALTAFQNYLLESLKGLDKMFLSSVGSGHGET-KASEKDAKHRK
        :::::..:.:::. :.:  .:: ...   .. ... :. ::  ::::
CCDS13 QAICAAVSALQNYIKEALIVIDKSYMNPGDQSPADSNKTLEKMEKHRK
            410       420       430       440       450

>>CCDS4933.1 TFAP2D gene_id:83741|Hs108|chr6              (452 aa)
 initn: 1152 init1: 1051 opt: 1069  Z-score: 579.2  bits: 116.4 E(32554): 6.1e-26
Smith-Waterman score: 1122; 49.9% identity (66.2% similar) in 429 aa overlap (31-442:39-437)

               10        20        30        40        50        60
pF1KB7 MLVHTYSAMERPDGLGAAAGGARLSSLPQAAYGPAPPLCHTPAATAAAEFQPPYFPPPYP
                                     ::. . :: ..   :...::  :::   . 
CCDS49 VHDAEIRHDGSNSYRLMQLGCLESVANSTVAYSSSSPLTYS---TTGTEFASPYFSTNHQ
       10        20        30        40           50        60     

               70         80        90         100       110       
pF1KB7 QPPLPYGQAP-DAAAAFPHLAGDPYGGLAPLAQPQP--PQAAWAAPRAAARAHEE---PP
         :: . .   .   . : .. : :. :  : . :    :   . :      :.      
CCDS49 YTPLHHQSFHYEFQHSHPAVTPDAYS-LNSLHHSQQYYQQIHHGEPTDFINLHNARALKS
          70        80        90        100       110       120    

          120        130       140       150       160          170
pF1KB7 GLLAPPARALG-LDPRRDYATAVPRLLHGLADGAHGLADAPLGLPGLA---AAPGLEDLQ
       . :    : :: ::  : .  ..  . ::   : :   :  : ::: .   :: : .:::
CCDS49 SCLDEQRRELGCLDAYRRHDLSL--MSHGSQYGMH--PDQRL-LPGPSLGLAAAGADDLQ
          130       140         150         160        170         

                180        190       200       210         220     
pF1KB7 AMDEP--GMSLLDQS-VIKKVPIPSKASSLSALSLAKDSLVGG--ITNPGEVFCSVPGRL
       .  :   :. :  :. ::..                     ::  ..:: ..::::::::
CCDS49 GSVEAQCGLVLNGQGGVIRR---------------------GGTCVVNPTDLFCSVPGRL
     180       190                            200       210        

         230       240       250       260       270       280     
pF1KB7 SLLSSTSKYKVTVGEVQRRLSPPECLNASLLGGVLRRAKSKNGGRCLRERLEKIGLNLPA
       ::::::::::::..::.::::::::::::::::.:::::::::::::::.:...::::::
CCDS49 SLLSSTSKYKVTIAEVKRRLSPPECLNASLLGGILRRAKSKNGGRCLREKLDRLGLNLPA
      220       230       240       250       260       270        

         290       300       310       320       330       340     
pF1KB7 GRRKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAAAEYLCRQHADPGELHSRKSML
       :::::::::::::::::::.::::::::.:::::::::..:.: ::: .  :  .::.:.
CCDS49 GRRKAANVTLLTSLVEGEALHLARDFGYTCETEFPAKAVGEHLARQHMEQKEQTARKKMI
      280       290       300       310       320       330        

         350       360       370       380       390       400     
pF1KB7 LAAKQICKEFADLMAQDRSPLGNSRPALILEPGVQSCLTHFSLITHGFGGPAICAALTAF
       ::.::::::: ::..:::::::.:::. ::.  .:  :::::::::::: :::::::..:
CCDS49 LATKQICKEFQDLLSQDRSPLGSSRPTPILDLDIQRHLTHFSLITHGFGTPAICAALSTF
      340       350       360       370       380       390        

         410       420         430       440                 
pF1KB7 QNYLLESLKGLDKMFLSSVGSG--HGETKASEKDAKHRK               
       :. : : :. :.:    . :..   :. .:. . :  ::               
CCDS49 QTVLSEMLNYLEKHTTHKNGGAADSGQGHANSEKAPLRKTSEAAVKEGKTEKTD
      400       410       420       430       440       450  




442 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Mon Nov  7 16:47:02 2016 done: Mon Nov  7 16:47:03 2016
 Total Scan time:  3.240 Total Display time:  0.030

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com