Result of FASTA (ccds) for pF1KB9729
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB9729, 446 aa
  1>>>pF1KB9729 446 - 446 aa - 446 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 7.5704+/-0.000797; mu= 10.4302+/- 0.048
 mean_var=198.2568+/-39.552, 0's: 0 Z-trim(114.9): 49  B-trim: 0 in 0/53
 Lambda= 0.091088
 statistics sampled from 15384 (15433) to 15384 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.793), E-opt: 0.2 (0.474), width:  16
 Scan time:  3.390

The best scores are:                                      opt bits E(32554)
CCDS32449.1 IRX6 gene_id:79190|Hs108|chr16         ( 446) 3034 410.8 1.4e-114
CCDS3867.1 IRX4 gene_id:50805|Hs108|chr5           ( 519)  876 127.3 3.7e-29
CCDS10750.1 IRX3 gene_id:79191|Hs108|chr16         ( 501)  626 94.4 2.8e-19
CCDS3868.1 IRX2 gene_id:153572|Hs108|chr5          ( 471)  552 84.6 2.3e-16
CCDS75225.1 IRX4 gene_id:50805|Hs108|chr5          ( 545)  518 80.2 5.6e-15
CCDS58462.1 IRX5 gene_id:10265|Hs108|chr16         ( 482)  503 78.2   2e-14
CCDS10751.1 IRX5 gene_id:10265|Hs108|chr16         ( 483)  503 78.2   2e-14
CCDS34132.1 IRX1 gene_id:79192|Hs108|chr5          ( 480)  494 77.0 4.5e-14


>>CCDS32449.1 IRX6 gene_id:79190|Hs108|chr16              (446 aa)
 initn: 3034 init1: 3034 opt: 3034  Z-score: 2170.4  bits: 410.8 E(32554): 1.4e-114
Smith-Waterman score: 3034; 100.0% identity (100.0% similar) in 446 aa overlap (1-446:1-446)

               10        20        30        40        50        60
pF1KB9 MSFPHFGHPYRGASQFLASASSSTTCCESTQRSVSDVASGSTPAPALCCAPYDSRLLGSA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MSFPHFGHPYRGASQFLASASSSTTCCESTQRSVSDVASGSTPAPALCCAPYDSRLLGSA
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB9 RPELGAALGIYGAPYAAAAAAQSYPGYLPYSPEPPSLYGALNPQYEFKEAAGSFTSSLAQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 RPELGAALGIYGAPYAAAAAAQSYPGYLPYSPEPPSLYGALNPQYEFKEAAGSFTSSLAQ
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB9 PGAYYPYERTLGQYQYERYGAVELSGAGRRKNATRETTSTLKAWLNEHRKNPYPTKGEKI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 PGAYYPYERTLGQYQYERYGAVELSGAGRRKNATRETTSTLKAWLNEHRKNPYPTKGEKI
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB9 MLAIITKMTLTQVSTWFANARRRLKKENKMTWAPKNKGGEERKAEGGEEDSLGCLTADTK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MLAIITKMTLTQVSTWFANARRRLKKENKMTWAPKNKGGEERKAEGGEEDSLGCLTADTK
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB9 EVTASQEARGLRLSDLEDLEEEEEEEEEAEDEEVVATAGDRLTEFRKGAQSLPGPCAAAR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 EVTASQEARGLRLSDLEDLEEEEEEEEEAEDEEVVATAGDRLTEFRKGAQSLPGPCAAAR
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB9 EGRLERRECGLAAPRFSFNDPSGSEEADFLSAETGSPRLTMHYPCLEKPRIWSLAHTATA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 EGRLERRECGLAAPRFSFNDPSGSEEADFLSAETGSPRLTMHYPCLEKPRIWSLAHTATA
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB9 SAVEGAPPARPRPRSPECRMIPGQPPASARRLSVPRDSACDESSCIPKAFGNPKFALQGL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 SAVEGAPPARPRPRSPECRMIPGQPPASARRLSVPRDSACDESSCIPKAFGNPKFALQGL
              370       380       390       400       410       420

              430       440      
pF1KB9 PLNCAPCPRRSEPVVQCQYPSGAEAG
       ::::::::::::::::::::::::::
CCDS32 PLNCAPCPRRSEPVVQCQYPSGAEAG
              430       440      

>>CCDS3867.1 IRX4 gene_id:50805|Hs108|chr5                (519 aa)
 initn: 820 init1: 452 opt: 876  Z-score: 636.9  bits: 127.3 E(32554): 3.7e-29
Smith-Waterman score: 973; 44.1% identity (66.4% similar) in 440 aa overlap (1-407:1-431)

               10        20        30        40        50        60
pF1KB9 MSFPHFGHPYRGASQFLASASSSTTCCESTQRSVSDVASGSTPAPALCCAPYDSRLLGSA
       ::.:.::.:: .: ::: ...: .:::::  :...: . ...    . :  :.::::..:
CCDS38 MSYPQFGYPYSSAPQFLMATNSLSTCCESGGRTLADSGPAASAQAPVYCPVYESRLLATA
               10        20        30        40        50        60

                 70        80        90       100       110        
pF1KB9 RPELG--AALGIYGAPYAAAAAAQSYPGYLPYSPEPPSLYGALNPQYEFKEAAGSFTSSL
       : ::.  ::::.::.::...   :.: .:. :. :  ..: .:: ... :...::  ..:
CCDS38 RHELNSAAALGVYGGPYGGS---QGYGNYVTYGSEASAFY-SLN-SFDSKDGSGSAHGGL
               70        80           90        100        110     

      120        130       140       150       160       170       
pF1KB9 AQPGA-YYPYERTLGQYQYERYGAVELSGAGRRKNATRETTSTLKAWLNEHRKNPYPTKG
       :  .: ::::: .:::: :.:::... ::. :::::::::::::::::.:::::::::::
CCDS38 APAAAAYYPYEPALGQYPYDRYGTMD-SGT-RRKNATRETTSTLKAWLQEHRKNPYPTKG
         120       130       140         150       160       170   

       180       190       200       210       220              230
pF1KB9 EKIMLAIITKMTLTQVSTWFANARRRLKKENKMTWAPKNKGGEERKA-------EGGEED
       ::::::::::::::::::::::::::::::::::: :.:: ..:..        :::::.
CCDS38 EKIMLAIITKMTLTQVSTWFANARRRLKKENKMTWPPRNKCADEKRPYAEGEEEEGGEEE
           180       190       200       210       220       230   

              240        250       260       270                   
pF1KB9 SLGCLTADTKEVT-ASQEARGLRLSDLEDLEEEEEEEEEAEDE----------EVVATAG
       .      ..:..  ...: . :.::::.:..  : :    : .          : : .: 
CCDS38 AREEPLKSSKNAEPVGKEEKELELSDLDDFDPLEAEPPACELKPPFHSLDGGLERVPAAP
           240       250       260       270       280       290   

     280         290       300        310       320       330      
pF1KB9 DRLTEFRKGA--QSLPGPCAAAREGRLER-RECGLAAPRFSFNDPSGSEEADFLSAETGS
       :  ..  .::  .:: .  .:: .  ::: : :  .:       :..    .   :. : 
CCDS38 DGPVKEASGALRMSLAAGGGAALDEDLERARSCLRSAAAGPEPLPGAEGGPQVCEAKLGF
           300       310       320       330       340       350   

        340       350       360       370          380             
pF1KB9 PRLTMHYPCLEKPRIWSLAHTATASAVEGAPPARPRPRSPEC---RMIPGQP------PA
                  :::::::::::::.:.  :  .  . . : :   :. :. :      ::
CCDS38 VPAGASAGLEAKPRIWSLAHTATAAAA--AATSLSQTEFPSCMLKRQGPAAPAAVSSAPA
           360       370       380         390       400       410 

       390       400       410       420       430       440       
pF1KB9 SARRLSVPRDSACDESSCIPKAFGNPKFALQGLPLNCAPCPRRSEPVVQCQYPSGAEAG 
       ..  ...:...: :. .  :                                        
CCDS38 TSPSVALPHSGALDRHQDSPVTSLRNWVDGVFHDPILRHSTLNQAWATAKGALLDPGPLG
             420       430       440       450       460       470 

>>CCDS10750.1 IRX3 gene_id:79191|Hs108|chr16              (501 aa)
 initn: 632 init1: 468 opt: 626  Z-score: 459.6  bits: 94.4 E(32554): 2.8e-19
Smith-Waterman score: 699; 40.9% identity (58.6% similar) in 418 aa overlap (57-429:36-421)

         30        40        50        60               70         
pF1KB9 CESTQRSVSDVASGSTPAPALCCAPYDSRLLGSARPELGAA-------LGIYGAPYAAAA
                                     ::..  ::.:.        ..:::::::::
CCDS10 LGYQYIRPLYPSERPGAAGGSGGSAGARGGLGAGASELNASGSLSNVLSSVYGAPYAAAA
          10        20        30        40        50        60     

      80           90       100       110           120        130 
pF1KB9 AA---QSYPGYLPYSPEPPSLYGALNPQYEFKEAAG----SFTSSLAQPG-AYYPYERTL
       ::   :.: ..:::. : : ..  :. :::.:.. :    . .... .:  :.:::    
CCDS10 AAAAAQGYGAFLPYAAELP-IFPQLGAQYELKDSPGVQHPAAAAAFPHPHPAFYPY----
          70        80         90       100       110       120    

             140       150       160       170       180       190 
pF1KB9 GQYQYERYGAVELSGAGRRKNATRETTSTLKAWLNEHRKNPYPTKGEKIMLAIITKMTLT
       ::::.        .  .: ::::::.::::::::::::::::::::::::::::::::::
CCDS10 GQYQF--------GDPSRPKNATRESTSTLKAWLNEHRKNPYPTKGEKIMLAIITKMTLT
                      130       140       150       160       170  

             200       210       220                 230       240 
pF1KB9 QVSTWFANARRRLKKENKMTWAPKNKGGEERKAEGGE----------EDSLGCLTADTKE
       :::::::::::::::::::::::...  :: .: :.:          ::.   :  . .:
CCDS10 QVSTWFANARRRLKKENKMTWAPRSRTDEEGNAYGSEREEEDEEEDEEDGKRELELEEEE
            180       190       200       210       220       230  

             250         260       270       280       290         
pF1KB9 VTASQEARGLR--LSDLEDLEEEEEEEEEAEDEEVVATAGDRLTEFRKGAQSLPGPCAAA
       . . .:  : .   .: :: : . :. . :  :  .. ::   .  : :  .: :: . .
CCDS10 LGGEEEDTGGEGLADDDEDEEIDLENLDGAATEPELSLAG---AARRDGDLGL-GPISDS
            240       250       260       270          280         

     300       310          320       330       340                
pF1KB9 REGRLERRECGLAA---PRFSFNDPSGSEEADFLSAETGSPRLTMHYPC---------LE
       ...  :    ::     : .:.  :.    :   :    :: ...  ::         :.
CCDS10 KNSDSEDSSEGLEDRPLPVLSLA-PAPPPVA-VASPSLPSPPVSLD-PCAPAPAPASALQ
      290       300       310         320       330        340     

       350       360       370       380            390       400  
pF1KB9 KPRIWSLAHTATASAVEGAPPARPRPRSPECRMIPGQPPA-----SARRLSVPRDSACDE
       ::.:::::.:::.       :  :: :::      :.::.     :: .:: :  .:   
CCDS10 KPKIWSLAETATS-------PDNPR-RSPP--GAGGSPPGAAVAPSALQLS-PAAAAAAA
         350              360          370       380        390    

            410        420       430       440                     
pF1KB9 SSCIPKAFGN-PKFALQGLPLNCAPCPRRSEPVVQCQYPSGAEAG               
          .   .:. : .. . .: .  : ::                                
CCDS10 HRLVSAPLGKFPAWTNRPFP-GPPPGPRLHPLSLLGSAPPHLLGLPGAAGHPAAAAAFAR
          400       410        420       430       440       450   

>>CCDS3868.1 IRX2 gene_id:153572|Hs108|chr5               (471 aa)
 initn: 574 init1: 451 opt: 552  Z-score: 407.4  bits: 84.6 E(32554): 2.3e-16
Smith-Waterman score: 598; 36.6% identity (55.7% similar) in 404 aa overlap (49-422:20-407)

       20        30        40        50        60        70        
pF1KB9 SASSSTTCCESTQRSVSDVASGSTPAPALCCAPYDSRLLGSARPELGAALGIYGAPYAAA
                                     :  : .  :.. : :         :  :..
CCDS38            MSYPQGYLYQAPGSLALYSCPAYGASALAAPRSE-------ELARSASG
                          10        20        30               40  

       80        90       100        110       120       130       
pF1KB9 AAAQSYPGYLPYSPEPPSLYGA-LNPQYEFKEAAGSFTSSLAQPGAYYPYERTLGQYQYE
       .: . :::   .. .  . .:. :. . .   ::..: : .. :   .    : :  .:.
CCDS38 SAFSPYPGSAAFTAQAATGFGSPLQYSADAAAAAAGFPSYMGAPYDAHTTGMT-GAISYH
             50        60        70        80        90        100 

       140           150       160       170       180       190   
pF1KB9 RYGAV----ELSGAGRRKNATRETTSTLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQV
        ::..    .:.  . ::::::..:.::::::::::::::::::::::::::::::::::
CCDS38 PYGSAAYPYQLNDPAYRKNATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQV
             110       120       130       140       150       160 

           200       210       220       230       240        250  
pF1KB9 STWFANARRRLKKENKMTWAPKNKGGEERKAEGGEEDSLGCLTADTKEVT-ASQEARGLR
       :::::::::::::::::::::.::. .: . ::    :       ..: : .: : .:. 
CCDS38 STWFANARRRLKKENKMTWAPRNKSEDEDEDEGDATRSKDESPDKAQEGTETSAEDEGIS
             170       180       190       200       210       220 

            260       270       280           290       300        
pF1KB9 LSDLEDLEEEEEEEEEAEDEEVVATAGDRL----TEFRKGAQSLPGPCAAAREGRLERRE
       :    :   ..    :.. :..   ::: :    .: .   ..:       .::  ::  
CCDS38 LH--VDSLTDHSCSAESDGEKLPCRAGDPLCESGSECKDKYDDLEDDEDDDEEG--ER--
               230       240       250       260       270         

      310       320       330               340           350      
pF1KB9 CGLAAPRFSFNDPSGSEEADFLS-----AETG---SPRLTMHYPCLE----KPRIWSLAH
        ::: :.   ..:  . :: .::     :  :   .:. .   :       ::..::::.
CCDS38 -GLAPPKPVTSSPLTGLEAPLLSPPPEAAPRGGRKTPQGSRTSPGAPPPASKPKLWSLAE
          280       290       300       310       320       330    

        360             370       380         390       400        
pF1KB9 TATASAVEGA------PPARPRPRSPECRMIP--GQPPASARRLSVPRDSACDESSCIPK
        ::..  . .      ::. :   .:     :  :.:  ..  :. :   .    .   .
CCDS38 IATSDLKQPSLGPGCGPPGLPAAAAPASTGAPPGGSPYPASPLLGRPLYYTSPFYGNYTN
          340       350       360       370       380       390    

      410       420       430       440                            
pF1KB9 AFGNPKFALQGLPLNCAPCPRRSEPVVQCQYPSGAEAG                      
        .:: . ::::  :                                              
CCDS38 -YGNLNAALQGQGLLRYNSAAAAPGEALHTAPKAASDAGKAGAHPLESHYRSPGGGYEPK
           400       410       420       430       440       450   

>>CCDS75225.1 IRX4 gene_id:50805|Hs108|chr5               (545 aa)
 initn: 837 init1: 452 opt: 518  Z-score: 382.4  bits: 80.2 E(32554): 5.6e-15
Smith-Waterman score: 921; 41.8% identity (62.7% similar) in 464 aa overlap (1-407:1-457)

               10        20        30        40        50        60
pF1KB9 MSFPHFGHPYRGASQFLASASSSTTCCESTQRSVSDVASGSTPAPALCCAPYDSRLLGSA
       ::.:.::.:: .: ::: ...: .:::::  :...: . ...    . :  :.::::..:
CCDS75 MSYPQFGYPYSSAPQFLMATNSLSTCCESGGRTLADSGPAASAQAPVYCPVYESRLLATA
               10        20        30        40        50        60

                 70        80        90       100       110        
pF1KB9 RPELG--AALGIYGAPYAAAAAAQSYPGYLPYSPEPPSLYGALNPQYEFKEAAGSFTSSL
       : ::.  ::::.::.::...   :.: .:. :. :  ..: .:: ... :...::  ..:
CCDS75 RHELNSAAALGVYGGPYGGS---QGYGNYVTYGSEASAFY-SLN-SFDSKDGSGSAHGGL
               70        80           90        100        110     

      120        130       140                               150   
pF1KB9 AQPGA-YYPYERTLGQYQYERYG----------AVELSGAGR--------------RKNA
       :  .: ::::: .:::: :.:            ...::: ::              ::::
CCDS75 APAAAAYYPYEPALGQYPYDRIKRLGGHPHKGIGLDLSGLGRSPGSLYGTMDSGTRRKNA
         120       130       140       150       160       170     

           160       170       180       190       200       210   
pF1KB9 TRETTSTLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQVSTWFANARRRLKKENKMTWA
       ::::::::::::.:::::::::::::::::::::::::::::::::::::::::::::: 
CCDS75 TRETTSTLKAWLQEHRKNPYPTKGEKIMLAIITKMTLTQVSTWFANARRRLKKENKMTWP
         180       190       200       210       220       230     

           220              230       240        250       260     
pF1KB9 PKNKGGEERKA-------EGGEEDSLGCLTADTKEVT-ASQEARGLRLSDLEDLEEEEEE
       :.:: ..:..        :::::..      ..:..  ...: . :.::::.:..  : :
CCDS75 PRNKCADEKRPYAEGEEEEGGEEEAREEPLKSSKNAEPVGKEEKELELSDLDDFDPLEAE
         240       250       260       270       280       290     

         270                 280         290       300        310  
pF1KB9 EEEAEDE----------EVVATAGDRLTEFRKGA--QSLPGPCAAAREGRLER-RECGLA
           : .          : : .: :  ..  .::  .:: .  .:: .  ::: : :  .
CCDS75 PPACELKPPFHSLDGGLERVPAAPDGPVKEASGALRMSLAAGGGAALDEDLERARSCLRS
         300       310       320       330       340       350     

            320       330       340       350       360       370  
pF1KB9 APRFSFNDPSGSEEADFLSAETGSPRLTMHYPCLEKPRIWSLAHTATASAVEGAPPARPR
       :       :..    .   :. :            :::::::::::::.:.  :  .  .
CCDS75 AAAGPEPLPGAEGGPQVCEAKLGFVPAGASAGLEAKPRIWSLAHTATAAAA--AATSLSQ
         360       370       380       390       400         410   

               380             390       400       410       420   
pF1KB9 PRSPEC---RMIPGQP------PASARRLSVPRDSACDESSCIPKAFGNPKFALQGLPLN
        . : :   :. :. :      ::..  ...:...: :. .  :                
CCDS75 TEFPSCMLKRQGPAAPAAVSSAPATSPSVALPHSGALDRHQDSPVTSLRNWVDGVFHDPI
           420       430       440       450       460       470   

           430       440                                           
pF1KB9 CAPCPRRSEPVVQCQYPSGAEAG                                     
                                                                   
CCDS75 LRHSTLNQAWATAKGALLDPGPLGRSLGAGANVLTAPLARAFPPAVPQDAPAAGAARELL
           480       490       500       510       520       530   

>>CCDS58462.1 IRX5 gene_id:10265|Hs108|chr16              (482 aa)
 initn: 561 init1: 433 opt: 503  Z-score: 372.4  bits: 78.2 E(32554): 2e-14
Smith-Waterman score: 587; 36.0% identity (51.6% similar) in 428 aa overlap (49-442:20-394)

       20        30        40        50        60          70      
pF1KB9 SASSSTTCCESTQRSVSDVASGSTPAPALCCAPYDSRLLGSARP-ELG-AALGIYGAPYA
                                     :  :.. .... :  ::: .. :   .:::
CCDS58            MSYPQGYLYQPSASLALYSCPAYSTSVISGPRTDELGRSSSGSAFSPYA
                          10        20        30        40         

         80            90       100       110          120         
pF1KB9 AAAA-AQSYPGY---LPYSPEPPSLYGALNPQYEFKEAAGS---FTSSLAQPGAYYPYER
       ...: .   :::   : :. .: .  .:      :.  .::    : ..:   .:.::  
CCDS58 GSTAFTAPSPGYNSHLQYGADPAAAAAA-----AFSSYVGSPYDHTPGMAGSLGYHPYAA
      50        60        70             80        90       100    

     130       140       150       160       170       180         
pF1KB9 TLGQYQYERYGAVELSGAGRRKNATRETTSTLKAWLNEHRKNPYPTKGEKIMLAIITKMT
        ::.: :        .  . ::::::..:.::::::::::::::::::::::::::::::
CCDS58 PLGSYPY--------GDPAYRKNATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMT
          110               120       130       140       150      

     190       200       210       220       230       240         
pF1KB9 LTQVSTWFANARRRLKKENKMTWAPKNKGGEERKAEGGEEDSLGCLTADTKEVTASQEAR
       :::::::::::::::::::::::.:.:.. .:.     ::...     :  :   . : .
CCDS58 LTQVSTWFANARRRLKKENKMTWTPRNRSEDEE-----EEENIDLEKNDEDE-PQKPEDK
        160       170       180            190       200        210

     250       260       270       280       290       300         
pF1KB9 GLRLSDLEDLEEEEEEEEEAEDEEVVATAGDRLTEFRKGAQSLPGPCAAAREGRLERREC
       :            . :  ::  :. .:.. .::       :. : : .   :: :   . 
CCDS58 G------------DPEGPEAGAEQKAASGCERL-------QGPPTPAGKETEGSLSDSD-
                          220       230              240       250 

     310       320       330       340       350       360         
pF1KB9 GLAAPRFSFNDPSGSEEADFLSAETGSPRLTMHYPCLEKPRIWSLAHTATASAVEGAPPA
               :..: .  . : :.   : ::     :    :    ::.  .     :::  
CCDS58 --------FKEPPSEGRLDALQ---GPPRTGGPSP--AGPAAARLAEDPAPHYPAGAPAP
                      260          270         280       290       

     370       380               390                  400          
pF1KB9 RPRPRSPECRMIPG--------QPPASARRLSVPR-----------DSACD-----ESS-
        :.: . :    ::         ::     :. :.           :.. :     :.: 
CCDS58 GPHPAAGEVPPGPGGPSVIHSPPPPPPPAVLAKPKLWSLAEIATSSDKVKDGGGGNEGSP
       300       310       320       330       340       350       

          410       420       430       440                        
pF1KB9 CIPKAFGNPKFALQGLPLNCAPCPRRSEPVVQCQYPSGAEAG                  
       : :        :: :   . :: : :: : .:: .:.:                      
CCDS58 CPPCPGPIAGQALGGSRASPAPAPSRS-PSAQCPFPGGTVLSRPLYYTAPFYPGYTNYGS
       360       370       380        390       400       410      

CCDS58 FGHLHGHPGPGPGPTTGPGSHFNGLNQTVLNRADALAKDPKMLRSQSQLDLCKDSPYELK
        420       430       440       450       460       470      

>>CCDS10751.1 IRX5 gene_id:10265|Hs108|chr16              (483 aa)
 initn: 524 init1: 433 opt: 503  Z-score: 372.4  bits: 78.2 E(32554): 2e-14
Smith-Waterman score: 588; 36.1% identity (53.9% similar) in 410 aa overlap (49-442:20-395)

       20        30        40        50        60          70      
pF1KB9 SASSSTTCCESTQRSVSDVASGSTPAPALCCAPYDSRLLGSARP-ELG-AALGIYGAPYA
                                     :  :.. .... :  ::: .. :   .:::
CCDS10            MSYPQGYLYQPSASLALYSCPAYSTSVISGPRTDELGRSSSGSAFSPYA
                          10        20        30        40         

         80            90       100       110          120         
pF1KB9 AAAA-AQSYPGY---LPYSPEPPSLYGALNPQYEFKEAAGS---FTSSLAQPGAYYPYER
       ...: .   :::   : :. .: .  .:      :.  .::    : ..:   .:.::  
CCDS10 GSTAFTAPSPGYNSHLQYGADPAAAAAA-----AFSSYVGSPYDHTPGMAGSLGYHPYAA
      50        60        70             80        90       100    

     130       140       150       160       170       180         
pF1KB9 TLGQYQYERYGAVELSGAGRRKNATRETTSTLKAWLNEHRKNPYPTKGEKIMLAIITKMT
        ::.: :        .  . ::::::..:.::::::::::::::::::::::::::::::
CCDS10 PLGSYPY--------GDPAYRKNATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMT
          110               120       130       140       150      

     190       200       210       220       230       240         
pF1KB9 LTQVSTWFANARRRLKKENKMTWAPKNKGGEERKAEGGEEDSLGCLTADTKEVTASQEAR
       :::::::::::::::::::::::.:.:.. .:.     ::...     :  :   . : .
CCDS10 LTQVSTWFANARRRLKKENKMTWTPRNRSEDEE-----EEENIDLEKNDEDE-PQKPEDK
        160       170       180            190       200        210

     250       260       270       280       290       300         
pF1KB9 GLRLSDLEDLEEEEEEEEEAEDEEVVATAGDRLTEFRKGAQSLPGPCAAAREGRLERREC
       :    : :  :    :.. :   : .        .  .:. :         ::::.  . 
CCDS10 G----DPEGPEAGGAEQKAASGCERLQGPPTPAGKETEGSLSDSDFKEPPSEGRLDALQ-
                  220       230       240       250       260      

     310       320       330       340       350       360         
pF1KB9 GLAAPRFSFNDPSGSEEADFLSAETGSPRLTMHYPCLEKPRIWSLAHTATASAVEGAPPA
         . :: .  .:.:   : .  ::  .:    :::    :       .. .    :.: .
CCDS10 --GPPRTGGPSPAGPAAARL--AEDPAP----HYPA-GAPAPGPHPAAGEVPPGPGGPSV
           270       280             290        300       310      

     370       380        390       400             410       420  
pF1KB9 RPRPRSPECRMIPGQPPA-SARRLSVPRDSACD-----ESS-CIPKAFGNPKFALQGLPL
          :  :    . ..:   :  ....  :.. :     :.: : :        :: :   
CCDS10 IHSPPPPPPPAVLAKPKLWSLAEIATSSDKVKDGGGGNEGSPCPPCPGPIAGQALGGSRA
        320       330       340       350       360       370      

            430       440                                          
pF1KB9 NCAPCPRRSEPVVQCQYPSGAEAG                                    
       . :: : :: : .:: .:.:                                        
CCDS10 SPAPAPSRS-PSAQCPFPGGTVLSRPLYYTAPFYPGYTNYGSFGHLHGHPGPGPGPTTGP
        380        390       400       410       420       430     

>>CCDS34132.1 IRX1 gene_id:79192|Hs108|chr5               (480 aa)
 initn: 586 init1: 438 opt: 494  Z-score: 366.1  bits: 77.0 E(32554): 4.5e-14
Smith-Waterman score: 672; 40.0% identity (61.8% similar) in 403 aa overlap (1-395:1-355)

               10        20        30        40        50        60
pF1KB9 MSFPHFGHPYRGASQFLASASSSTTCCESTQRSVSDVASGSTPAPALCCAPYDSRLLGSA
       ::::..:.:     :.:..:. ..    . .:    .:.... : :    :  ..: :.:
CCDS34 MSFPQLGYP-----QYLSAAGPGA---YGGERPGVLAAAAAAAAAASSGRPGAAELGGGA
                    10           20        30        40        50  

                70          80        90       100       110       
pF1KB9 -RPELGAALGIYGA--PYAAAAAAQSYPGYLPYSPEPPSLYGALNPQYEFKEAAGSFTSS
           . ..::.:.:  :::.:    .: ..:::. .  ::.. .. :::.:.  :   ..
CCDS34 GAAAVTSVLGMYAAAGPYAGAP---NYSAFLPYAADL-SLFSQMGSQYELKDNPGVHPAT
             60        70           80         90       100        

       120         130       140       150       160       170     
pF1KB9 LAQ--PGAYYPYERTLGQYQYERYGAVELSGAGRRKNATRETTSTLKAWLNEHRKNPYPT
       .:     :::::    ::.::        .  :: ::::::.::::::::::::::::::
CCDS34 FAAHTAPAYYPY----GQFQY--------GDPGRPKNATRESTSTLKAWLNEHRKNPYPT
      110       120                   130       140       150      

         180       190       200       210       220       230     
pF1KB9 KGEKIMLAIITKMTLTQVSTWFANARRRLKKENKMTWAPKNKGGEERKAEGGEEDSLGCL
       ::::::::::::::::::::::::::::::::::.::. ..:  :.    :.  :. :  
CCDS34 KGEKIMLAIITKMTLTQVSTWFANARRRLKKENKVTWGARSKDQEDGALFGS--DTEG--
        160       170       180       190       200         210    

         240       250       260       270       280       290     
pF1KB9 TADTKEVTASQEARGLRLSDLEDLEEEEEEEEEAEDEEVVATAGDRLTEFRKGAQSLPGP
         : ...  ..:   :.  :.. ..:.. .. . ::.:  : :    .     :..  .:
CCDS34 --DPEKAEDDEEI-DLESIDIDKIDEHDGDQSN-EDDEDKAEAPHAPAAPSALARDQGSP
              220        230       240        250       260        

         300       310         320       330       340       350   
pF1KB9 CAAAREGRLERRECGLA--APRFSFNDPSGSEEADFLSAETGSPRLTMHYPCLEKPRIWS
        :::   . .    :::  ::     .: :: .    .: .:. . . :     ::.:::
CCDS34 LAAADVLKPQDSPLGLAKEAP-----EP-GSTRLLSPGAAAGGLQGAPHG----KPKIWS
      270       280            290        300       310            

           360       370       380        390       400       410  
pF1KB9 LAHTATASAVEGAPPARPRPRSPECRMIPG-QPPASARRLSVPRDSACDESSCIPKAFGN
       ::.:::.   .::: : : :  :  .  :: . :...  :. :                 
CCDS34 LAETATSP--DGAPKASPPP--PAGH--PGAHGPSAGAPLQHPAFLPSHGLYTCHIGKFS
      320         330         340         350       360       370  

            420       430       440                                
pF1KB9 PKFALQGLPLNCAPCPRRSEPVVQCQYPSGAEAG                          
                                                                   
CCDS34 NWTNSAFLAQGSLLNMRSFLGVGAPHAAPHGPHLPAPPPPQPPVAIAPGALNGDKASVRS
            380       390       400       410       420       430  




446 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Fri Nov  4 21:59:28 2016 done: Fri Nov  4 21:59:29 2016
 Total Scan time:  3.390 Total Display time:  0.060

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com