Result of FASTA (ccds) for pF1KB7757
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB7757, 447 aa
  1>>>pF1KB7757 447 - 447 aa - 447 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 8.4962+/-0.00104; mu= 3.8611+/- 0.061
 mean_var=257.9613+/-57.252, 0's: 0 Z-trim(112.8): 803  B-trim: 729 in 1/51
 Lambda= 0.079854
 statistics sampled from 12560 (13507) to 12560 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.748), E-opt: 0.2 (0.415), width:  16
 Scan time:  3.340

The best scores are:                                      opt bits E(32554)
CCDS3136.1 ZIC1 gene_id:7545|Hs108|chr3            ( 447) 3133 374.2 1.4e-103
CCDS14663.1 ZIC3 gene_id:7547|Hs108|chrX           ( 467) 1790 219.5 5.6e-57
CCDS83494.1 ZIC3 gene_id:7547|Hs108|chrX           ( 457) 1594 196.9 3.5e-50
CCDS9495.1 ZIC2 gene_id:7546|Hs108|chr13           ( 532) 1477 183.5 4.4e-46
CCDS43160.1 ZIC4 gene_id:84107|Hs108|chr3          ( 334) 1457 181.0 1.6e-45
CCDS54653.1 ZIC4 gene_id:84107|Hs108|chr3          ( 372) 1457 181.1 1.7e-45
CCDS54652.1 ZIC4 gene_id:84107|Hs108|chr3          ( 384) 1457 181.1 1.7e-45
CCDS9494.2 ZIC5 gene_id:85416|Hs108|chr13          ( 663) 1028 131.9 1.9e-30
CCDS10511.1 GLIS2 gene_id:84662|Hs108|chr16        ( 524)  624 85.3 1.7e-16
CCDS6451.1 GLIS3 gene_id:169792|Hs108|chr9         ( 775)  607 83.5 8.4e-16
CCDS43784.1 GLIS3 gene_id:169792|Hs108|chr9        ( 930)  607 83.6 9.5e-16
CCDS5465.1 GLI3 gene_id:2737|Hs108|chr7            (1580)  606 83.7 1.5e-15
CCDS33283.1 GLI2 gene_id:2736|Hs108|chr2           (1586)  596 82.5 3.3e-15
CCDS53806.1 GLI1 gene_id:2735|Hs108|chr12          (1065)  588 81.4 4.7e-15
CCDS8940.1 GLI1 gene_id:2735|Hs108|chr12           (1106)  588 81.5 4.9e-15
CCDS53807.1 GLI1 gene_id:2735|Hs108|chr12          ( 978)  583 80.8 6.7e-15
CCDS582.1 GLIS1 gene_id:148979|Hs108|chr1          ( 620)  571 79.2 1.3e-14
CCDS58857.1 ZIC4 gene_id:84107|Hs108|chr3          ( 128)  464 66.2 2.2e-11


>>CCDS3136.1 ZIC1 gene_id:7545|Hs108|chr3                 (447 aa)
 initn: 3133 init1: 3133 opt: 3133  Z-score: 1972.8  bits: 374.2 E(32554): 1.4e-103
Smith-Waterman score: 3133; 100.0% identity (100.0% similar) in 447 aa overlap (1-447:1-447)

               10        20        30        40        50        60
pF1KB7 MLLDAGPQYPAIGVTTFGASRHHSAGDVAERDVGLGINPFADGMGAFKLNPSSHELASAG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MLLDAGPQYPAIGVTTFGASRHHSAGDVAERDVGLGINPFADGMGAFKLNPSSHELASAG
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB7 QTAFTSQAPGYAAAAALGHHHHPGHVGSYSSAAFNSTRDFLFRNRGFGDAAAAASAQHSL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 QTAFTSQAPGYAAAAALGHHHHPGHVGSYSSAAFNSTRDFLFRNRGFGDAAAAASAQHSL
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB7 FAASAGGFGGPHGHTDAAGHLLFPGLHEQAAGHASPNVVNGQMRLGFSGDMYPRPEQYGQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 FAASAGGFGGPHGHTDAAGHLLFPGLHEQAAGHASPNVVNGQMRLGFSGDMYPRPEQYGQ
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB7 VTSPRSEHYAAPQLHGYGPMNVNMAAHHGAGAFFRYMRQPIKQELICKWIEPEQLANPKK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 VTSPRSEHYAAPQLHGYGPMNVNMAAHHGAGAFFRYMRQPIKQELICKWIEPEQLANPKK
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB7 SCNKTFSTMHELVTHVTVEHVGGPEQSNHICFWEECPREGKPFKAKYKLVNHIRVHTGEK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SCNKTFSTMHELVTHVTVEHVGGPEQSNHICFWEECPREGKPFKAKYKLVNHIRVHTGEK
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB7 PFPCPFPGCGKVFARSENLKIHKRTHTGEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 PFPCPFPGCGKVFARSENLKIHKRTHTGEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDK
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB7 PYLCKMCDKSYTHPSSLRKHMKVHESSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTTS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 PYLCKMCDKSYTHPSSLRKHMKVHESSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTTS
              370       380       390       400       410       420

              430       440       
pF1KB7 SLSPSSSAVHHTAGHSALSSNFNEWYV
       :::::::::::::::::::::::::::
CCDS31 SLSPSSSAVHHTAGHSALSSNFNEWYV
              430       440       

>>CCDS14663.1 ZIC3 gene_id:7547|Hs108|chrX                (467 aa)
 initn: 1851 init1: 1275 opt: 1790  Z-score: 1136.4  bits: 219.5 E(32554): 5.6e-57
Smith-Waterman score: 2017; 64.4% identity (81.7% similar) in 475 aa overlap (1-447:3-467)

                 10        20        30        40                  
pF1KB7   MLLDAGPQYPAIGVTTFGASRHHSAGDVAERDVGLGINPFADGM---------GAFKL
         ::::.:::.:..:: .::: :::   .  .. .:.:.:::.:.          .::::
CCDS14 MTMLLDGGPQFPGLGVGSFGAPRHHEMPN--REPAGMGLNPFGDSTHAAAAAAAAAAFKL
               10        20          30        40        50        

      50         60        70        80                  90        
pF1KB7 NPSS-HELASAGQTAFTSQAPGYAAAAALGHHHHPGH-------VGSY---SSAAFNSTR
       .:.. :.:.:. ..::: :. ::: :  ::::::  :       : ::   .::::::::
CCDS14 SPAAAHDLSSGQSSAFTPQGSGYANA--LGHHHHHHHHHHHTSQVPSYGGAASAAFNSTR
       60        70        80          90       100       110      

      100        110       120       130       140       150       
pF1KB7 DFLFRNRGFG-DAAAAASAQHSLFAASAGGFGGPHGHTDAAGHLLFPGLHEQAAGHASP-
       .::::.:. : . ::....::.:::.::... .: :  .  ..:::::::::.::: :: 
CCDS14 EFLFRQRSSGLSEAASGGGQHGLFAGSASSLHAPAGIPEPPSYLLFPGLHEQGAGHPSPT
        120       130       140       150       160       170      

         160       170       180       190        200           210
pF1KB7 -NVVNGQMRLGFSGDMYPRPEQYGQVTSPRSEHYAA-PQLHGYGPMNVNM----AAHHGA
        .: :.:..::. :... : . :  :.:::.. :::  :. .:.:::.::    ::::: 
CCDS14 GHVDNNQVHLGLRGELFGRADPYRPVASPRTDPYAAGAQFPNYSPMNMNMGVNVAAHHGP
        180       190       200       210       220       230      

              220       230       240       250       260       270
pF1KB7 GAFFRYMRQPIKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQSNHI
       ::::::::::::::: ::::.  ::. :::::..:::::::::::::.::::::::.::.
CCDS14 GAFFRYMRQPIKQELSCKWIDEAQLSRPKKSCDRTFSTMHELVTHVTMEHVGGPEQNNHV
        240       250       260       270       280       290      

              280       290       300       310       320       330
pF1KB7 CFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHTGEK
       :.::::::::: :::::::::::::::::::::::::::::.::::::::::::::::::
CCDS14 CYWEECPREGKSFKAKYKLVNHIRVHTGEKPFPCPFPGCGKIFARSENLKIHKRTHTGEK
        300       310       320       330       340       350      

              340       350       360       370       380       390
pF1KB7 PFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKMCDKSYTHPSSLRKHMKVHESSSQG
       ::::::::::::::::::::::::::::::::.::.:::::::::::::::::::  :::
CCDS14 PFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYICKVCDKSYTHPSSLRKHMKVHE--SQG
        360       370       380       390       400       410      

              400       410       420       430       440       
pF1KB7 SQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNEWYV
       :. ::::::::::::::.:.: .. . ::.. :  .... :. :   :  :::::::
CCDS14 SDSSPAASSGYESSTPPAIASANSKD-TTKTPSAVQTSTSHNPG---LPPNFNEWYV
          420       430       440        450          460       

>>CCDS83494.1 ZIC3 gene_id:7547|Hs108|chrX                (457 aa)
 initn: 1506 init1: 1233 opt: 1594  Z-score: 1014.5  bits: 196.9 E(32554): 3.5e-50
Smith-Waterman score: 1821; 65.9% identity (83.0% similar) in 411 aa overlap (1-382:3-408)

                 10        20        30         40                 
pF1KB7   MLLDAGPQYPAIGVTTFGASRHHSAGDVAERD-VGLGINPFADGM---------GAFK
         ::::.:::.:..:: .::: :::   .. .:. .:.:.:::.:.          .:::
CCDS83 MTMLLDGGPQFPGLGVGSFGAPRHH---EMPNREPAGMGLNPFGDSTHAAAAAAAAAAFK
               10        20           30        40        50       

       50         60        70        80                  90       
pF1KB7 LNPSS-HELASAGQTAFTSQAPGYAAAAALGHHHHPGH-------VGSY---SSAAFNST
       :.:.. :.:.:. ..::: :. ::: :  ::::::  :       : ::   .:::::::
CCDS83 LSPAAAHDLSSGQSSAFTPQGSGYANA--LGHHHHHHHHHHHTSQVPSYGGAASAAFNST
        60        70        80          90       100       110     

       100        110       120       130       140       150      
pF1KB7 RDFLFRNRGFG-DAAAAASAQHSLFAASAGGFGGPHGHTDAAGHLLFPGLHEQAAGHASP
       :.::::.:. : . ::....::.:::.::... .: :  .  ..:::::::::.::: ::
CCDS83 REFLFRQRSSGLSEAASGGGQHGLFAGSASSLHAPAGIPEPPSYLLFPGLHEQGAGHPSP
         120       130       140       150       160       170     

          160       170       180       190        200             
pF1KB7 --NVVNGQMRLGFSGDMYPRPEQYGQVTSPRSEHYAA-PQLHGYGPMNVNM----AAHHG
         .: :.:..::. :... : . :  :.:::.. :::  :. .:.:::.::    :::::
CCDS83 TGHVDNNQVHLGLRGELFGRADPYRPVASPRTDPYAAGAQFPNYSPMNMNMGVNVAAHHG
         180       190       200       210       220       230     

     210       220       230       240       250       260         
pF1KB7 AGAFFRYMRQPIKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQSNH
        ::::::::::::::: ::::.  ::. :::::..:::::::::::::.::::::::.::
CCDS83 PGAFFRYMRQPIKQELSCKWIDEAQLSRPKKSCDRTFSTMHELVTHVTMEHVGGPEQNNH
         240       250       260       270       280       290     

     270       280       290       300       310       320         
pF1KB7 ICFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHTGE
       .:.::::::::: :::::::::::::::::::::::::::::.:::::::::::::::::
CCDS83 VCYWEECPREGKSFKAKYKLVNHIRVHTGEKPFPCPFPGCGKIFARSENLKIHKRTHTGE
         300       310       320       330       340       350     

     330       340       350       360       370       380         
pF1KB7 KPFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKMCDKSYTHPSSLRKHMKVHESSSQ
       :::::::::::::::::::::::::::::::::.::.::::::::::::::::       
CCDS83 KPFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYICKVCDKSYTHPSSLRKHMKCCPAWYP
         360       370       380       390       400       410     

     390       400       410       420       430       440       
pF1KB7 GSQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNEWYV
                                                                 
CCDS83 GQSLIPDEELDTDVGMQQPALHNTTYPKCRVNAEPTVQEMIY                
         420       430       440       450                       

>>CCDS9495.1 ZIC2 gene_id:7546|Hs108|chr13                (532 aa)
 initn: 2393 init1: 1400 opt: 1477  Z-score: 940.9  bits: 183.5 E(32554): 4.4e-46
Smith-Waterman score: 2154; 69.6% identity (83.3% similar) in 473 aa overlap (1-437:1-468)

               10        20               30          40           
pF1KB7 MLLDAGPQYPAIGVTTFGASRHHSAGDVA-------ERDVGLGI--NPFADG----MGAF
       ::::::::.::::: .:.  .::::. .:       .:...:.   : :.:.    ::::
CCDS94 MLLDAGPQFPAIGVGSFARHHHHSAAAAAAAAAEMQDRELSLAAAQNGFVDSAAAHMGAF
               10        20        30        40        50        60

        50        60        70                80        90         
pF1KB7 KLNPSSHELASAGQTAFTSQAPGY--------AAAAALGHHHHPGHVGSYSSAAFNSTRD
       ::::..:::. . ..:::::.::         :::::::   : .::::::.  ::::::
CCDS94 KLNPGAHELSPGQSSAFTSQGPGAYPGSAAAAAAAAALGP--HAAHVGSYSGPPFNSTRD
               70        80        90       100         110        

     100       110       120       130       140       150         
pF1KB7 FLFRNRGFGDAAAAASAQHSLFAASAGGFGGPHGHTDAAGHLLFPGLHEQAAGHASPNVV
       ::::.:::::.: ... ::.::. .:::.   :.:.:: :::::::: :: . :.: ::.
CCDS94 FLFRSRGFGDSAPGGG-QHGLFGPGAGGLH--HAHSDAQGHLLFPGLPEQHGPHGSQNVL
      120       130        140         150       160       170     

     160       170       180       190        200                  
pF1KB7 NGQMRLGFSGDMYPRPEQYGQVTSPRSEHYAAPQLHG-YGPMNVNM-------AAHHG--
       :::::::. :... : ::: ::.:::.. :.: :::. :::::.::       ::::   
CCDS94 NGQMRLGLPGEVFGRSEQYRQVASPRTDPYSAAQLHNQYGPMNMNMGMNMAAAAAHHHHH
         180       190       200       210       220       230     

         210       220        230       240       250       260    
pF1KB7 ----AGAFFRYMRQP-IKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGP
            :::::::::  ::::::::::.::::.::::::::::::::::::::.:::::::
CCDS94 HHHHPGAFFRYMRQQCIKQELICKWIDPEQLSNPKKSCNKTFSTMHELVTHVSVEHVGGP
         240       250       260       270       280       290     

          270       280       290       300       310       320    
pF1KB7 EQSNHICFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKR
       :::::.::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS94 EQSNHVCFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKR
         300       310       320       330       340       350     

          330       340       350       360       370       380    
pF1KB7 THTGEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKMCDKSYTHPSSLRKHMKVH
       ::::::::.:::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS94 THTGEKPFQCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKMCDKSYTHPSSLRKHMKVH
         360       370       380       390       400       410     

          390       400       410       420       430       440    
pF1KB7 ESSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNE
       ::: :::. :::::::::::::: .::::..  ..:.:::...:.  .:. .:       
CCDS94 ESSPQGSESSPAASSGYESSTPPGLVSPSAEPQSSSNLSPAAAAAAAAAAAAAAAVSAVH
         420       430       440       450       460       470     

                                                                
pF1KB7 WYV                                                      
                                                                
CCDS94 RGGGSGSGGAGGGSGGGSGSGGGGGGAGGGGGGSSGGGSGTAGGHSGLSSNFNEWYV
         480       490       500       510       520       530  

>>CCDS43160.1 ZIC4 gene_id:84107|Hs108|chr3               (334 aa)
 initn: 1624 init1: 865 opt: 1457  Z-score: 930.9  bits: 181.0 E(32554): 1.6e-45
Smith-Waterman score: 1457; 68.2% identity (81.3% similar) in 321 aa overlap (122-436:23-333)

             100       110       120       130       140       150 
pF1KB7 AAFNSTRDFLFRNRGFGDAAAAASAQHSLFAASAGGFGGPHGHTDAAGHLLFPGLHEQAA
                                     ..:..:  ::.  : :..  .::::::.  
CCDS43         MRYKTSLVMRKRLRLYRNTLKESSSSSGHHGPQ-LTAASSPSVFPGLHEEPP
                       10        20        30         40        50 

              160       170       180       190        200         
pF1KB7 GHASPNV-VNGQMRLGFSGDMYPRPEQYGQVTSPRSEHYAAPQ-LHGYGPMN--VNMAAH
        .:::.  .:: .:::. :::: ::: .    . ::.  ::   ::::: ::  ::.:: 
CCDS43 -QASPSRPLNGLLRLGLPGDMYARPEPFPPGPAARSDALAAAAALHGYGGMNLTVNLAAP
               60        70        80        90       100       110

       210       220       230       240       250       260       
pF1KB7 HGAGAFFRYMRQPIKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQS
       :: :::::::::::::::::::.  .  :.:.  :.:::::::::::::::::::::::.
CCDS43 HGPGAFFRYMRQPIKQELICKWLAADGTATPSL-CSKTFSTMHELVTHVTVEHVGGPEQA
              120       130       140        150       160         

       270       280       290       300       310       320       
pF1KB7 NHICFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHT
       :::::::::::.::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NHICFWEECPRQGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHT
     170       180       190       200       210       220         

       330       340       350       360         370       380     
pF1KB7 GEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKM--CDKSYTHPSSLRKHMKVHE
       :::::.::::::.:::::::::::: ::::::::: ::.  ::: :::::::::::::: 
CCDS43 GEKPFRCEFEGCERRFANSSDRKKHSHVHTSDKPYTCKVRGCDKCYTHPSSLRKHMKVH-
     230       240       250       260       270       280         

         390       400       410       420       430       440     
pF1KB7 SSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNEW
           : .: :  ::::.:.:: ..::::.:    :... :.... .::  :         
CCDS43 ----GRSPPP--SSGYDSATPSALVSPSSDCGHKSQVASSAAVAARTADLSE        
          290         300       310       320       330            

         
pF1KB7 YV

>>CCDS54653.1 ZIC4 gene_id:84107|Hs108|chr3               (372 aa)
 initn: 1624 init1: 865 opt: 1457  Z-score: 930.3  bits: 181.1 E(32554): 1.7e-45
Smith-Waterman score: 1457; 68.2% identity (81.3% similar) in 321 aa overlap (122-436:61-371)

             100       110       120       130       140       150 
pF1KB7 AAFNSTRDFLFRNRGFGDAAAAASAQHSLFAASAGGFGGPHGHTDAAGHLLFPGLHEQAA
                                     ..:..:  ::.  : :..  .::::::.  
CCDS54 DSKAQSQKMRYKTSLVMRKRLRLYRNTLKESSSSSGHHGPQ-LTAASSPSVFPGLHEEPP
               40        50        60        70         80         

              160       170       180       190        200         
pF1KB7 GHASPNV-VNGQMRLGFSGDMYPRPEQYGQVTSPRSEHYAAPQ-LHGYGPMN--VNMAAH
        .:::.  .:: .:::. :::: ::: .    . ::.  ::   ::::: ::  ::.:: 
CCDS54 -QASPSRPLNGLLRLGLPGDMYARPEPFPPGPAARSDALAAAAALHGYGGMNLTVNLAAP
       90       100       110       120       130       140        

       210       220       230       240       250       260       
pF1KB7 HGAGAFFRYMRQPIKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQS
       :: :::::::::::::::::::.  .  :.:.  :.:::::::::::::::::::::::.
CCDS54 HGPGAFFRYMRQPIKQELICKWLAADGTATPSL-CSKTFSTMHELVTHVTVEHVGGPEQA
      150       160       170       180        190       200       

       270       280       290       300       310       320       
pF1KB7 NHICFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHT
       :::::::::::.::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 NHICFWEECPRQGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHT
       210       220       230       240       250       260       

       330       340       350       360         370       380     
pF1KB7 GEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKM--CDKSYTHPSSLRKHMKVHE
       :::::.::::::.:::::::::::: ::::::::: ::.  ::: :::::::::::::: 
CCDS54 GEKPFRCEFEGCERRFANSSDRKKHSHVHTSDKPYTCKVRGCDKCYTHPSSLRKHMKVH-
       270       280       290       300       310       320       

         390       400       410       420       430       440     
pF1KB7 SSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNEW
           : .: :  ::::.:.:: ..::::.:    :... :.... .::  :         
CCDS54 ----GRSPPP--SSGYDSATPSALVSPSSDCGHKSQVASSAAVAARTADLSE        
            330         340       350       360       370          

         
pF1KB7 YV

>>CCDS54652.1 ZIC4 gene_id:84107|Hs108|chr3               (384 aa)
 initn: 1624 init1: 865 opt: 1457  Z-score: 930.1  bits: 181.1 E(32554): 1.7e-45
Smith-Waterman score: 1457; 68.2% identity (81.3% similar) in 321 aa overlap (122-436:73-383)

             100       110       120       130       140       150 
pF1KB7 AAFNSTRDFLFRNRGFGDAAAAASAQHSLFAASAGGFGGPHGHTDAAGHLLFPGLHEQAA
                                     ..:..:  ::.  : :..  .::::::.  
CCDS54 WEKAQSQKMRYKTSLVMRKRLRLYRNTLKESSSSSGHHGPQ-LTAASSPSVFPGLHEEPP
             50        60        70        80         90       100 

              160       170       180       190        200         
pF1KB7 GHASPNV-VNGQMRLGFSGDMYPRPEQYGQVTSPRSEHYAAPQ-LHGYGPMN--VNMAAH
        .:::.  .:: .:::. :::: ::: .    . ::.  ::   ::::: ::  ::.:: 
CCDS54 -QASPSRPLNGLLRLGLPGDMYARPEPFPPGPAARSDALAAAAALHGYGGMNLTVNLAAP
              110       120       130       140       150       160

       210       220       230       240       250       260       
pF1KB7 HGAGAFFRYMRQPIKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQS
       :: :::::::::::::::::::.  .  :.:.  :.:::::::::::::::::::::::.
CCDS54 HGPGAFFRYMRQPIKQELICKWLAADGTATPSL-CSKTFSTMHELVTHVTVEHVGGPEQA
              170       180       190        200       210         

       270       280       290       300       310       320       
pF1KB7 NHICFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHT
       :::::::::::.::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 NHICFWEECPRQGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHT
     220       230       240       250       260       270         

       330       340       350       360         370       380     
pF1KB7 GEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKM--CDKSYTHPSSLRKHMKVHE
       :::::.::::::.:::::::::::: ::::::::: ::.  ::: :::::::::::::: 
CCDS54 GEKPFRCEFEGCERRFANSSDRKKHSHVHTSDKPYTCKVRGCDKCYTHPSSLRKHMKVH-
     280       290       300       310       320       330         

         390       400       410       420       430       440     
pF1KB7 SSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNEW
           : .: :  ::::.:.:: ..::::.:    :... :.... .::  :         
CCDS54 ----GRSPPP--SSGYDSATPSALVSPSSDCGHKSQVASSAAVAARTADLSE        
          340         350       360       370       380            

         
pF1KB7 YV

>>CCDS9494.2 ZIC5 gene_id:85416|Hs108|chr13               (663 aa)
 initn: 1150 init1: 874 opt: 1028  Z-score: 660.1  bits: 131.9 E(32554): 1.9e-30
Smith-Waterman score: 1286; 52.9% identity (65.1% similar) in 418 aa overlap (106-447:224-625)

          80        90       100       110         120       130   
pF1KB7 ALGHHHHPGHVGSYSSAAFNSTRDFLFRNRGFGDAAAAASAQHS--LFAASAGGFGGPHG
                                     : :.    :   ::  .: ...: ..:: :
CCDS94 SRDFVLRRDLSATAPAAAMHGAPLGGEQRSGTGSPQHPAPPPHSAGMFISASGTYAGPDG
           200       210       220       230       240       250   

           140        150       160       170        180           
pF1KB7 HTDAAGHLLFPGLHEQ-AAGHASPNVVNGQMRLGFSGDMYPRP-EQYGQVT---SPRS--
          ..:  :::.::.  .:  . :. .:::::::...       : ::..    .:::  
CCDS94 ---SGGPALFPALHDTPGAPGGHPHPLNGQMRLGLAAAAAAAAAELYGRAEPPFAPRSGD
              260       270       280       290       300       310

              190         200                                      
pF1KB7 EHY------AAPQLHGYGP--MNVNMAA--------------HHG---------------
        ::      ::  :::::   .:.:.::              ::.               
CCDS94 AHYGAVAAAAAAALHGYGAVNLNLNLAAAAAAAAAGPGPHLQHHAPPPAPPPPPAPAQHP
              320       330       340       350       360       370

               210       220       230                         240 
pF1KB7 ----------AGAFFRYMRQPIKQELICKWIEPEQLAN-PK-----------------KS
                 ::::.::::::::::::::::.:..::. :                  : 
CCDS94 HQHHPHLPGAAGAFLRYMRQPIKQELICKWIDPDELAGLPPPPPPPPPPPPPPPAGGAKP
              380       390       400       410       420       430

             250       260       270       280       290       300 
pF1KB7 CNKTFSTMHELVTHVTVEHVGGPEQSNHICFWEECPREGKPFKAKYKLVNHIRVHTGEKP
       :.:::.::::::.:::::::::::::.:.::::.::::::::::::::.:::::::::::
CCDS94 CSKTFGTMHELVNHVTVEHVGGPEQSSHVCFWEDCPREGKPFKAKYKLINHIRVHTGEKP
              440       450       460       470       480       490

             310       320       330       340       350       360 
pF1KB7 FPCPFPGCGKVFARSENLKIHKRTHTGEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDKP
       :::::::::::::::::::::::::::::::::::.::::.:::::::::: ::::::::
CCDS94 FPCPFPGCGKVFARSENLKIHKRTHTGEKPFKCEFDGCDRKFANSSDRKKHSHVHTSDKP
              500       510       520       530       540       550

               370       380       390       400       410         
pF1KB7 YLCKM--CDKSYTHPSSLRKHMKVHESSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTT
       : ::.  ::::::::::::::::.: .:     :::.   :: :   :.        : .
CCDS94 YYCKIRGCDKSYTHPSSLRKHMKIHCKS---PPPSPGPL-GYSSVGTPV------GAPLS
              560       570          580        590             600

     420       430       440                                       
pF1KB7 SSLSPSSSAVHHTAGHSALSSNFNEWYV                                
         :.:. :   :..  :   .:.:::::                                
CCDS94 PVLDPARS---HSSTLSPQVTNLNEWYVCQASGAPSHLHTPSSNGTTSETEDEEIYGNPE
                 610       620       630       640       650       

>>CCDS10511.1 GLIS2 gene_id:84662|Hs108|chr16             (524 aa)
 initn: 548 init1: 298 opt: 624  Z-score: 409.8  bits: 85.3 E(32554): 1.7e-16
Smith-Waterman score: 629; 36.8% identity (59.5% similar) in 304 aa overlap (151-438:87-370)

              130       140       150       160         170        
pF1KB7 FAASAGGFGGPHGHTDAAGHLLFPGLHEQAAGHASPNVVNG--QMRLGFSGDMYPRPEQY
                                     .:  :::  ..    : : .::. : :   
CCDS10 SGFLLNSKFPEKVEGRFSAAPLVDLSLSPPSGLDSPNGSSSLSPERQG-NGDLPPVPSAS
         60        70        80        90       100        110     

      180       190        200       210              220       230
pF1KB7 GQVTSPRSEHYAAPQ-LHGYGPMNVNMAAHHGAGAFFRYMRQ-------PIKQELICKWI
           .:     ..:. .. . :.. . : :  :..:.   ..       :. ..:.:.: 
CCDS10 D--FQPLRYLDGVPSSFQFFLPLGSGGALHLPASSFLTPPKDKCLSPDLPLPKQLVCRWA
           120       130       140       150       160       170   

              240       250       260       270       280       290
pF1KB7 EPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQSNHICFWEECPREGKPFKAKYKLV
       .          ::. :  ...:: ::.  ::   ..... : :: : :.:. :.:.::..
CCDS10 K----------CNQLFELLQDLVDHVNDYHVKPEKDAGYCCHWEGCARHGRGFNARYKML
                     180       190       200       210       220   

              300       310       320       330       340       350
pF1KB7 NHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHTGEKPFKCEFEGCDRRFANSSDRK
        :::.::.:::  ::   :.: :.: ::::::.:.::::::. : .:::..:..::::: 
CCDS10 IHIRTHTNEKPHRCP--TCSKSFSRLENLKIHNRSHTGEKPYVCPYEGCNKRYSNSSDRF
           230         240       250       260       270       280 

              360         370       380       390       400        
pF1KB7 KHMHVHTSDKPYLCKM--CDKSYTHPSSLRKHMKVHESSSQGSQPSPAASSGYESSTPPT
       :: ..:  :::: :::  : : :: :::::::.:.:     :   :   .   .   :: 
CCDS10 KHTRTHYVDKPYYCKMPGCHKRYTDPSSLRKHIKAH-----GHFVSHEQQELLQLRPPPK
             290       300       310            320       330      

      410        420          430       440                        
pF1KB7 IVSPSTDN-PTTSS---LSPSSSAVHHTAGHSALSSNFNEWYV                 
          :. :. : .:.   . :. .:.    :  .:                          
CCDS10 PPLPAPDGGPYVSGAQIIIPNPAALFGGPGLPGLPLPLAPGPLDLSALACGNGGGSGGGG
        340       350       360       370       380       390      

CCDS10 GMGPGLPGPVLPLNLAKNPLLPSPFGAGGLGLPVVSLLAGAAGGKAEGEKGRGSVPTRAL
        400       410       420       430       440       450      

>>CCDS6451.1 GLIS3 gene_id:169792|Hs108|chr9              (775 aa)
 initn: 729 init1: 497 opt: 607  Z-score: 397.2  bits: 83.5 E(32554): 8.4e-16
Smith-Waterman score: 631; 31.4% identity (55.3% similar) in 436 aa overlap (19-436:135-545)

                           10        20        30        40        
pF1KB7             MLLDAGPQYPAIGVTTFGASRHHSAGDVAERDVGLGINPFADGMGA--
                                     ..: ::: .   .  .:...:..::.:   
CCDS64 MSSNSVSNSLPSYLFGTESSHSPYPSPRHSSTRSHSARS---KKRALSLSPLSDGIGIDF
          110       120       130       140          150       160 

            50        60        70        80           90       100
pF1KB7 ---FKLNPSSHELASAGQTAFTSQAPGYAAAAALGHHHHPGHVGS---YSSAAFNSTRDF
          .. .:.:      :. :    .:.  .     . :  :  ::       . .: .  
CCDS64 NTIIRTSPTSLVAYINGSRA----SPANLSPQPEVYGHFLGVRGSCIPQPRPVPGSQKGV
             170       180           190       200       210       

              110          120        130       140       150      
pF1KB7 LFRNRGFGDAAAA---ASAQHSLFAASAGGFG-GPHGHTDAAGHLLFPGLHEQAAGHASP
       :    :..  : .   :  .. .     ::.  :  .:  .. : : ::   :.::  . 
CCDS64 LVAPGGLALPAYGEDGALEHERMQQLEHGGLQPGLVNHM-VVQHGL-PGPDSQSAGLFKT
       220       230       240       250        260        270     

        160       170         180       190         200       210  
pF1KB7 NVVNGQMRLGFSGDMYPRPE--QYGQVTSPRSEHYAAPQLHG--YGPMNVNMAAHHGAGA
       . .  .   : . :. : :         .:   ..:  .::    ::   ..:  ...  
CCDS64 ERL--EEFPGSTVDLPPAPPLPPLPPPPGPPPPYHAHAHLHHPELGPHAQQLALPQATLD
           280       290       300       310       320       330   

            220       230       240       250       260       270  
pF1KB7 FFRYMRQPIKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQSNHICF
           : . :  .  :.::.          :.  .. ..::: :.   :.   .  .  ::
CCDS64 DDGEM-DGIGGKHCCRWID----------CSALYDQQEELVRHIEKVHIDQRKGEDFTCF
            340       350                 360       370       380  

            280       290       300       310       320       330  
pF1KB7 WEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHTGEKPF
       :  :::. :::.:.:::. :.:::.::::  : : :: :.:.: :::::: :.::::::.
CCDS64 WAGCPRRYKPFNARYKLLIHMRVHSGEKPNKCTFEGCEKAFSRLENLKIHLRSHTGEKPY
            390       400       410       420       430       440  

            340       350       360         370       380       390
pF1KB7 KCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKM--CDKSYTHPSSLRKHMKVHESSSQG
        :.  ::.. :.::::: ::...: . ::: :..  : : :: :::::::.:.: :. : 
CCDS64 LCQHPGCQKAFSNSSDRAKHQRTHLDTKPYACQIPGCTKRYTDPSSLRKHVKAHSSKEQQ
            450       460       470       480       490       500  

              400       410       420       430       440          
pF1KB7 SQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNEWYV   
       .. .  .:.  . .     .. .. .:.:   :: ..:.. :.:.:              
CCDS64 ARKKLRSSTELHPDLLTDCLTVQSLQPAT---SPRDAAAEGTVGRSPGPGPDLYSAPIFS
            510       520       530          540       550         

CCDS64 SNYSSRSGTAAGAVPPPHPVSHPSPGHNVQGSPHNPSSQLPPLTAVDAGAERFAPSAPSP
     560       570       580       590       600       610         




447 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Fri Nov  4 22:10:53 2016 done: Fri Nov  4 22:10:54 2016
 Total Scan time:  3.340 Total Display time:  0.070

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com