Result of GENSCAN for pF1KE5129

KOP
KOP Flexi HaloTag ORF List search
Result of GENSCAN for pF1KE5129
GENSCAN 1.0	Date run:  8-Nov-116	Time: 07:20:18

Sequence gi568815597r:146244224_146444715 : 200492 bp : 40.94% C+G : Isochore 1 ( 0 - 43 C+G%)

Parameter matrix: HumanIso.smat

Predicted genes/exons:

Gn.Ex Type S .Begin ...End .Len Fr Ph I/Ac Do/T CodRg P.... Tscr..
----- ---- - ------ ------ ---- -- -- ---- ---- ----- ----- ------

 1.01 Init +   3168   3364  197  2  2   67   64   128 0.605   6.75
 1.02 Intr +  10519  10625  107  1  2  107   63    40 0.181   2.34
 1.03 Intr +  17524  17616   93  2  0   50   92    62 0.053   1.82
 1.04 Intr +  20339  20466  128  0  2  102   61    66 0.187   4.78
 1.05 Intr +  26887  27024  138  0  0   58   98    30 0.209   0.74
 1.06 Intr +  27554  27715  162  1  0   83   74    80 0.106   5.35
 1.07 Intr +  36001  36152  152  0  2   81   79    35 0.158  -0.06
 1.08 Intr +  37388  37549  162  2  0  105  100    58 0.955   6.87
 1.09 Intr +  42123  42226  104  0  2  122   60    20 0.621   1.50
 1.10 Term +  53828  54492  665  0  2   41   44   573 0.832  41.24
 1.11 PlyA +  57068  57073    6                               1.05

 2.06 PlyA -  58084  58079    6                               1.05
 2.05 Term -  69172  68826  347  2  2    6   42   229 0.206   3.77
 2.04 Intr -  71162  71032  131  1  2   77   94    46 0.402   3.52
 2.03 Intr -  77773  77644  130  2  1  115   31   132 0.634   9.03
 2.02 Intr -  83988  83828  161  2  2   80  111   112 0.958  11.41
 2.01 Init -  86618  86470  149  2  2   74   23    66 0.612  -1.69
 2.00 Prom -  97314  97275   40                              -4.85

 3.02 PlyA -  97610  97605    6                               1.05
 3.01 Sngl - 100492  99998  495  1  0   86   39   652 0.982  55.90
 3.00 Prom - 115264 115225   40                              -3.65

 4.00 Prom + 118493 118532   40                              -3.25
 4.01 Init + 122995 123040   46  0  1  109   66    29 0.611   3.75
 4.02 Intr + 125133 125232  100  1  1   99   46    85 0.464   3.65
 4.03 Term + 125390 125807  418  2  1    9   55   225 0.406   5.06
 4.04 PlyA + 126587 126592    6                               1.05

 5.05 PlyA - 127363 127358    6                               1.05
 5.04 Term - 132555 132251  305  1  2   62   45   130 0.200   0.45
 5.03 Intr - 132770 132592  179  1  2   36  111    97 0.376   5.44
 5.02 Intr - 133364 133334   31  0  1  100   94    33 0.477   1.37
 5.01 Init - 139281 139134  148  0  1   56  110    84 0.655   7.70
 5.00 Prom - 140869 140830   40                              -7.35

 6.08 PlyA - 141415 141410    6                               1.05
 6.07 Term - 143151 142980  172  2  1   46   41   180 0.471   5.42
 6.06 Intr - 144757 144575  183  0  0   70   64   100 0.546   3.78
 6.05 Intr - 149897 149690  208  0  1   82   68   213 0.127  15.91
 6.04 Intr - 158159 157963  197  1  2   13  110   106 0.006   3.44
 6.03 Intr - 166025 165281  745  0  1   23   50   274 0.000   6.68
 6.02 Intr - 175608 175448  161  2  2   14   60   144 0.026   2.91
 6.01 Init - 183025 182817  209  1  2   21   86   113 0.195   2.74
 6.00 Prom - 186378 186339   40                              -3.25

 7.00 Prom + 187743 187782   40                              -4.75
 7.01 Init + 187898 187939   42  1  0   59  111    19 0.117   1.77
 7.02 Intr + 199362 199459   98  2  2   20   71   142 0.737   3.59
 7.03 Intr + 199651 199871  221  1  2   46   59   280 0.787  17.92

Suboptimal exons with probability > 0.800

Exnum Type S .Begin ...End .Len Fr Ph B/Ac Do/T CodRg P.... Tscr..
----- ---- - ------ ------ ---- -- -- ---- ---- ----- ----- ------



Predicted peptide sequence(s):

Predicted coding sequence(s):


>gi568815597r:146244224_146444715|GENSCAN_predicted_peptide_1|635_aa
MGRLDYSDEPDVITGVLIEKGGRSVRERDVTMRDHQPKPKTNKQKQKLWLEAGRGKEQCL
SSSSRRHCHAPGGVGGDASNPLGFDLAERGLSFQLLGLFLKKMRYVNTVPATPNFLFEMK
VPHPEPPALRSRGIMKCGIKLLLGQGGPLHSVGSTSLNSVMLNEARFQLCRAGMQPCLNL
GGGAQEIIQAPLPRAAQGRRPGLQGPPQSLSPRNMILTPPKVASSCSALDKRAGHCCWGD
ISRQARESCRLLSAYLLAGKTNIGQLFSKGGMQSTEDPLTYYLCQALYSSQQCWKIGITI
LKLQMRKLRSGDLSVSEIPNPRGMDRLPEGSSETCVRKEKLSGLSSLLHDHSFSPTYHCL
AWNGSWKEDSRETIETDNRKDAVISELSLEHFSPVCQGFREGFPNIQAGCQGFLTLPGAP
APDSPSPPLPGGVAAAGPPRRRPEQQQQQQEPASMMKFKPNQTRTYDREGFKKRAACLCF
RSEQEDEVLLVSSSRYPDQWIVPGGGMEPEEEPGGAAVREVYEEAGVKGKLGRLLGIFEQ
NQDRKHRTYVYVLTVTEILEDWEDSVNIGRKREWFKVEDAIKVLQCHKPVHAEYLEKLKL
GCSPANGNSTVPSLPDNNALFVTAAQTSGLPSSVR

>gi568815597r:146244224_146444715|GENSCAN_predicted_CDS_1|1908_bp
atgggaagattagattattcagacgaacctgatgtaatcacaggggtccttatagaaaaa
ggaggcaggagtgtcagagaaagagatgtgacaatgagggaccatcagccaaaaccaaaa
acaaacaaacaaaaacaaaaactgtggttagaagctggaagaggcaaagaacagtgtctc
tcctccagctccaggagacattgtcatgctccaggtggggtgggtggtgatgccagtaat
cccctgggctttgacttagctgagcgtggactcagttttcagttgcttggcttgttcttg
aagaaaatgagatatgtcaacacagtgcctgccacacccaacttcctctttgagatgaaa
gtgccccacccagagccccctgctttgagaagcagagggataatgaagtgtggcataaag
cttctcctgggtcagggtggcccactccacagtgttggcagcaccagtctcaacagtgtg
atgctgaatgaagctaggttccagctgtgtagagctggcatgcagccctgcctgaacctc
ggaggaggcgcccaggagatcatccaggcaccgctgcctagggccgcgcagggaagacgg
ccagggctccagggtccgcctcagtcactgtcaccccgcaacatgattctgactccccca
aaggtggccagcagctgctccgcacttgacaaacgtgctggacactgctgctggggagac
atcagccggcaagcaagggaaagttgcagacttctcagtgcttacctcctagctgggaag
acaaatattggacaactattctctaaaggaggcatgcagagtactgaagacccactgacc
tattatttgtgtcaggcactttattcctcacaacaatgctggaagattggtataactatt
ctcaaattacagatgaggaaactgaggtctggggatctgtctgtgtcggagatccccaac
ccccggggcatggacaggcttcctgagggctcctcagaaacatgtgttagaaaagaaaag
ctttccggtctgtccagtctcctccatgaccacagtttctcacccacataccattgtctg
gcttggaatggatcctggaaggaggactcaagagaaaccatagaaacagacaacaggaaa
gatgctgtcatttctgagttatctttggagcatttctctccagtgtgtcagggtttcaga
gaaggctttcctaatattcaggctggctgtcagggtttcctaacgctcccgggcgctcct
gcgcccgactcgccctcgcccccactccccggcggggtggcggcggccgggcccccacgg
cggcggccggagcagcagcagcagcagcaggagcccgcctctatgatgaagttcaagccc
aaccagacgcggacctacgaccgcgagggcttcaagaagcgggcggcgtgcctgtgcttc
cggagcgagcaggaggacgaggtgctgctggtgagtagcagccggtacccagaccagtgg
attgtcccaggaggaggaatggaacccgaggaggaacctggcggtgctgccgtgagggaa
gtttatgaggaggctggagtcaaaggaaaactaggcagacttctgggcatatttgagcag
aaccaagaccgaaagcacagaacatatgtttatgttctaacagtcactgaaatattagaa
gattgggaagattctgttaatattggaaggaagagagagtggttcaaagtagaagatgct
atcaaagttctccagtgtcataaacctgtacatgcagagtatctggaaaagctaaagctg
ggttgttccccagccaatggaaattctacagtcccttcccttccggataataatgccttg
tttgtaaccgctgcacagacctctgggttgccatctagtgtaagatag

>gi568815597r:146244224_146444715|GENSCAN_predicted_peptide_2|305_aa
MDEAGNHHSQQTITRTENQTPHVLTHRWELNDENAWTQGGEHHTLGPVRGYIIEQGVCDL
VLCEAAFPKKLAFAYLEDLHSEFDEQHGKKVPTVSQPYSFIEFALDSKANNLSSLSKKYR
QDAKYLNMRSTYAKLAAVAVFFIMLIVNEATWLSPLYATFRPPRASKKTKAEKPIQETAT
SKVEATSDHTERLLKSQKAIDAGVVAEKMEHLYSANGNVNSFSRCAKHFGDFSKNRQQLP
LDPAIPLLDIYLKEYRLFCHKDTCTHMFIAALFTIAKTWNQPKCPSVVVWIKKMWYTYTV
EYTQP

>gi568815597r:146244224_146444715|GENSCAN_predicted_CDS_2|918_bp
atggatgaagctggaaaccatcattctcagcaaactatcacaaggacagaaaaccaaaca
ccgcatgttctcactcacagatgggagttgaacgatgagaatgcatggacacagggtggg
gaacatcacacactggggcctgtcaggggctacattattgagcagggggtgtgtgatttg
gttttatgtgaagctgccttccctaagaagttggcttttgcctacctagaagatttgcac
tcagaatttgatgaacagcatggaaagaaggtgcccactgtgtcccaaccctattccttt
attgaatttgcattggattcaaaggctaacaatttgtccagtctgtccaagaaataccgc
caggatgcgaagtacttgaacatgcgttccacttacgccaaacttgcagcagtagctgta
tttttcatcatgttaatagtaaatgaggccacttggctgagcccattatatgcaacattc
agacccccaagggcatcaaagaagacaaaagcagaaaaacctatccaagaaacagcaact
tcaaaggttgaagcaacatcagaccacacagaacggctattaaaaagtcaaaaagcaata
gatgccggcgtggttgcagagaaaatggaacacttatatagtgctaatgggaatgtaaat
tcgttcagccgttgtgcaaagcactttggtgatttctcaaagaaccggcaacaattacca
ctcgacccagcgatcccattattggatatatacctaaaggaatatagattgttctgccat
aaagacacatgcacgcatatgttcatcgcagcactattcacgatagcaaagacatggaat
caacctaaatgcccatcagtggtagtctggataaagaaaatgtggtacacgtacaccgtg
gaatatacacagccataa

>gi568815597r:146244224_146444715|GENSCAN_predicted_peptide_3|164_aa
MVNSVVFFDITVDGKPLGRISIKLFADKIPKTAENFRALSTGEKGFRYKGSCFHRIIPGF
MCQGGDFTRPNGTDDKSIYGEKFDDENLIRKHTGSGILSMVNAGPNTNGSQLFICTAKTE
WLDGKHVAFGKVKERVNIVEAMEHFGYRNSKTSKKITIADCGQF

>gi568815597r:146244224_146444715|GENSCAN_predicted_CDS_3|495_bp
atggtcaactccgtcgtcttttttgacatcaccgtcgacggcaagcccttgggccgcatc
tccatcaaactgtttgcagacaagattccaaagacagcagaaaactttcgtgctctgagc
actggagagaaaggatttcgttataagggttcctgctttcacagaattattccagggttt
atgtgtcagggtggtgacttcacacgccctaatggcaccgatgacaagtccatctatggg
gagaaatttgatgatgagaacctcatccgaaagcatacaggttctggcatcttgtccatg
gtaaatgctggacccaacacaaatggctcccagttattcatctgcactgccaagactgag
tggttggatggcaagcatgtggcctttggcaaggtgaaagaacgtgtgaatattgtggaa
gccatggagcactttgggtacaggaatagcaagaccagcaagaagatcaccattgctgac
tgtggacaattctaa

>gi568815597r:146244224_146444715|GENSCAN_predicted_peptide_4|187_aa
MKMKATSSGPGPPVAGPDHRPAEPPRLHGAEGALEALPVAAPRGAKKSTGTHEPPSPRSL
PWWSPRAEHRIRRWQRKLRSGPKSDWAGRAQAPSLGEGGAKNGKSHPGSHRAFSLPRAPR
RLGPGSQPGRFRGFLKQARGRAGEGHSAILLAPESPNAQVSNVTSATYRSNLSGLPRPCS
VVLLGGP

>gi568815597r:146244224_146444715|GENSCAN_predicted_CDS_4|564_bp
atgaagatgaaggccacctcttctgggccaggtcctcccgttgcaggacccgaccaccgc
ccagctgagcccccgcggctccacggcgcagaaggtgcactggaggccctgcccgttgcc
gccccgcggggtgccaagaagtcaacggggacccacgagccaccctcaccacgatccctg
ccctggtggagcccccgtgcggaacacaggatccgaagatggcagcggaagctccgcagc
ggccccaaaagcgactgggcagggagggcacaggctccctcactgggtgaaggcggcgca
aagaacgggaagagccatcccgggagccaccgggcgttcagcctccctagggcccccagg
cggctcgggccggggtctcaaccggggcgtttccgggggtttctgaagcaggcgaggggc
agggcgggcgaaggccattcggctatccttctggctccagaatctcccaacgcgcaggtg
tccaacgtgaccagcgcgacttaccgctccaatctctccggtcttccaaggccttgctca
gtcgtcctgctgggagggccctga

>gi568815597r:146244224_146444715|GENSCAN_predicted_peptide_5|220_aa
MVGSPLPVGLGFTLKGAVRTEVSGKGPEPWGLSSGDGDGRRGKAGQESSGRIAAHFGQDR
LFFKLQKSGESANAVPHYHKLCSRVSHIWGNRRGQHIRSAMDKPRPGKTTFVIMVSPLPA
SHASPFTRTVTCPAHPPPPPPPTPSPPSPHTQLGLSGPTSGPEPAPTAREILRGEAAAPA
LPHLHRSRPIRDVTDSAFPSPRLPFCRSAYQPAAGAGRGK

>gi568815597r:146244224_146444715|GENSCAN_predicted_CDS_5|663_bp
atggtaggctcccctcttcctgtgggtttgggttttaccttgaaaggggctgtcagaaca
gaagtttcagggaaggggccagagccctggggactttcctcaggtgatggtgatggaaga
agaggcaaggcaggacaggaaagctcagggaggatcgcagcgcatttcggccaagacaga
ctgttctttaaactacaaaaatcaggggaaagcgcgaacgcagtcccccactaccacaaa
ttatgcagtcgagtttcccacatttggggaaatcgcaggggtcagcacatccggagtgca
atggataagcctcgccctgggaaaaccaccttcgtgatcatggtatctcccctgccagcc
tcacacgcttcaccctttacacgcacggtcacttgccccgcgcaccccccccccccaccc
ccccccacccccagccctcctagccctcacacacagctgggactctcaggtccgaccagc
ggtcctgaacccgctcccacggcacgggaaatccttcgtggcgaagcagcagcccctgcg
ctgcctcatttacatagaagtcgccctatccgtgatgtcaccgacagtgcctttcccagt
ccccgtctgcctttctgccgctcagcctaccaacccgctgccggagccggcagggggaag
tga

>gi568815597r:146244224_146444715|GENSCAN_predicted_peptide_6|624_aa
MSWENRSTWSHKRQSHTLVIAPQSFCMLERSAPGLQHAISQLALCENLQEATSPSVKPLG
ICKTGYQQQSLQHCTWESVKELNVYVIGVPEEENRERGAEQLMRGKPTTYNQEYCRLLIG
IYVTYTEAKVVNAPLLISKHPRALPFFSNKEGRGGDMKTHHGYCSAFVKAESITWYTNCF
LHYNLQKKANAIPHHHKLQSSFPTCGSNRSQSAHTEYNGEIAPEKHQLHGRIFSCYVSMN
ERTSALPQLHTPHPLHARSLAPRIPPPRPHAASSPPSPDTQLGLSRPTGGPGLAPTAREI
FRGEAAAPELPPLHRNRPICDVTDSAFPVPVCSSAPPSATRPTNQLRERAEKVTPDSTSF
PSHPHPWSLPKKEVFYNILNSHFGEAVYRMVGSPLPVEAPTLKGAVRTEVSGEGLEPWGL
SSGDGDGRRGKAGPEGSEPTRQYNCERPWKTGAMRAVNRVGLIGDPQIGRFWNQDDLAPH
LQQKPPETPGPDPDLSRLGAQGKLNARGTRALAKPFPYKEQACYVYNPMAPVPSTISTWF
YELSTRSPQHRNPTNSHECYREKQGLASTTPANPQPPPALLALTHSWDSQVRPAVLNPLP
RHGKSFVAKQQPLRCLIYIETPYR

>gi568815597r:146244224_146444715|GENSCAN_predicted_CDS_6|1875_bp
atgtcctgggaaaaccggagcacatggtcacacaagagacagagtcatacattggtcatt
gctccacagtcattctgcatgctggagaggagtgctccaggcctgcagcacgccatctct
cagctcgcactgtgtgagaacctccaggaagccacctccccttctgtaaagccactgggt
atctgcaagacaggctaccagcagcaaagtctccagcactgcacttgggaaagcgtcaag
gagttgaatgtatatgtaattggagtgccagaagaagagaaccgagagagaggggcagaa
cagctcatgaggggaaaacccactacatacaatcaagaatactgcagactcctcatcgga
atctatgtaacctacacggaggcgaaggtggtgaacgcacctcttctcatctcaaaacac
ccacgtgctcttccatttttttctaacaaagaagggagaggaggtgacatgaaaacacac
catggatattgctcagcatttgtaaaagctgaaagtatcacttggtacacaaactgcttt
ttgcactacaacctccagaagaaagcgaacgcaattccccaccaccacaaattacagtcc
agtttccccacatgtggaagtaacaggagtcagtcagcacatactgagtacaatggagaa
atcgcccccgaaaaacaccaacttcatggccgtattttctcctgttacgtaagtatgaat
gaacgcacctccgccctgccacagctccatacgcctcaccccttacacgcacggtcactt
gccccgcgcattcccccaccccgcccccatgccgcctcaagtcctcctagccctgacaca
cagctgggactatcacgtccaaccggaggtcctggactagctcccacagcacgagaaatc
tttcgtggcgaagcagcagcccctgagctgcctcctctgcataggaatcgccctatctgt
gatgtcaccgacagcgcctttcccgtccccgtctgctcttccgccccaccctctgccact
cggccgaccaaccagctgcgggagcgggcggagaaagtgacacctgactctacctccttt
ccctcccatccccatccctggtctctcccaaagaaggaagtcttttataatattcttaat
tcacattttggtgaagcagtatacagaatggtaggctcccctcttcctgtggaagcccct
accttgaaaggggctgtcagaacagaagtttcaggggaggggctagagccctggggactt
tcctcaggtgatggtgatggaagaagaggcaaggcaggaccggagggctcagagcccacc
cggcagtacaactgtgaaaggccttggaaaactggagcgatgagagcggtgaatcgtgtt
ggtctcattggagacccgcagattgggagattctggaaccaggacgaccttgcccctcac
ctgcagcagaagcccccggaaacgcccggccccgacccggacctgagccgcctgggggcc
caagggaagctgaacgcccggggcaccagggcactggcaaagccctttccatacaaagag
caagcgtgttatgtctacaacccaatggcaccagttccaagtacaatttctacttggttc
tatgagctgagtacacgttccccccagcacagaaatcctacaaactcccatgaatgctat
agggaaaagcaggggctagccagcaccactccagccaatccccaaccacccccagccctc
ctagccctcacacacagctgggactctcaggtccgaccagcggtcctgaacccgctccca
cggcacgggaaatccttcgtggcgaagcagcagcccctgcgctgcctcatctacatagaa
acgccctatcggtga

>gi568815597r:146244224_146444715|GENSCAN_predicted_peptide_7|121_aa
MLLKEITQLVLPVQCPRSVVDITRLLCVGDRLCRRPGALKQFIEARRNYLAQTEKARRNT
AGKPMAFPGGYPGDCTHRSACSEKPLPSRPRSRAETRRSKENRLERTGSPASVQDTASGS
X

>gi568815597r:146244224_146444715|GENSCAN_predicted_CDS_7|363_bp
atgctactaaaagaaattactcaactagttcttcctgttcagtgtccccgttcggtcgta
gacataacacgcttgctttgtgtaggagatcggctctgccggcgcccaggggccctaaag
caattcatcgaggcccgcagaaactacttggcccaaacggaaaaggcaaggaggaacaca
gcgggaaagcctatggcgttccctggtggctaccccggggactgcactcatagatccgcg
tgttccgagaagcctctgccatcccgaccccggagccgtgcagaaacccgccgctccaaa
gaaaaccggctagaacgcacaggaagcccagccagtgttcaggacacggcgagtggaagc
cnn