Result of GENSCAN for pF1KE1665

KOP
KOP Flexi HaloTag ORF List search
Result of GENSCAN for pF1KE1665
GENSCAN 1.0	Date run:  6-Nov-116	Time: 17:14:36

Sequence gi568815593r:54879335_55085517 : 206183 bp : 40.45% C+G : Isochore 1 ( 0 - 43 C+G%)

Parameter matrix: HumanIso.smat

Predicted genes/exons:

Gn.Ex Type S .Begin ...End .Len Fr Ph I/Ac Do/T CodRg P.... Tscr..
----- ---- - ------ ------ ---- -- -- ---- ---- ----- ----- ------

 1.03 PlyA -    456    451    6                               1.05
 1.02 Term -   4306   4191  116  2  2   80   46    84 0.635   1.15
 1.01 Init -   4793   4724   70  2  1   89   85   184 0.995  17.46
 1.00 Prom -   8434   8395   40                              -4.15

 2.00 Prom +   8514   8553   40                             -12.72
 2.01 Init +   9429   9527   99  2  0   65  100   109 0.845  10.11
 2.02 Intr +  10131  10270  140  2  2   90   82   128 0.739  10.74
 2.03 Intr +  20469  20578  110  0  2   66   76    62 0.429   1.81
 2.04 Term +  21629  21807  179  0  2   85   41   111 0.288   2.97
 2.05 PlyA +  23327  23332    6                               1.05

 3.04 PlyA -  23957  23952    6                               1.05
 3.03 Term -  28406  28304  103  1  1  127   36    85 0.457   3.97
 3.02 Intr -  32438  32345   94  0  1   56  101    64 0.918   2.60
 3.01 Init -  32969  32795  175  2  1   80   75   163 0.686  13.76
 3.00 Prom -  36359  36320   40                              -6.95

 4.00 Prom +  38914  38953   40                              -3.65
 4.01 Sngl +  42356  43003  648  1  0   85   48   214 0.689  13.02
 4.02 PlyA +  43035  43040    6                               1.05

 5.08 PlyA -  45139  45134    6                               1.05
 5.07 Term -  55934  55662  273  2  0   17   48   208 0.383   4.19
 5.06 Intr -  57485  57413   73  1  1   20   86   135 0.093   4.99
 5.05 Intr -  72367  72279   89  1  2   69   83    45 0.008  -0.05
 5.04 Intr -  80743  80657   87  1  0  117   44    32 0.034   0.95
 5.03 Intr -  81327  81098  230  1  2   66   89   124 0.013   6.97
 5.02 Intr - 102812 102663  150  0  0  101  102    70 0.922   8.91
 5.01 Init - 106480 105883  598  1  1   46   98   473 0.975  39.58
 5.00 Prom - 112610 112571   40                              -5.35

 6.00 Prom + 113412 113451   40                              -5.85
 6.01 Init + 116858 116898   41  1  2   73  119    66 0.460   7.91
 6.02 Intr + 118927 119066  140  1  2   73   65   114 0.222   6.79
 6.03 Term + 121845 122395  551  1  2   30   39   216 0.477   4.37
 6.04 PlyA + 122498 122503    6                               1.05

 7.00 Prom + 127055 127094   40                              -3.15
 7.01 Sngl + 134645 134836  192  1  0   48   54   281 0.953  15.59
 7.02 PlyA + 135151 135156    6                               1.05

 8.00 Prom + 135320 135359   40                              -6.15
 8.01 Sngl + 135782 136258  477  1  0   66   38   216 0.702  10.24
 8.02 PlyA + 136614 136619    6                               1.05

 9.00 Prom + 140313 140352   40                              -3.45
 9.01 Init + 145334 145473  140  1  2   51  109    70 0.353   5.06
 9.02 Intr + 151100 151250  151  2  1  111  100    -3 0.435   2.44
 9.03 Intr + 152030 152299  270  1  0   33  116   232 0.547  17.32
 9.04 Term + 154431 154592  162  2  0  116   38    91 0.992   3.85
 9.05 PlyA + 154780 154785    6                               1.05

10.03 PlyA - 155441 155436    6                               1.05
10.02 Term - 157791 157686  106  2  1  121   39    87 0.712   4.00
10.01 Init - 163444 163320  125  1  2   70    8   174 0.251   7.29
10.00 Prom - 174570 174531   40                              -3.75

11.03 PlyA - 177124 177119    6                               1.05
11.02 Term - 197821 196847  975  1  0   15   49   284 0.135   8.26
11.01 Init - 200475 200158  318  0  0   81   76   145 0.026   9.98

Suboptimal exons with probability > 0.800

Exnum Type S .Begin ...End .Len Fr Ph B/Ac Do/T CodRg P.... Tscr..
----- ---- - ------ ------ ---- -- -- ---- ---- ----- ----- ------

S.001 Term - 100101  99998  104  1  2   78   42    81 0.886  -0.04
S.002 Sngl - 200879 200523  357  2  0   58   54   261 0.923  15.51


Predicted peptide sequence(s):

Predicted coding sequence(s):


>gi568815593r:54879335_55085517|GENSCAN_predicted_peptide_1|61_aa
MGRFGARRLVLLAACLGFCGALGALLLTPPPASYSAARDPQGSGYHKLTAGIFFGHRPAV
P

>gi568815593r:54879335_55085517|GENSCAN_predicted_CDS_1|186_bp
atggggcggttcggggcccgccgcctcgtcctactggctgcctgcctggggttctgcggg
gcgctaggagcactgctcctcaccccgcccccggcgagttactctgccgcacgtgacccg
cagggctcgggttaccataaacttaccgctggaatcttctttggccaccggcccgctgtc
ccataa

>gi568815593r:54879335_55085517|GENSCAN_predicted_peptide_2|175_aa
MTLGNKNVKADSFSKLSTKKHKECNDLVAVTEPVSVHAGSMETASFPAEWSHQVSNLFHF
SQATLNALGPPLVQELCEAGPCYGPNVWPSPPPPCPNSNAEILTLNVMVLGVGALRGSSG
DSRPYEVLPSAKVRCRISPLVQSIQMFIVGHTVTGAVAKTAGADILNDTGFLSFF

>gi568815593r:54879335_55085517|GENSCAN_predicted_CDS_2|528_bp
atgaccctgggaaacaagaatgtcaaagctgattccttctcaaaactttcaaccaagaag
cataaagaatgcaatgatctggtggcagtcacagaaccagtgtcagtccatgcaggctcc
atggagaccgcctccttcccagctgaatggtcccatcaggtcagcaaccttttccatttc
tctcaagctactctgaacgctcttgggccacccctagtgcaggagctctgtgaggctggc
ccttgttatggaccaaatgtctggccttctcccccacctccctgcccaaattcaaatgct
gaaatcctaaccctcaatgtgatggtattaggagtgggggccttgagaggcagctctgga
gactcaaggccatacgaggtacttccttcagccaaggttagatgcaggattagtccatta
gtccaatccatacagatgttcatcgtaggccacacagtaacaggagcagttgcgaaaact
gcgggagctgacattctgaatgacacagggtttctctcattcttctag

>gi568815593r:54879335_55085517|GENSCAN_predicted_peptide_3|123_aa
MEGPDMGVKSSSSAHLQQRAAESVTPANALQNRIAQPSLNSKPDMQTCEKEYIIIVLTRA
GGRALDFRDRTCSNGSETLGGKPEKKLQIWPLSGLLTFLQASFPKLNDYKYKVACTDLAF
DEQ

>gi568815593r:54879335_55085517|GENSCAN_predicted_CDS_3|372_bp
atggagggaccagacatgggagtgaagtcctctagctcagcccacctgcagcagagggca
gctgagtcagtgactccagccaatgccttgcagaacagaattgctcaaccaagtcttaac
tcaaaaccggacatgcagacttgtgagaaagaatatatcattattgttttaactagagct
ggaggcagagccctggacttcagagacaggacctgctcaaatggatctgagactctaggg
gggaagccagagaagaaattacaaatatggcctttgagtgggttgcttacttttctccaa
gcaagttttccgaagcttaacgactataaatataaagtggcttgcacagacttggcattt
gacgaacagtaa

>gi568815593r:54879335_55085517|GENSCAN_predicted_peptide_4|215_aa
MDAKILNKIVANQNQQHIKKLIHRDQVGFIPGMQDWFNILKSINVIHHKNRTNDKSYMVI
SIDAEKAFDKIQHNFMLKSLNKLGIHGTYLKIIRAIYDKPTANIILNGQKLEAFPLKTSK
RKGCPLSPLLFNIVLEVLAREIRQKKAIKGIQIGRDEVKLSLLADDMIVYLENPIISAQN
LLKLISNVSKVSGYKINVHHKHSYTLRTDKQRAKS

>gi568815593r:54879335_55085517|GENSCAN_predicted_CDS_4|648_bp
atggatgcgaaaatcctcaataaaatagtggcaaaccaaaaccagcagcacatcaaaaag
cttatccaccgcgatcaagttggcttcatacctgggatgcaagactggttcaacatactc
aaatcaataaacgtaatccatcacaaaaacagaaccaatgacaaaagctacatggtcatc
tcaatagatgcagaaaaggccttcgataaaattcaacacaacttcatgctaaaaagtctc
aataaactgggtatccatggaacatatctcaaaataataagagctatttatgacaaaccc
acagccaatatcatactgaatgggcaaaaactggaagcattccctttgaaaaccagcaaa
agaaaaggatgccctctctcaccactcctattcaacatagtattggaagttctggccaga
gaaatcaggcaaaagaaagcaataaagggtattcaaataggaagagacgaagtcaaattg
tctctgttggcagatgacatgattgtatatttagaaaaccccatcatctcagcccaaaat
ctccttaagctgataagcaatgtcagcaaagtctcaggatacaaaatcaatgtgcatcac
aagcattcctatacactaagaacagacaaacagagagccaaatcatga

>gi568815593r:54879335_55085517|GENSCAN_predicted_peptide_5|499_aa
MQNNHLNITDDISLGFSIPGWQQRVNPAFILDFINQNKRAWQEDSAAAGLRKLMTGKHAG
NPVYKTHKRVGRGSATSLDGCFPPAKTTTGEPSRRQLGNMKSVLLLTTLLVPAHLVAAWS
NNYAVDCPQHCDSSECKSSPRCKRTVLDDCGCCRVCAAGRGETCYRTVSGMDGMKCGPGL
RCQPSNGEDPFGEEFGICKDCPYGTFGMDCRETCNCQSGICDRGTGKCLKFPFFQYSVTK
SSNRFVSLTGQDPQIPAMVSLSGASVVGLGILSASSRFVLRLFCAWCGAYKSKVMALGGE
EHANVDSTKAALEGCPKLKRMNTVVQVLLQEHILINHLHANLHLRIGTRELAWGLSMAWP
EHADCRRWRISPTTSDANLTWMKKWRFRTIEKHQECARVEERLCEEQQKSGLVRNNNSSS
SSNNNNNNNNNTMHFNTGKFHRCWKSWKCKRENGGGLEVIKEEGTIPRGQKLHALPHWSS
PACHAGDAVVSGLHLQDQC

>gi568815593r:54879335_55085517|GENSCAN_predicted_CDS_5|1500_bp
atgcaaaacaaccatctaaacataacagatgacatcagcttgggcttttcaattcctgga
tggcagcagcgtgttaatccagccttcatcctggatttcataaaccaaaacaagagagcc
tggcaggaggacagcgctgctgctgggttgaggaaattgatgacgggaaagcatgcgggc
aacccagtgtataaaactcataaacgtgtaggcagaggctcagctaccagtttggacggc
tgcttcccaccagcaaagaccacgactggagagccgagccggaggcagctgggaaacatg
aagagcgtcttgctgctgaccacgctcctcgtgcctgcacacctggtggccgcctggagc
aataattatgcggtggactgccctcaacactgtgacagcagtgagtgcaaaagcagcccg
cgctgcaagaggacagtgctcgacgactgtggctgctgccgagtgtgcgctgcagggcgg
ggagaaacttgctaccgcacagtctcaggcatggatggcatgaagtgtggcccggggctg
aggtgtcagccttctaatggggaggatccttttggtgaagagtttggtatctgcaaagac
tgtccctacggcaccttcgggatggattgcagagagacctgcaactgccagtcaggcatc
tgtgacagggggacgggaaaatgcctgaaattccccttcttccaatattcagtaaccaag
tcttccaacagatttgtttctctcacgggtcaggatccccaaattccagctatggtttct
ctgagtggtgcttctgttgttggtcttggtattctctcagcatcgagcaggtttgtgttg
aggctgttctgtgcttggtgtggagcttacaaatctaaagtcatggctctgggaggggaa
gaacatgctaatgtggacagcaccaaggcagcactggagggctgtccaaagctaaaaagg
atgaatacggttgtgcaggtgttactccaggagcacatcctgataaaccacctgcatgct
aatctccatctcagaataggaaccagggaactggcctgggggctgtccatggcatggcct
gagcatgctgattgccggcgctggaggatttcccccactacatctgatgcaaacctgact
tggatgaaaaagtggagatttagaaccatagagaaacatcaggaatgtgcacgcgtagaa
gaaagactgtgcgaagaacagcaaaagtcaggcctggtcagaaacaacaacagcagcagc
agcagcaacaacaacaacaacaacaacaacaacactatgcatttcaataccgggaagttt
cataggtgttggaagagctggaagtgcaaaagggaaaatggaggaggtctggaagtaata
aaggaagaaggaacaatacccagaggtcagaagctgcatgcactcccacactggagctca
ccagcttgccatgctggagatgctgttgtgtcaggtctgcatcttcaggatcagtgctga

>gi568815593r:54879335_55085517|GENSCAN_predicted_peptide_6|243_aa
MQKETYENTYFNAWACTPQCLQILLSSPSSTAQLLLGYPEQLPAFACHWVPQVPQPCLTV
SQNLLKLIGNVSKVSGYKINVQKSQAFLYTNNRQTESQTMSELPFTIASKRIKYLGIQLT
RDVKDLFKENYKPLLNEIKEDTNKWKNIPCSWIGRINIVTMAILPKVIYRFNAIPIKLPM
TFFTELEKATLKFIWNEKRARIVKTILSKKNKAGGIMIPGFELYYKATVTKIAWYWYQNG
DID

>gi568815593r:54879335_55085517|GENSCAN_predicted_CDS_6|732_bp
atgcaaaaagagacatacgagaatacttacttcaatgcctgggcctgtacccctcagtgc
ttacagatcctgctgagcagcccctcctccacagctcagctcttgctgggctatccggag
cagcttcctgcctttgcatgtcactgggtgcctcaagtccctcagccctgcctgaccgtc
tcccaaaatctccttaagctgataggcaacgtcagcaaagtctcaggatacaaaatcaat
gtgcaaaaatcacaagcattcttatacaccaataacagacaaacagagagccaaaccatg
agtgaactcccatttacaattgcttcaaagagaataaaatatctaggaatccaacttaca
agggatgtgaaggacctcttcaaggagaattacaaaccactgctcaatgaaataaaagag
gacacaaacaaatggaagaacattccatgctcatggataggaagaatcaatattgtgaca
atggccatactgcccaaggtaatttatagattcaatgccatccccatcaagctaccaatg
actttcttcacagaattggaaaaagctactttaaaattcatatggaatgaaaaaagagcc
cgtattgtcaagacaatcctaagcaaaaagaacaaagctggaggcatcatgatacctggc
ttcgaactatattacaaggctacagtaaccaaaatagcatggtactggtaccaaaacgga
gatatagactaa

>gi568815593r:54879335_55085517|GENSCAN_predicted_peptide_7|63_aa
MENDFDELREEGFRRSNFSELKEEVQTQCKEAENLEKRLDKRLTGITGVEKSLNDLMELK
TMA

>gi568815593r:54879335_55085517|GENSCAN_predicted_CDS_7|192_bp
atggagaatgactttgatgagttgagagaagaaggcttcagacgatcaaacttctccgag
ctaaaggaggaagttcaaacccaatgcaaagaagctgaaaaccttgaaaaaagattagac
aaacggctaactggaataaccggtgttgagaagtccttaaatgacctgatggagctgaaa
accatggcatga

>gi568815593r:54879335_55085517|GENSCAN_predicted_peptide_8|158_aa
MKAEIKMFFQTNENEDTTYQNLWDTFKSVCRGKFIALNAHKRKQERSKIDTLASQLKELE
KQEQTRSEASRRQEITKIREELKEIETQKTLQEINESRSWFFEKINKIDRPLARLIKKKI
EKNQIDAIKNDKGDITTDPTGIQTSIRDYYKHLYANKL

>gi568815593r:54879335_55085517|GENSCAN_predicted_CDS_8|477_bp
atgaaggcagaaataaagatgttctttcaaaccaatgagaacgaagacacaacatatcag
aatctctgggacacatttaaatcagtttgtagagggaaatttatagcactaaatgcccac
aagagaaagcaggaaagatctaaaattgacaccctagcatcacaattaaaagaactagag
aagcaagagcaaacacgttcagaagctagcagaaggcaagaaataactaagatcagagaa
gaactgaaggagatagaaacacaaaaaacccttcaagaaatcaatgaatctaggagctgg
ttttttgaaaagatcaacaaaattgatagaccactagcaagacttataaagaagaaaata
gagaagaatcaaatagatgcaataaaaaatgataaaggggatatcaccaccgatcccaca
ggaatacaaacttccatcagagactactataaacacctctatgcaaataaactataa

>gi568815593r:54879335_55085517|GENSCAN_predicted_peptide_9|240_aa
MEIIGGKEVSPHSRPFMASIQYGGHHVCGGVLIDPQWVLTAAHCQYRFTKGQSPTVVLGA
HSLSKNEASKQTLEIKKFIPFSRVTSDPQSNDIMLVKLQTAAKLNKHVKMLHIRSKTSLR
SGTKCKVTGWGATDPDSLRPSDTLREVTVTVLSRKLCNSQSYYNGDPFITKDMVCAGDAK
GQKDSCKGDSGGPLICKGVFHAIVSGGHECGVATKPGIYTLLTKKYQTWIKSNLVPPHTN

>gi568815593r:54879335_55085517|GENSCAN_predicted_CDS_9|723_bp
atggaaattattggagggaaagaagtgtcacctcattccaggccatttatggcctccatc
cagtatggcggacatcacgtttgtggaggtgttctgattgatccacagtgggtgctgaca
gcagcccactgccaatatcggtttaccaaaggccagtctcccactgtggttttaggcgca
cactctctctcaaagaatgaggcctccaaacaaacactggagatcaaaaaatttatacca
ttctcaagagttacatcagatcctcaatcaaatgatatcatgctggttaagcttcaaaca
gccgcaaaactcaataaacatgtcaagatgctccacataagatccaaaacctctcttaga
tctggaaccaaatgcaaggttactggctggggagccaccgatccagattcattaagacct
tctgacaccctgcgagaagtcactgttactgtcctaagtcgaaaactttgcaacagccaa
agttactacaacggcgacccttttatcaccaaagacatggtctgtgcaggagatgccaaa
ggccagaaggattcctgtaagggtgactcagggggccccttgatctgtaaaggtgtcttc
cacgctatagtctctggaggtcatgaatgtggtgttgccacaaagcctggaatctacacc
ctgttaaccaagaaataccagacttggatcaaaagcaaccttgtcccgcctcatacaaat
taa

>gi568815593r:54879335_55085517|GENSCAN_predicted_peptide_10|76_aa
MVEGERHILPGGRQERKENHAKAVSRYKTIRSRETYSLRQEQPHLQTVTLSFRPSSYEFG
ADVIQSTAVFFPKLRA

>gi568815593r:54879335_55085517|GENSCAN_predicted_CDS_10|231_bp
atggtggaaggtgaacggcacatcttacctggtggcagacaagagagaaaagagaaccat
gcaaaagcggtttcccgttataaaaccatcagatctcgtgagacttactcactacgacaa
gaacagccccacctccaaacagtcacactgagctttaggccttcatcatatgaatttgga
gcagacgtgattcagtctacagcagtgttctttcccaaactaagagcttag

>gi568815593r:54879335_55085517|GENSCAN_predicted_peptide_11|430_aa
MKEKMLRAAKEKGRVTHKGKPIRLTADLSAETLQARREWGPIFNILKEKNFQPRISYPAK
LSFISEGEIKSFTDKQMLRDFVTTRPALKELLKEALNMERNTKHGKTDSQIVSELPFTIA
SKRIKYLGIQLTRDVKDLFKENYKPLLNEIKEDTNKWKNIPCSWVGRINIVKMAILPKVI
YRFNAIPIKLPMTFFTELEKTTLNFIWNQKRAHIAKSILSRKNKAGGITLPNFKLYYKAT
VTKTAWYWYQNRDIDQWNRTEPSEVTPLIYNYLIFDKPDKNKQWGKDSLFNKWCWENWLA
ICRKLKLDPFLTPYTKINSRWIKDLHVRPKTIKTLEENLGNTIQDIGMGKDFMSKTPKAI
ATKAKIDKWDLIKLKSFCTAKETTIRVNRQPTEWEKIFAIYSSDKGLISRIYNELKQIYK
KKQTTPSKSG

>gi568815593r:54879335_55085517|GENSCAN_predicted_CDS_11|1293_bp
atgaaggaaaaaatgttaagggcagccaaagagaaaggtcgggttacccacaaagggaag
cccatcagactaacagctgatctctcagcagaaactctacaagccagaagagagtggggg
ccaatattcaacattcttaaagaaaagaattttcaacccagaatttcatatccagccaaa
ttgagcttcataagtgaaggagaaataaaatcctttacagacaagcaaatgctgagagat
tttgtcaccaccaggcctgccctaaaagagctcctgaaggaagcactaaacatggaaagg
aacactaaacatggaaagacagacagccaaatcgtgagtgaactcccattcacaattgct
tcaaagagaataaaatacctaggaatccaacttacaagggatgtgaaggacctcttcaag
gagaactacaaaccactgctcaatgaaataaaagaggatacaaacaaatggaagaacatt
ccatgctcatgggtaggaagaatcaatatcgtgaaaatggccatactgcccaaggtaatt
tatagattcaatgccatccccatcaagctaccaatgactttcttcacagaattggaaaaa
actactttaaacttcatatggaaccaaaaaagagcccacatcgccaagtcaatcctaagc
cgaaagaacaaagctggaggcatcacgctacccaacttcaaactatactacaaggctaca
gtaacgaaaacagcatggtactggtaccaaaacagagatatagaccaatggaacagaaca
gagccctcagaagtaacaccacttatctacaactatctgatctttgacaaacctgacaaa
aacaagcaatggggaaaggattccctatttaataaatggtgctgggaaaactggctagcc
atatgtagaaagctgaaactggatcccttccttacaccttatacaaaaattaattcaaga
tggattaaagacttacatgttagacctaaaaccataaaaacactagaagaaaacctaggc
aataccattcaggacataggcatgggcaaagacttcatgtctaaaacaccaaaagcaata
gcaacaaaagccaaaattgacaaatgggatctaattaaactcaagagcttctgcacagca
aaagaaaccaccatcagagtgaacaggcaacctacagaatgggagaaaatttttgcaatc
tactcatctgacaaagggctaatatccagaatctacaatgaactcaaacaaatttacaag
aaaaaacaaacaaccccatcaaaaagtgggtga