FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1205, 1215 aa
1>>>pF1KSDA1205 1215 - 1215 aa - 1215 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 18.2159+/-0.000529; mu= -35.5637+/- 0.033
mean_var=1028.3082+/-210.756, 0's: 0 Z-trim(126.1): 199 B-trim: 44 in 1/61
Lambda= 0.039996
statistics sampled from 50881 (51196) to 50881 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.818), E-opt: 0.2 (0.6), width: 16
Scan time: 23.440
The best scores are: opt bits E(85289)
NP_065770 (OMIM: 616633) proline-rich protein 12 [ (2036) 8462 505.1 1.9e-141
XP_016882520 (OMIM: 616633) PREDICTED: proline-ric (1424) 2853 181.3 3.8e-44
XP_011536691 (OMIM: 601234) PREDICTED: nascent pol (2078) 522 47.0 0.0016
XP_006719476 (OMIM: 601234) PREDICTED: nascent pol (2082) 522 47.0 0.0016
XP_006719477 (OMIM: 601234) PREDICTED: nascent pol (2082) 522 47.0 0.0016
XP_006719475 (OMIM: 601234) PREDICTED: nascent pol (2082) 522 47.0 0.0016
>>NP_065770 (OMIM: 616633) proline-rich protein 12 [Homo (2036 aa)
initn: 8434 init1: 8434 opt: 8462 Z-score: 2660.6 bits: 505.1 E(85289): 1.9e-141
Smith-Waterman score: 8462; 99.3% identity (99.6% similar) in 1211 aa overlap (5-1215:826-2036)
10 20 30
pF1KSD MEQLPGVPPGPPHPVRPPPPPPPPMPLQLEAHLR
:.. : :.: ::::::::::::::::::
NP_065 PPPPQLLPSVLSHAPSPSPSASKVGVHLLEPATRDGAPQPPPPPPPPPPPMPLQLEAHLR
800 810 820 830 840 850
40 50 60 70 80 90
pF1KSD SHGLEPAAPSPRLRPEESLDPPGAMQELLGALEPLPPAPGDTGVGPPNSEGKDPAGAYRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 SHGLEPAAPSPRLRPEESLDPPGAMQELLGALEPLPPAPGDTGVGPPNSEGKDPAGAYRS
860 870 880 890 900 910
100 110 120 130 140 150
pF1KSD PSPQGTKAPRFVPLTSICFPDSLLQDEERSFFPTMEEMFGGGAADDYGKAGPPEDEGDPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 PSPQGTKAPRFVPLTSICFPDSLLQDEERSFFPTMEEMFGGGAADDYGKAGPPEDEGDPK
920 930 940 950 960 970
160 170 180 190 200 210
pF1KSD AGAGPPPGPPAYDPYGPYCPGRASGAGPETPGLGLDPNKPPELPSTVNAEPLGLIQSGPH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 AGAGPPPGPPAYDPYGPYCPGRASGAGPETPGLGLDPNKPPELPSTVNAEPLGLIQSGPH
980 990 1000 1010 1020 1030
220 230 240 250 260 270
pF1KSD QAAPPPPPPPPPPPAPASEPKGGLTSPIFCSTKPKKLLKTSSFHLLRRRDPPFQTPKKLY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 QAAPPPPPPPPPPPAPASEPKGGLTSPIFCSTKPKKLLKTSSFHLLRRRDPPFQTPKKLY
1040 1050 1060 1070 1080 1090
280 290 300 310 320 330
pF1KSD AQEYEFEADEDKADVPADIRLNPRRLPDLVSSCRSRPALSPLGDIDFCPPNPGPDGPRRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 AQEYEFEADEDKADVPADIRLNPRRLPDLVSSCRSRPALSPLGDIDFCPPNPGPDGPRRR
1100 1110 1120 1130 1140 1150
340 350 360 370 380 390
pF1KSD GRKPTKAKRDGPPRPRGRPRIRPLEVPTTAGPASASTPTDGAKKPRGRGRGRGRKAEEAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 GRKPTKAKRDGPPRPRGRPRIRPLEVPTTAGPASASTPTDGAKKPRGRGRGRGRKAEEAG
1160 1170 1180 1190 1200 1210
400 410 420 430 440 450
pF1KSD GTRLEPLKPLKIKLSVPKAGEGLGTSSGDAISGTDHNSLDSSLTREKIEAKIKEVEEKQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 GTRLEPLKPLKIKLSVPKAGEGLGTSSGDAISGTDHNSLDSSLTREKIEAKIKEVEEKQP
1220 1230 1240 1250 1260 1270
460 470 480 490 500 510
pF1KSD EMKSGFMASFLDFLKSGKRHPPLYQAGLTPPLSPPKSVPPSVPARGLQPQPPATPAVPHP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 EMKSGFMASFLDFLKSGKRHPPLYQAGLTPPLSPPKSVPPSVPARGLQPQPPATPAVPHP
1280 1290 1300 1310 1320 1330
520 530 540 550 560 570
pF1KSD PPSGAFGLGGALEAAESEGLGLGCPSPCKRLDEELKRNLETLPSFSSDEEDSVAKNRDLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 PPSGAFGLGGALEAAESEGLGLGCPSPCKRLDEELKRNLETLPSFSSDEEDSVAKNRDLQ
1340 1350 1360 1370 1380 1390
580 590 600 610 620 630
pF1KSD ESISSAISALDDPPLAGPKDTSTPDGPPLAPAAAVPGPPPLPGLPSANSNGTPEPPLLEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 ESISSAISALDDPPLAGPKDTSTPDGPPLAPAAAVPGPPPLPGLPSANSNGTPEPPLLEE
1400 1410 1420 1430 1440 1450
640 650 660 670 680 690
pF1KSD KPPPTPPPAPTPQPQPPPPPPPPQPALPSPPPLVAPTPSSPPPPPLPPPPPPAMPSPPPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 KPPPTPPPAPTPQPQPPPPPPPPQPALPSPPPLVAPTPSSPPPPPLPPPPPPAMPSPPPP
1460 1470 1480 1490 1500 1510
700 710 720 730 740 750
pF1KSD PPPAAAPLAAPPEEPAAPSPEDPELPDTRPLHLAKKQETAAVCGETDEEAGESGGEGIFR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 PPPAAAPLAAPPEEPAAPSPEDPELPDTRPLHLAKKQETAAVCGETDEEAGESGGEGIFR
1520 1530 1540 1550 1560 1570
760 770 780 790 800 810
pF1KSD ERDEFVIRAEDIPSLKLALQTGREPPPIWRVQKALLQKFTPEIKDGQRQFCATSNYLGYF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 ERDEFVIRAEDIPSLKLALQTGREPPPIWRVQKALLQKFTPEIKDGQRQFCATSNYLGYF
1580 1590 1600 1610 1620 1630
820 830 840 850 860 870
pF1KSD GDAKNRYQRLYVKFLENVNKKDYVRVCARKPWHRPPVPVRRSGQAKNPVSAGGSSAPPPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 GDAKNRYQRLYVKFLENVNKKDYVRVCARKPWHRPPVPVRRSGQAKNPVSAGGSSAPPPK
1640 1650 1660 1670 1680 1690
880 890 900 910 920 930
pF1KSD APAPPPKPETPEKTTSEKPPEQTPETAMPEPPAPEKPSLLRPVEKEKEKEKVTRGERPLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 APAPPPKPETPEKTTSEKPPEQTPETAMPEPPAPEKPSLLRPVEKEKEKEKVTRGERPLR
1700 1710 1720 1730 1740 1750
940 950 960 970 980 990
pF1KSD GERATSGRQTRPERSLATGQPATSRLPKARPTKVKAEPPPKKRKKWLKEAGGNATAGGGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 GERATSGRQTRPERSLATGQPATSRLPKARPTKVKAEPPPKKRKKWLKEAGGNATAGGGP
1760 1770 1780 1790 1800 1810
1000 1010 1020 1030 1040 1050
pF1KSD PGSSSDSESSPGAPSEDERAVPGRLLKTRAMREMYRSYVEMLVSTALDPDMIQALEDTHD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 PGSSSDSESSPGAPSEDERAVPGRLLKTRAMREMYRSYVEMLVSTALDPDMIQALEDTHD
1820 1830 1840 1850 1860 1870
1060 1070 1080 1090 1100 1110
pF1KSD ELYLPPMRKIDGLLNEHKKKVLKRLSLSPALQDALHTFPQLQVEQSGEGSPEEGAVRLRP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 ELYLPPMRKIDGLLNEHKKKVLKRLSLSPALQDALHTFPQLQVEQSGEGSPEEGAVRLRP
1880 1890 1900 1910 1920 1930
1120 1130 1140 1150 1160 1170
pF1KSD AGEPYNRKTLSKLKRSVVRAQEFKVELEKSGYYTLYHSLHHYKYHTFLRCRDQTLAIEGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 AGEPYNRKTLSKLKRSVVRAQEFKVELEKSGYYTLYHSLHHYKYHTFLRCRDQTLAIEGG
1940 1950 1960 1970 1980 1990
1180 1190 1200 1210
pF1KSD AEDLGQEEVVQQCMRNQPWLEQLFDSFSDLLAQAQAHSRCG
:::::::::::::::::::::::::::::::::::::::::
NP_065 AEDLGQEEVVQQCMRNQPWLEQLFDSFSDLLAQAQAHSRCG
2000 2010 2020 2030
>>XP_016882520 (OMIM: 616633) PREDICTED: proline-rich pr (1424 aa)
initn: 2825 init1: 2825 opt: 2853 Z-score: 913.5 bits: 181.3 E(85289): 3.8e-44
Smith-Waterman score: 2853; 98.0% identity (98.8% similar) in 401 aa overlap (5-405:826-1226)
10 20 30
pF1KSD MEQLPGVPPGPPHPVRPPPPPPPPMPLQLEAHLR
:.. : :.: ::::::::::::::::::
XP_016 PPPPQLLPSVLSHAPSPSPSASKVGVHLLEPATRDGAPQPPPPPPPPPPPMPLQLEAHLR
800 810 820 830 840 850
40 50 60 70 80 90
pF1KSD SHGLEPAAPSPRLRPEESLDPPGAMQELLGALEPLPPAPGDTGVGPPNSEGKDPAGAYRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 SHGLEPAAPSPRLRPEESLDPPGAMQELLGALEPLPPAPGDTGVGPPNSEGKDPAGAYRS
860 870 880 890 900 910
100 110 120 130 140 150
pF1KSD PSPQGTKAPRFVPLTSICFPDSLLQDEERSFFPTMEEMFGGGAADDYGKAGPPEDEGDPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 PSPQGTKAPRFVPLTSICFPDSLLQDEERSFFPTMEEMFGGGAADDYGKAGPPEDEGDPK
920 930 940 950 960 970
160 170 180 190 200 210
pF1KSD AGAGPPPGPPAYDPYGPYCPGRASGAGPETPGLGLDPNKPPELPSTVNAEPLGLIQSGPH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 AGAGPPPGPPAYDPYGPYCPGRASGAGPETPGLGLDPNKPPELPSTVNAEPLGLIQSGPH
980 990 1000 1010 1020 1030
220 230 240 250 260 270
pF1KSD QAAPPPPPPPPPPPAPASEPKGGLTSPIFCSTKPKKLLKTSSFHLLRRRDPPFQTPKKLY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 QAAPPPPPPPPPPPAPASEPKGGLTSPIFCSTKPKKLLKTSSFHLLRRRDPPFQTPKKLY
1040 1050 1060 1070 1080 1090
280 290 300 310 320 330
pF1KSD AQEYEFEADEDKADVPADIRLNPRRLPDLVSSCRSRPALSPLGDIDFCPPNPGPDGPRRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 AQEYEFEADEDKADVPADIRLNPRRLPDLVSSCRSRPALSPLGDIDFCPPNPGPDGPRRR
1100 1110 1120 1130 1140 1150
340 350 360 370 380 390
pF1KSD GRKPTKAKRDGPPRPRGRPRIRPLEVPTTAGPASASTPTDGAKKPRGRGRGRGRKAEEAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 GRKPTKAKRDGPPRPRGRPRIRPLEVPTTAGPASASTPTDGAKKPRGRGRGRGRKAEEAG
1160 1170 1180 1190 1200 1210
400 410 420 430 440 450
pF1KSD GTRLEPLKPLKIKLSVPKAGEGLGTSSGDAISGTDHNSLDSSLTREKIEAKIKEVEEKQP
:::::::::::
XP_016 GTRLEPLKPLKSPRCWRRNPHPLHLLPRLLSLSLRHPLRRHSQPCPRHPRWWPPRPAHHR
1220 1230 1240 1250 1260 1270
>>XP_011536691 (OMIM: 601234) PREDICTED: nascent polypep (2078 aa)
initn: 503 init1: 221 opt: 522 Z-score: 184.5 bits: 47.0 E(85289): 0.0016
Smith-Waterman score: 725; 26.3% identity (42.5% similar) in 1034 aa overlap (5-972:728-1651)
10 20 30
pF1KSD MEQLPGVPPGPPHPVRPPPPPPPPMPLQLEAHLR
: .: . : : :: :: .... .
XP_011 LPLVPTASENCPVAPSPQNTCAPLATLVLAPEIPKSVPSPSLPPAGTPPGTK-KVDGISH
700 710 720 730 740 750
40 50 60 70 80 90
pF1KSD SHGLEPAAPSPRLRPEESLDPPGAMQELLGALEPLPPAPGDTGVG-PPNSEGKDPAGAYR
. .: :.: ::. : :. . .: :.: : .:. ::. :... :
XP_011 TSALAPVASSPKECPTED-SGASATASSKGTLTYLADSPSPLGVSVSPQTK--------R
760 770 780 790 800
100 110 120 130 140 150
pF1KSD SPSPQGTKAPRFVPLTSICFPDSLLQDEERSFFPTMEEMFGGG--AADDYGKAGPPEDEG
:. .:. .: .:. .. : : . : ::.: : :. . . :: .:
XP_011 PPTKKGSAGPD-TPIGNLSSPVSPV---EASFLPENSLSFQGSKDSPATTHSPTPPSPKG
810 820 830 840 850 860
160 170 180 190
pF1KSD DPKAGA-GP--PPG---PPAYDPYG-----PYCP--GRASGAGPETPGLGLDPNKPPELP
: .: : : : :: : :. : : :. : ..:.:.. ..: .
XP_011 APTPSAVTPLSPKGVTLPPKETPTPSVVNLPF-PKEGPATPAPKQAPALSMTSSSPKKAR
870 880 890 900 910 920
200 210 220 230 240 250
pF1KSD STVNAEPLGLIQSGPHQAAPPPPPPPPPPP--APASE-PKGGLTSPIFCSTKPKKLLKTS
.: : :. : ..:: :: :: : .::. :: . : : .:: :
XP_011 AT--PAPKGIPASPSPKGAPTPPAATPPSPKGGPATPSPKWAPTPPAATPPSPKGGPATP
930 940 950 960 970 980
260 270 280 290 300 310
pF1KSD SFHLLRRRDPPFQTPKKLYAQEYEFEADEDKADVPADIRLNPRRLPDLVSSCRSRPALSP
: . :: :: . . : . .:. ..: : : .. :: .:
XP_011 SPK--GAPTPPAATPPSPKGGP----ATPSPKGAPTPPAVTP---P----SPKGSPAATP
990 1000 1010 1020
320 330 340 350 360
pF1KSD LGDIDFCPPN---PGPDG-----PRRRGRKPTKAKRDGPPRPRGRPRIRPLEVPTTAGPA
. :: :.: : : .: : : : :.: : :. : :
XP_011 FPKGASTPPAATPPSPKGSPAATPLPKGAPTTPAAT--LPSPKGGPATPSLKGAPTPPAA
1030 1040 1050 1060 1070 1080
370 380 390 400 410 420
pF1KSD SASTPTDGAKKPRGRGRGRGRKAEEA---GGTRLEPLK--PLKIKLSVPKAGEGLGTSSG
. .: : : .: : :: : : : . :. ::.:
XP_011 TPPSPKGGPATPSPKGAPMPPAATPPSPKGGLATPPHKGAPTTPAATPPSPKGGLATPPP
1090 1100 1110 1120 1130 1140
430 440 450 460 470
pF1KSD DAISGTDHNSLDS---SLTREKIEAKIKEVEEKQPEMKSGFMA-SFLDFLKSGKRHPPLY
. : . : .:. .. : :.:. . : . ::
XP_011 KGAPTTPAATPPSPKGGLATPPPKGAPTTPAATPPSPKGGLATPSPKGAPTTPAATPPSP
1150 1160 1170 1180 1190 1200
480 490 500 510 520
pF1KSD QAGLTPPLSP------PKSVPPSVPARGLQ-PQP---PATPAVPHPPPSGAFGLGGALEA
..::. : :: : ..::: : :: :.: :.:::. : :.: : :
XP_011 KGGLATP-SPKGAPTTPAATPPS-PKGGLATPSPKGAPTTPAATPPSPKG----GPATPP
1210 1220 1230 1240 1250
530 540 550 560 570 580
pF1KSD AESEGLGLGCPSPCKRLDEELKRNLETLPSFSSDEEDSVAKNRDLQESISSAISALDDPP
. : :.: :: .: : : ... . . :
XP_011 PK------GAPTPPAATPPSLKGGLATPP----------------HKGAPNPAVVTPPSP
1260 1270 1280 1290
590 600 610 620 630 640
pF1KSD LAGPKDTSTPDGPPLAPAAAVPGPPPLPGLPSANSNGTPEPPLLEEKPPPTPP--PAPTP
.:: :: : : : :::. :.: :: : . :.: :: . : : :: ::
XP_011 KGGPA-TSPPKGAPTPPAATPPSPKGSPGTPPPK--GAPTPPAVTPPSPKGTPTLPATTP
1300 1310 1320 1330 1340 1350
650 660 670 680 690 700
pF1KSD QPQPPPPPPPPQPALPSPPPLVAPTPSSPPPPPLPPPPP---PAMPSPP-PPPPPAAAPL
. . : : . . :.:: : ::: : . :: : ::.::: : ::. ::
XP_011 SSKGGPTTPSSKEG-PTPP---AATPSHKGGPAMTPPSPKRGPAIPSPKGDPTSPAVIPL
1360 1370 1380 1390 1400 1410
710 720 730 740 750
pF1KSD AAPPEEPAAP-------SPEDPEL--PDTRPLHLAKKQETAAVCGETDEEAGESGGEGIF
. : . ::.: .: .: : . :. : : :.: .:: .
XP_011 S-PKKAPATPVTREGAATPSKGDLTPPAVTPVSLKKAPATSA----------PKGGPATP
1420 1430 1440 1450
760 770 780 790 800 810
pF1KSD RERDEFVIRAEDIPSLKLALQTGREPPPIWRVQKALLQKFTPEIKDGQRQFCATSNYLGY
. . .. : :: : ::: .: . : .: :: .:
XP_011 SSKGDPTLPAVTPPSPK-------EPPAPKQVATSSSPKKAP----------ATPAPMG-
1460 1470 1480 1490 1500
820 830 840 850 860 870
pF1KSD FGDAKNRYQRLYVKFLENVNKKDYVRVCARKPWHRPPV-PVRRSGQAKNPVSAGGSSA-P
. : : .. .: : .: :. :. . :.:.. . . :
XP_011 ------------APTLPAVIPSSPKEVPATPSSRRDPIAPTATLLSKKTPATLAPKEALI
1510 1520 1530 1540
880 890 900 910 920
pF1KSD PPKAPAPPPKPETPEKTTSEKPPEQTPETAMPEPPAPEKPSLLR--PVEKEKEKEKVTRG
:: .: :: .:: : .. : :: . : :: . : :: .. .
XP_011 PPAMTVPSPK-KTPAIPTPKEAPA-TPSSKEASSPPAVTPSTYKGAPSPKELLIPPAVTS
1550 1560 1570 1580 1590 1600
930 940 950 960 970 980
pF1KSD ERPLRGERATSGRQTRPERSLATGQP-ATSRLPKARPTKVKAEPPPKKRKKWLKEAGGNA
: .. . ::.. :: : .: : . :...: :
XP_011 PSPKEAPTPPAVTPPSPEKGPATPAPKGTPTSPPVTPSSLKDSPTSPASVTCKMGATVPQ
1610 1620 1630 1640 1650 1660
990 1000 1010 1020 1030 1040
pF1KSD TAGGGPPGSSSDSESSPGAPSEDERAVPGRLLKTRAMREMYRSYVEMLVSTALDPDMIQA
XP_011 ASKGLPAKKGPTALKEVLVAPAPESTPIITAPTRKGPQTKKSSATSPPICPDPSAKNGSK
1670 1680 1690 1700 1710 1720
>>XP_006719476 (OMIM: 601234) PREDICTED: nascent polypep (2082 aa)
initn: 503 init1: 221 opt: 522 Z-score: 184.4 bits: 47.0 E(85289): 0.0016
Smith-Waterman score: 725; 26.3% identity (42.5% similar) in 1034 aa overlap (5-972:728-1651)
10 20 30
pF1KSD MEQLPGVPPGPPHPVRPPPPPPPPMPLQLEAHLR
: .: . : : :: :: .... .
XP_006 LPLVPTASENCPVAPSPQNTCAPLATLVLAPEIPKSVPSPSLPPAGTPPGTK-KVDGISH
700 710 720 730 740 750
40 50 60 70 80 90
pF1KSD SHGLEPAAPSPRLRPEESLDPPGAMQELLGALEPLPPAPGDTGVG-PPNSEGKDPAGAYR
. .: :.: ::. : :. . .: :.: : .:. ::. :... :
XP_006 TSALAPVASSPKECPTED-SGASATASSKGTLTYLADSPSPLGVSVSPQTK--------R
760 770 780 790 800
100 110 120 130 140 150
pF1KSD SPSPQGTKAPRFVPLTSICFPDSLLQDEERSFFPTMEEMFGGG--AADDYGKAGPPEDEG
:. .:. .: .:. .. : : . : ::.: : :. . . :: .:
XP_006 PPTKKGSAGPD-TPIGNLSSPVSPV---EASFLPENSLSFQGSKDSPATTHSPTPPSPKG
810 820 830 840 850 860
160 170 180 190
pF1KSD DPKAGA-GP--PPG---PPAYDPYG-----PYCP--GRASGAGPETPGLGLDPNKPPELP
: .: : : : :: : :. : : :. : ..:.:.. ..: .
XP_006 APTPSAVTPLSPKGVTLPPKETPTPSVVNLPF-PKEGPATPAPKQAPALSMTSSSPKKAR
870 880 890 900 910 920
200 210 220 230 240 250
pF1KSD STVNAEPLGLIQSGPHQAAPPPPPPPPPPP--APASE-PKGGLTSPIFCSTKPKKLLKTS
.: : :. : ..:: :: :: : .::. :: . : : .:: :
XP_006 AT--PAPKGIPASPSPKGAPTPPAATPPSPKGGPATPSPKWAPTPPAATPPSPKGGPATP
930 940 950 960 970 980
260 270 280 290 300 310
pF1KSD SFHLLRRRDPPFQTPKKLYAQEYEFEADEDKADVPADIRLNPRRLPDLVSSCRSRPALSP
: . :: :: . . : . .:. ..: : : .. :: .:
XP_006 SPK--GAPTPPAATPPSPKGGP----ATPSPKGAPTPPAVTP---P----SPKGSPAATP
990 1000 1010 1020
320 330 340 350 360
pF1KSD LGDIDFCPPN---PGPDG-----PRRRGRKPTKAKRDGPPRPRGRPRIRPLEVPTTAGPA
. :: :.: : : .: : : : :.: : :. : :
XP_006 FPKGASTPPAATPPSPKGSPAATPLPKGAPTTPAAT--LPSPKGGPATPSLKGAPTPPAA
1030 1040 1050 1060 1070 1080
370 380 390 400 410 420
pF1KSD SASTPTDGAKKPRGRGRGRGRKAEEA---GGTRLEPLK--PLKIKLSVPKAGEGLGTSSG
. .: : : .: : :: : : : . :. ::.:
XP_006 TPPSPKGGPATPSPKGAPMPPAATPPSPKGGLATPPHKGAPTTPAATPPSPKGGLATPPP
1090 1100 1110 1120 1130 1140
430 440 450 460 470
pF1KSD DAISGTDHNSLDS---SLTREKIEAKIKEVEEKQPEMKSGFMA-SFLDFLKSGKRHPPLY
. : . : .:. .. : :.:. . : . ::
XP_006 KGAPTTPAATPPSPKGGLATPPPKGAPTTPAATPPSPKGGLATPSPKGAPTTPAATPPSP
1150 1160 1170 1180 1190 1200
480 490 500 510 520
pF1KSD QAGLTPPLSP------PKSVPPSVPARGLQ-PQP---PATPAVPHPPPSGAFGLGGALEA
..::. : :: : ..::: : :: :.: :.:::. : :.: : :
XP_006 KGGLATP-SPKGAPTTPAATPPS-PKGGLATPSPKGAPTTPAATPPSPKG----GPATPP
1210 1220 1230 1240 1250
530 540 550 560 570 580
pF1KSD AESEGLGLGCPSPCKRLDEELKRNLETLPSFSSDEEDSVAKNRDLQESISSAISALDDPP
. : :.: :: .: : : ... . . :
XP_006 PK------GAPTPPAATPPSLKGGLATPP----------------HKGAPNPAVVTPPSP
1260 1270 1280 1290
590 600 610 620 630 640
pF1KSD LAGPKDTSTPDGPPLAPAAAVPGPPPLPGLPSANSNGTPEPPLLEEKPPPTPP--PAPTP
.:: :: : : : :::. :.: :: : . :.: :: . : : :: ::
XP_006 KGGPA-TSPPKGAPTPPAATPPSPKGSPGTPPPK--GAPTPPAVTPPSPKGTPTLPATTP
1300 1310 1320 1330 1340 1350
650 660 670 680 690 700
pF1KSD QPQPPPPPPPPQPALPSPPPLVAPTPSSPPPPPLPPPPP---PAMPSPP-PPPPPAAAPL
. . : : . . :.:: : ::: : . :: : ::.::: : ::. ::
XP_006 SSKGGPTTPSSKEG-PTPP---AATPSHKGGPAMTPPSPKRGPAIPSPKGDPTSPAVIPL
1360 1370 1380 1390 1400 1410
710 720 730 740 750
pF1KSD AAPPEEPAAP-------SPEDPEL--PDTRPLHLAKKQETAAVCGETDEEAGESGGEGIF
. : . ::.: .: .: : . :. : : :.: .:: .
XP_006 S-PKKAPATPVTREGAATPSKGDLTPPAVTPVSLKKAPATSA----------PKGGPATP
1420 1430 1440 1450
760 770 780 790 800 810
pF1KSD RERDEFVIRAEDIPSLKLALQTGREPPPIWRVQKALLQKFTPEIKDGQRQFCATSNYLGY
. . .. : :: : ::: .: . : .: :: .:
XP_006 SSKGDPTLPAVTPPSPK-------EPPAPKQVATSSSPKKAP----------ATPAPMG-
1460 1470 1480 1490 1500
820 830 840 850 860 870
pF1KSD FGDAKNRYQRLYVKFLENVNKKDYVRVCARKPWHRPPV-PVRRSGQAKNPVSAGGSSA-P
. : : .. .: : .: :. :. . :.:.. . . :
XP_006 ------------APTLPAVIPSSPKEVPATPSSRRDPIAPTATLLSKKTPATLAPKEALI
1510 1520 1530 1540
880 890 900 910 920
pF1KSD PPKAPAPPPKPETPEKTTSEKPPEQTPETAMPEPPAPEKPSLLR--PVEKEKEKEKVTRG
:: .: :: .:: : .. : :: . : :: . : :: .. .
XP_006 PPAMTVPSPK-KTPAIPTPKEAPA-TPSSKEASSPPAVTPSTYKGAPSPKELLIPPAVTS
1550 1560 1570 1580 1590 1600
930 940 950 960 970 980
pF1KSD ERPLRGERATSGRQTRPERSLATGQP-ATSRLPKARPTKVKAEPPPKKRKKWLKEAGGNA
: .. . ::.. :: : .: : . :...: :
XP_006 PSPKEAPTPPAVTPPSPEKGPATPAPKGTPTSPPVTPSSLKDSPTSPASVTCKMGATVPQ
1610 1620 1630 1640 1650 1660
990 1000 1010 1020 1030 1040
pF1KSD TAGGGPPGSSSDSESSPGAPSEDERAVPGRLLKTRAMREMYRSYVEMLVSTALDPDMIQA
XP_006 ASKGLPAKKGPTALKEVLVAPAPESTPIITAPTRKGPQTKKSSATSPPICPDPSAKNGSK
1670 1680 1690 1700 1710 1720
>>XP_006719477 (OMIM: 601234) PREDICTED: nascent polypep (2082 aa)
initn: 503 init1: 221 opt: 522 Z-score: 184.4 bits: 47.0 E(85289): 0.0016
Smith-Waterman score: 725; 26.3% identity (42.5% similar) in 1034 aa overlap (5-972:728-1651)
10 20 30
pF1KSD MEQLPGVPPGPPHPVRPPPPPPPPMPLQLEAHLR
: .: . : : :: :: .... .
XP_006 LPLVPTASENCPVAPSPQNTCAPLATLVLAPEIPKSVPSPSLPPAGTPPGTK-KVDGISH
700 710 720 730 740 750
40 50 60 70 80 90
pF1KSD SHGLEPAAPSPRLRPEESLDPPGAMQELLGALEPLPPAPGDTGVG-PPNSEGKDPAGAYR
. .: :.: ::. : :. . .: :.: : .:. ::. :... :
XP_006 TSALAPVASSPKECPTED-SGASATASSKGTLTYLADSPSPLGVSVSPQTK--------R
760 770 780 790 800
100 110 120 130 140 150
pF1KSD SPSPQGTKAPRFVPLTSICFPDSLLQDEERSFFPTMEEMFGGG--AADDYGKAGPPEDEG
:. .:. .: .:. .. : : . : ::.: : :. . . :: .:
XP_006 PPTKKGSAGPD-TPIGNLSSPVSPV---EASFLPENSLSFQGSKDSPATTHSPTPPSPKG
810 820 830 840 850 860
160 170 180 190
pF1KSD DPKAGA-GP--PPG---PPAYDPYG-----PYCP--GRASGAGPETPGLGLDPNKPPELP
: .: : : : :: : :. : : :. : ..:.:.. ..: .
XP_006 APTPSAVTPLSPKGVTLPPKETPTPSVVNLPF-PKEGPATPAPKQAPALSMTSSSPKKAR
870 880 890 900 910 920
200 210 220 230 240 250
pF1KSD STVNAEPLGLIQSGPHQAAPPPPPPPPPPP--APASE-PKGGLTSPIFCSTKPKKLLKTS
.: : :. : ..:: :: :: : .::. :: . : : .:: :
XP_006 AT--PAPKGIPASPSPKGAPTPPAATPPSPKGGPATPSPKWAPTPPAATPPSPKGGPATP
930 940 950 960 970 980
260 270 280 290 300 310
pF1KSD SFHLLRRRDPPFQTPKKLYAQEYEFEADEDKADVPADIRLNPRRLPDLVSSCRSRPALSP
: . :: :: . . : . .:. ..: : : .. :: .:
XP_006 SPK--GAPTPPAATPPSPKGGP----ATPSPKGAPTPPAVTP---P----SPKGSPAATP
990 1000 1010 1020
320 330 340 350 360
pF1KSD LGDIDFCPPN---PGPDG-----PRRRGRKPTKAKRDGPPRPRGRPRIRPLEVPTTAGPA
. :: :.: : : .: : : : :.: : :. : :
XP_006 FPKGASTPPAATPPSPKGSPAATPLPKGAPTTPAAT--LPSPKGGPATPSLKGAPTPPAA
1030 1040 1050 1060 1070 1080
370 380 390 400 410 420
pF1KSD SASTPTDGAKKPRGRGRGRGRKAEEA---GGTRLEPLK--PLKIKLSVPKAGEGLGTSSG
. .: : : .: : :: : : : . :. ::.:
XP_006 TPPSPKGGPATPSPKGAPMPPAATPPSPKGGLATPPHKGAPTTPAATPPSPKGGLATPPP
1090 1100 1110 1120 1130 1140
430 440 450 460 470
pF1KSD DAISGTDHNSLDS---SLTREKIEAKIKEVEEKQPEMKSGFMA-SFLDFLKSGKRHPPLY
. : . : .:. .. : :.:. . : . ::
XP_006 KGAPTTPAATPPSPKGGLATPPPKGAPTTPAATPPSPKGGLATPSPKGAPTTPAATPPSP
1150 1160 1170 1180 1190 1200
480 490 500 510 520
pF1KSD QAGLTPPLSP------PKSVPPSVPARGLQ-PQP---PATPAVPHPPPSGAFGLGGALEA
..::. : :: : ..::: : :: :.: :.:::. : :.: : :
XP_006 KGGLATP-SPKGAPTTPAATPPS-PKGGLATPSPKGAPTTPAATPPSPKG----GPATPP
1210 1220 1230 1240 1250
530 540 550 560 570 580
pF1KSD AESEGLGLGCPSPCKRLDEELKRNLETLPSFSSDEEDSVAKNRDLQESISSAISALDDPP
. : :.: :: .: : : ... . . :
XP_006 PK------GAPTPPAATPPSLKGGLATPP----------------HKGAPNPAVVTPPSP
1260 1270 1280 1290
590 600 610 620 630 640
pF1KSD LAGPKDTSTPDGPPLAPAAAVPGPPPLPGLPSANSNGTPEPPLLEEKPPPTPP--PAPTP
.:: :: : : : :::. :.: :: : . :.: :: . : : :: ::
XP_006 KGGPA-TSPPKGAPTPPAATPPSPKGSPGTPPPK--GAPTPPAVTPPSPKGTPTLPATTP
1300 1310 1320 1330 1340 1350
650 660 670 680 690 700
pF1KSD QPQPPPPPPPPQPALPSPPPLVAPTPSSPPPPPLPPPPP---PAMPSPP-PPPPPAAAPL
. . : : . . :.:: : ::: : . :: : ::.::: : ::. ::
XP_006 SSKGGPTTPSSKEG-PTPP---AATPSHKGGPAMTPPSPKRGPAIPSPKGDPTSPAVIPL
1360 1370 1380 1390 1400 1410
710 720 730 740 750
pF1KSD AAPPEEPAAP-------SPEDPEL--PDTRPLHLAKKQETAAVCGETDEEAGESGGEGIF
. : . ::.: .: .: : . :. : : :.: .:: .
XP_006 S-PKKAPATPVTREGAATPSKGDLTPPAVTPVSLKKAPATSA----------PKGGPATP
1420 1430 1440 1450
760 770 780 790 800 810
pF1KSD RERDEFVIRAEDIPSLKLALQTGREPPPIWRVQKALLQKFTPEIKDGQRQFCATSNYLGY
. . .. : :: : ::: .: . : .: :: .:
XP_006 SSKGDPTLPAVTPPSPK-------EPPAPKQVATSSSPKKAP----------ATPAPMG-
1460 1470 1480 1490 1500
820 830 840 850 860 870
pF1KSD FGDAKNRYQRLYVKFLENVNKKDYVRVCARKPWHRPPV-PVRRSGQAKNPVSAGGSSA-P
. : : .. .: : .: :. :. . :.:.. . . :
XP_006 ------------APTLPAVIPSSPKEVPATPSSRRDPIAPTATLLSKKTPATLAPKEALI
1510 1520 1530 1540
880 890 900 910 920
pF1KSD PPKAPAPPPKPETPEKTTSEKPPEQTPETAMPEPPAPEKPSLLR--PVEKEKEKEKVTRG
:: .: :: .:: : .. : :: . : :: . : :: .. .
XP_006 PPAMTVPSPK-KTPAIPTPKEAPA-TPSSKEASSPPAVTPSTYKGAPSPKELLIPPAVTS
1550 1560 1570 1580 1590 1600
930 940 950 960 970 980
pF1KSD ERPLRGERATSGRQTRPERSLATGQP-ATSRLPKARPTKVKAEPPPKKRKKWLKEAGGNA
: .. . ::.. :: : .: : . :...: :
XP_006 PSPKEAPTPPAVTPPSPEKGPATPAPKGTPTSPPVTPSSLKDSPTSPASVTCKMGATVPQ
1610 1620 1630 1640 1650 1660
990 1000 1010 1020 1030 1040
pF1KSD TAGGGPPGSSSDSESSPGAPSEDERAVPGRLLKTRAMREMYRSYVEMLVSTALDPDMIQA
XP_006 ASKGLPAKKGPTALKEVLVAPAPESTPIITAPTRKGPQTKKSSATSPPICPDPSAKNGSK
1670 1680 1690 1700 1710 1720
>>XP_006719475 (OMIM: 601234) PREDICTED: nascent polypep (2082 aa)
initn: 503 init1: 221 opt: 522 Z-score: 184.4 bits: 47.0 E(85289): 0.0016
Smith-Waterman score: 725; 26.3% identity (42.5% similar) in 1034 aa overlap (5-972:728-1651)
10 20 30
pF1KSD MEQLPGVPPGPPHPVRPPPPPPPPMPLQLEAHLR
: .: . : : :: :: .... .
XP_006 LPLVPTASENCPVAPSPQNTCAPLATLVLAPEIPKSVPSPSLPPAGTPPGTK-KVDGISH
700 710 720 730 740 750
40 50 60 70 80 90
pF1KSD SHGLEPAAPSPRLRPEESLDPPGAMQELLGALEPLPPAPGDTGVG-PPNSEGKDPAGAYR
. .: :.: ::. : :. . .: :.: : .:. ::. :... :
XP_006 TSALAPVASSPKECPTED-SGASATASSKGTLTYLADSPSPLGVSVSPQTK--------R
760 770 780 790 800
100 110 120 130 140 150
pF1KSD SPSPQGTKAPRFVPLTSICFPDSLLQDEERSFFPTMEEMFGGG--AADDYGKAGPPEDEG
:. .:. .: .:. .. : : . : ::.: : :. . . :: .:
XP_006 PPTKKGSAGPD-TPIGNLSSPVSPV---EASFLPENSLSFQGSKDSPATTHSPTPPSPKG
810 820 830 840 850 860
160 170 180 190
pF1KSD DPKAGA-GP--PPG---PPAYDPYG-----PYCP--GRASGAGPETPGLGLDPNKPPELP
: .: : : : :: : :. : : :. : ..:.:.. ..: .
XP_006 APTPSAVTPLSPKGVTLPPKETPTPSVVNLPF-PKEGPATPAPKQAPALSMTSSSPKKAR
870 880 890 900 910 920
200 210 220 230 240 250
pF1KSD STVNAEPLGLIQSGPHQAAPPPPPPPPPPP--APASE-PKGGLTSPIFCSTKPKKLLKTS
.: : :. : ..:: :: :: : .::. :: . : : .:: :
XP_006 AT--PAPKGIPASPSPKGAPTPPAATPPSPKGGPATPSPKWAPTPPAATPPSPKGGPATP
930 940 950 960 970 980
260 270 280 290 300 310
pF1KSD SFHLLRRRDPPFQTPKKLYAQEYEFEADEDKADVPADIRLNPRRLPDLVSSCRSRPALSP
: . :: :: . . : . .:. ..: : : .. :: .:
XP_006 SPK--GAPTPPAATPPSPKGGP----ATPSPKGAPTPPAVTP---P----SPKGSPAATP
990 1000 1010 1020
320 330 340 350 360
pF1KSD LGDIDFCPPN---PGPDG-----PRRRGRKPTKAKRDGPPRPRGRPRIRPLEVPTTAGPA
. :: :.: : : .: : : : :.: : :. : :
XP_006 FPKGASTPPAATPPSPKGSPAATPLPKGAPTTPAAT--LPSPKGGPATPSLKGAPTPPAA
1030 1040 1050 1060 1070 1080
370 380 390 400 410 420
pF1KSD SASTPTDGAKKPRGRGRGRGRKAEEA---GGTRLEPLK--PLKIKLSVPKAGEGLGTSSG
. .: : : .: : :: : : : . :. ::.:
XP_006 TPPSPKGGPATPSPKGAPMPPAATPPSPKGGLATPPHKGAPTTPAATPPSPKGGLATPPP
1090 1100 1110 1120 1130 1140
430 440 450 460 470
pF1KSD DAISGTDHNSLDS---SLTREKIEAKIKEVEEKQPEMKSGFMA-SFLDFLKSGKRHPPLY
. : . : .:. .. : :.:. . : . ::
XP_006 KGAPTTPAATPPSPKGGLATPPPKGAPTTPAATPPSPKGGLATPSPKGAPTTPAATPPSP
1150 1160 1170 1180 1190 1200
480 490 500 510 520
pF1KSD QAGLTPPLSP------PKSVPPSVPARGLQ-PQP---PATPAVPHPPPSGAFGLGGALEA
..::. : :: : ..::: : :: :.: :.:::. : :.: : :
XP_006 KGGLATP-SPKGAPTTPAATPPS-PKGGLATPSPKGAPTTPAATPPSPKG----GPATPP
1210 1220 1230 1240 1250
530 540 550 560 570 580
pF1KSD AESEGLGLGCPSPCKRLDEELKRNLETLPSFSSDEEDSVAKNRDLQESISSAISALDDPP
. : :.: :: .: : : ... . . :
XP_006 PK------GAPTPPAATPPSLKGGLATPP----------------HKGAPNPAVVTPPSP
1260 1270 1280 1290
590 600 610 620 630 640
pF1KSD LAGPKDTSTPDGPPLAPAAAVPGPPPLPGLPSANSNGTPEPPLLEEKPPPTPP--PAPTP
.:: :: : : : :::. :.: :: : . :.: :: . : : :: ::
XP_006 KGGPA-TSPPKGAPTPPAATPPSPKGSPGTPPPK--GAPTPPAVTPPSPKGTPTLPATTP
1300 1310 1320 1330 1340 1350
650 660 670 680 690 700
pF1KSD QPQPPPPPPPPQPALPSPPPLVAPTPSSPPPPPLPPPPP---PAMPSPP-PPPPPAAAPL
. . : : . . :.:: : ::: : . :: : ::.::: : ::. ::
XP_006 SSKGGPTTPSSKEG-PTPP---AATPSHKGGPAMTPPSPKRGPAIPSPKGDPTSPAVIPL
1360 1370 1380 1390 1400 1410
710 720 730 740 750
pF1KSD AAPPEEPAAP-------SPEDPEL--PDTRPLHLAKKQETAAVCGETDEEAGESGGEGIF
. : . ::.: .: .: : . :. : : :.: .:: .
XP_006 S-PKKAPATPVTREGAATPSKGDLTPPAVTPVSLKKAPATSA----------PKGGPATP
1420 1430 1440 1450
760 770 780 790 800 810
pF1KSD RERDEFVIRAEDIPSLKLALQTGREPPPIWRVQKALLQKFTPEIKDGQRQFCATSNYLGY
. . .. : :: : ::: .: . : .: :: .:
XP_006 SSKGDPTLPAVTPPSPK-------EPPAPKQVATSSSPKKAP----------ATPAPMG-
1460 1470 1480 1490 1500
820 830 840 850 860 870
pF1KSD FGDAKNRYQRLYVKFLENVNKKDYVRVCARKPWHRPPV-PVRRSGQAKNPVSAGGSSA-P
. : : .. .: : .: :. :. . :.:.. . . :
XP_006 ------------APTLPAVIPSSPKEVPATPSSRRDPIAPTATLLSKKTPATLAPKEALI
1510 1520 1530 1540
880 890 900 910 920
pF1KSD PPKAPAPPPKPETPEKTTSEKPPEQTPETAMPEPPAPEKPSLLR--PVEKEKEKEKVTRG
:: .: :: .:: : .. : :: . : :: . : :: .. .
XP_006 PPAMTVPSPK-KTPAIPTPKEAPA-TPSSKEASSPPAVTPSTYKGAPSPKELLIPPAVTS
1550 1560 1570 1580 1590 1600
930 940 950 960 970 980
pF1KSD ERPLRGERATSGRQTRPERSLATGQP-ATSRLPKARPTKVKAEPPPKKRKKWLKEAGGNA
: .. . ::.. :: : .: : . :...: :
XP_006 PSPKEAPTPPAVTPPSPEKGPATPAPKGTPTSPPVTPSSLKDSPTSPASVTCKMGATVPQ
1610 1620 1630 1640 1650 1660
990 1000 1010 1020 1030 1040
pF1KSD TAGGGPPGSSSDSESSPGAPSEDERAVPGRLLKTRAMREMYRSYVEMLVSTALDPDMIQA
XP_006 ASKGLPAKKGPTALKEVLVAPAPESTPIITAPTRKGPQTKKSSATSPPICPDPSAKNGSK
1670 1680 1690 1700 1710 1720
1215 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 05:22:37 2016 done: Thu Nov 3 05:22:40 2016
Total Scan time: 23.440 Total Display time: 0.190
Function used was FASTA [36.3.4 Apr, 2011]