FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4566, 710 aa
1>>>pF1KE4566 710 - 710 aa - 710 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.4626+/-0.00107; mu= 18.2956+/- 0.064
mean_var=58.0631+/-11.549, 0's: 0 Z-trim(101.0): 31 B-trim: 0 in 0/51
Lambda= 0.168315
statistics sampled from 6348 (6359) to 6348 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.548), E-opt: 0.2 (0.195), width: 16
Scan time: 3.440
The best scores are: opt bits E(32554)
CCDS5053.1 PREP gene_id:5550|Hs108|chr6 ( 710) 4891 1196.7 0
CCDS54353.1 PREPL gene_id:9581|Hs108|chr2 ( 638) 372 99.3 1.9e-20
CCDS33190.1 PREPL gene_id:9581|Hs108|chr2 ( 727) 372 99.3 2.1e-20
CCDS42675.1 PREPL gene_id:9581|Hs108|chr2 ( 665) 356 95.4 2.9e-19
CCDS42676.1 PREPL gene_id:9581|Hs108|chr2 ( 661) 330 89.1 2.3e-17
>>CCDS5053.1 PREP gene_id:5550|Hs108|chr6 (710 aa)
initn: 4891 init1: 4891 opt: 4891 Z-score: 6410.4 bits: 1196.7 E(32554): 0
Smith-Waterman score: 4891; 100.0% identity (100.0% similar) in 710 aa overlap (1-710:1-710)
10 20 30 40 50 60
pF1KE4 MLSLQYPDVYRDETAVQDYHGHKICDPYAWLEDPDSEQTKAFVEAQNKITVPFLEQCPIR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 MLSLQYPDVYRDETAVQDYHGHKICDPYAWLEDPDSEQTKAFVEAQNKITVPFLEQCPIR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 GLYKERMTELYDYPKYSCHFKKGKRYFYFYNTGLQNQRVLYVQDSLEGEARVFLDPNILS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 GLYKERMTELYDYPKYSCHFKKGKRYFYFYNTGLQNQRVLYVQDSLEGEARVFLDPNILS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 DDGTVALRGYAFSEDGEYFAYGLSASGSDWVTIKFMKVDGAKELPDVLERVKFSCMAWTH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 DDGTVALRGYAFSEDGEYFAYGLSASGSDWVTIKFMKVDGAKELPDVLERVKFSCMAWTH
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 DGKGMFYNSYPQQDGKSDGTETSTNLHQKLYYHVLGTDQSEDILCAEFPDEPKWMGGAEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 DGKGMFYNSYPQQDGKSDGTETSTNLHQKLYYHVLGTDQSEDILCAEFPDEPKWMGGAEL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 SDDGRYVLLSIREGCDPVNRLWYCDLQQESSGIAGILKWVKLIDNFEGEYDYVTNEGTVF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 SDDGRYVLLSIREGCDPVNRLWYCDLQQESSGIAGILKWVKLIDNFEGEYDYVTNEGTVF
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 TFKTNRQSPNYRVINIDFRDPEESKWKVLVPEHEKDVLEWIACVRSNFLVLCYLHDVKNI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 TFKTNRQSPNYRVINIDFRDPEESKWKVLVPEHEKDVLEWIACVRSNFLVLCYLHDVKNI
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 LQLHDLTTGALLKTFPLDVGSIVGYSGQKKDTEIFYQFTSFLSPGIIYHCDLTKEELEPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 LQLHDLTTGALLKTFPLDVGSIVGYSGQKKDTEIFYQFTSFLSPGIIYHCDLTKEELEPR
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 VFREVTVKGIDASDYQTVQIFYPSKDGTKIPMFIVHKKGIKLDGSHPAFLYGYGGFNISI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 VFREVTVKGIDASDYQTVQIFYPSKDGTKIPMFIVHKKGIKLDGSHPAFLYGYGGFNISI
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE4 TPNYSVSRLIFVRHMGGILAVANIRGGGEYGETWHKGGILANKQNCFDDFQCAAEYLIKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 TPNYSVSRLIFVRHMGGILAVANIRGGGEYGETWHKGGILANKQNCFDDFQCAAEYLIKE
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE4 GYTSPKRLTINGGSNGGLLVAACANQRPDLFGCVIAQVGVMDMLKFHKYTIGHAWTTDYG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 GYTSPKRLTINGGSNGGLLVAACANQRPDLFGCVIAQVGVMDMLKFHKYTIGHAWTTDYG
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE4 CSDSKQHFEWLVKYSPLHNVKLPEADDIQYPSMLLLTADHDDRVVPLHSLKFIATLQYIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 CSDSKQHFEWLVKYSPLHNVKLPEADDIQYPSMLLLTADHDDRVVPLHSLKFIATLQYIV
610 620 630 640 650 660
670 680 690 700 710
pF1KE4 GRSRKQSNPLLIHVDTKAGHGAGKPTAKVIEEVSDMFAFIARCLNVDWIP
::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 GRSRKQSNPLLIHVDTKAGHGAGKPTAKVIEEVSDMFAFIARCLNVDWIP
670 680 690 700 710
>>CCDS54353.1 PREPL gene_id:9581|Hs108|chr2 (638 aa)
initn: 260 init1: 179 opt: 372 Z-score: 480.6 bits: 99.3 E(32554): 1.9e-20
Smith-Waterman score: 398; 24.9% identity (54.5% similar) in 473 aa overlap (210-667:141-582)
180 190 200 210 220 230
pF1KE4 HDGKGMFYNSYPQQDGKSDGTETSTNLHQKLYYHVLGTDQSEDILCAEFPDEPKWMGGAE
.: ..: .. .. . .: .:...
CCDS54 PNVSSFEWVKDEEDEDVLFYTFQRNLRCHDVYRATFGDNKRNERFYTE--KDPSYFVFLY
120 130 140 150 160
240 250 260 270 280 290
pF1KE4 LSDDGRYVLLSIREGCDPVNRLWYCD---------LQQESSGIAGILKWVKLIDNFEGEY
:. :.:.. ..: . ....: : : :. : :.: .:. :. :
CCDS54 LTKDSRFLTINIMN--KTTSEVWLIDGLSPWDPPVLIQKR--IHGVLYYVEHRDD---EL
170 180 190 200 210 220
300 310 320 330 340
pF1KE4 DYVTNEGTVFTFKTNRQSPNY-RVINIDFRDPEESKWKVLVPEHEKDVLEWIACVRSNFL
.:: : :: : . . ..: :. . . ::. . :: :: ::
CCDS54 YILTNVGEPTEFKLMRTAADTPAIMNWDLFFTMKRNTKVIDLDMFKD-----HCVL--FL
230 240 250 260 270
350 360 370 380 390 400
pF1KE4 VLCYLHDVKNILQLHDLTTGALLKTFPLDVGSIVGYSGQKKDTEIFYQFTSFLSPGIIYH
: : :.. : : .. .: : : : :. ... :. .:. : . : :
CCDS54 KHSNLLYV-NVIGLADDSVRSL-KLPPWACGFIMDTNSDPKNCP--FQLCSPIRPPKYY-
280 290 300 310 320
410 420 430 440 450 460
pF1KE4 CDLTKEELEPRVFREVTVKGIDASDYQTVQIFYPSKDGTKIPMFIVHKKGIKLDGSHPAF
: . : ..:.:. . .. ..... :::: .:: . :: . ..: .
CCDS54 ---TYKFAEGKLFEETGHEDPITKTSRVLRLEAKSKDGKLVPMTVFHKTDSEDLQKKPLL
330 340 350 360 370 380
470 480 490 500 510 520
pF1KE4 LYGYGGFNISITPNYSVSRLIFVRHMGGILAVANIRGGGEYGETWHKGGILANKQNCFDD
.. ::...... :. : ..: : ::: ..::::: : :: : :..: : . :
CCDS54 VHVYGAYGMDLKMNFRPERRVLVDD-GWILAYCHVRGGGELGLQWHADGRLTKKLNGLAD
390 400 410 420 430 440
530 540 550 560 570 580
pF1KE4 FQCAAEYLIKEGYTSPKRLTINGGSNGGLLVAACANQRPDLFGCVIAQVGVMDMLKFHKY
.. . : .:...:. :... : ::.:..: :. :.: : .. .:.:.
CCDS54 LEACIKTLHGQGFSQPSLTTLTAFSAGGVLAGALCNSNPELVRAVTLEAPFLDVLNTMMD
450 460 470 480 490 500
590 600 610 620 630 640
pF1KE4 T---IGHAWTTDYGC-SDSKQHFEWLVKYSPLHNVKLPEADDIQYPSMLLLTADHDDRVV
: . ..: :....: ... .: : .:.: :. .:::. . . ..:.::
CCDS54 TTLPLTLEELEEWGNPSSDEKHKNYIKRYCPYQNIK-PQ----HYPSIHITAYENDERV-
510 520 530 540 550
650 660 670 680 690 700
pF1KE4 PLHSL-KFIATLQYIVGRSRKQSNPLLIHVDTKAGHGAGKPTAKVIEEVSDMFAFIARCL
::... .. :. ... :..
CCDS54 PLKGIVSYTEKLKEAIAEHAKDTGEGYQTPNIILDIQPGGNHVIEDSHKKITAQIKFLYE
560 570 580 590 600 610
>>CCDS33190.1 PREPL gene_id:9581|Hs108|chr2 (727 aa)
initn: 260 init1: 179 opt: 372 Z-score: 479.7 bits: 99.3 E(32554): 2.1e-20
Smith-Waterman score: 398; 24.9% identity (54.5% similar) in 473 aa overlap (210-667:230-671)
180 190 200 210 220 230
pF1KE4 HDGKGMFYNSYPQQDGKSDGTETSTNLHQKLYYHVLGTDQSEDILCAEFPDEPKWMGGAE
.: ..: .. .. . .: .:...
CCDS33 PNVSSFEWVKDEEDEDVLFYTFQRNLRCHDVYRATFGDNKRNERFYTE--KDPSYFVFLY
200 210 220 230 240 250
240 250 260 270 280 290
pF1KE4 LSDDGRYVLLSIREGCDPVNRLWYCD---------LQQESSGIAGILKWVKLIDNFEGEY
:. :.:.. ..: . ....: : : :. : :.: .:. :. :
CCDS33 LTKDSRFLTINIMN--KTTSEVWLIDGLSPWDPPVLIQKR--IHGVLYYVEHRDD---EL
260 270 280 290 300 310
300 310 320 330 340
pF1KE4 DYVTNEGTVFTFKTNRQSPNY-RVINIDFRDPEESKWKVLVPEHEKDVLEWIACVRSNFL
.:: : :: : . . ..: :. . . ::. . :: :: ::
CCDS33 YILTNVGEPTEFKLMRTAADTPAIMNWDLFFTMKRNTKVIDLDMFKD-----HCVL--FL
320 330 340 350 360
350 360 370 380 390 400
pF1KE4 VLCYLHDVKNILQLHDLTTGALLKTFPLDVGSIVGYSGQKKDTEIFYQFTSFLSPGIIYH
: : :.. : : .. .: : : : :. ... :. .:. : . : :
CCDS33 KHSNLLYV-NVIGLADDSVRSL-KLPPWACGFIMDTNSDPKNCP--FQLCSPIRPPKYY-
370 380 390 400 410
410 420 430 440 450 460
pF1KE4 CDLTKEELEPRVFREVTVKGIDASDYQTVQIFYPSKDGTKIPMFIVHKKGIKLDGSHPAF
: . : ..:.:. . .. ..... :::: .:: . :: . ..: .
CCDS33 ---TYKFAEGKLFEETGHEDPITKTSRVLRLEAKSKDGKLVPMTVFHKTDSEDLQKKPLL
420 430 440 450 460 470
470 480 490 500 510 520
pF1KE4 LYGYGGFNISITPNYSVSRLIFVRHMGGILAVANIRGGGEYGETWHKGGILANKQNCFDD
.. ::...... :. : ..: : ::: ..::::: : :: : :..: : . :
CCDS33 VHVYGAYGMDLKMNFRPERRVLVDD-GWILAYCHVRGGGELGLQWHADGRLTKKLNGLAD
480 490 500 510 520 530
530 540 550 560 570 580
pF1KE4 FQCAAEYLIKEGYTSPKRLTINGGSNGGLLVAACANQRPDLFGCVIAQVGVMDMLKFHKY
.. . : .:...:. :... : ::.:..: :. :.: : .. .:.:.
CCDS33 LEACIKTLHGQGFSQPSLTTLTAFSAGGVLAGALCNSNPELVRAVTLEAPFLDVLNTMMD
540 550 560 570 580 590
590 600 610 620 630 640
pF1KE4 T---IGHAWTTDYGC-SDSKQHFEWLVKYSPLHNVKLPEADDIQYPSMLLLTADHDDRVV
: . ..: :....: ... .: : .:.: :. .:::. . . ..:.::
CCDS33 TTLPLTLEELEEWGNPSSDEKHKNYIKRYCPYQNIK-PQ----HYPSIHITAYENDERV-
600 610 620 630 640
650 660 670 680 690 700
pF1KE4 PLHSL-KFIATLQYIVGRSRKQSNPLLIHVDTKAGHGAGKPTAKVIEEVSDMFAFIARCL
::... .. :. ... :..
CCDS33 PLKGIVSYTEKLKEAIAEHAKDTGEGYQTPNIILDIQPGGNHVIEDSHKKITAQIKFLYE
650 660 670 680 690 700
>>CCDS42675.1 PREPL gene_id:9581|Hs108|chr2 (665 aa)
initn: 260 init1: 179 opt: 356 Z-score: 459.3 bits: 95.4 E(32554): 2.9e-19
Smith-Waterman score: 367; 24.5% identity (55.1% similar) in 392 aa overlap (284-667:237-609)
260 270 280 290 300 310
pF1KE4 GCDPVNRLWYCDLQQESSGIAGILKWVKLIDNFEGEYDYVTNEGTVFTFKTNRQSPNYRV
:: ..: :. .. . :.: .. . .
CCDS42 WVKDEEDEDVLFYTFQRNLRCHDVYRATFGDNKRNERFYTEKDPSYFVFLYLTKDSRFLT
210 220 230 240 250 260
320 330 340 350 360 370
pF1KE4 INIDFRDPEESKWKV--LVPEHEKDVLEWIACVRSNFLVLCYL-HDVKNILQLHDLTTGA
::: . : : . : : ... . :: :. : .. : .. .
CCDS42 INIMNKTTSEV-WLIDGLSPWDPPVLIQ-----KRIHGVLYYVEHRDDELYILTNVGEPT
270 280 290 300 310 320
380 390 400 410 420 430
pF1KE4 LLKTFPLDVGSIVGYSGQKKDTEIFYQFTSFLSPGIIYHCDLTKEELEPRVFREVTVKGI
.: : : :. ... :. .:. : . : : : . : ..:.:. .
CCDS42 EFKLPPWACGFIMDTNSDPKNCP--FQLCSPIRPPKYY----TYKFAEGKLFEETGHEDP
330 340 350 360 370
440 450 460 470 480 490
pF1KE4 DASDYQTVQIFYPSKDGTKIPMFIVHKKGIKLDGSHPAFLYGYGGFNISITPNYSVSRLI
.. ..... :::: .:: . :: . ..: ... ::...... :. : .
CCDS42 ITKTSRVLRLEAKSKDGKLVPMTVFHKTDSEDLQKKPLLVHVYGAYGMDLKMNFRPERRV
380 390 400 410 420 430
500 510 520 530 540 550
pF1KE4 FVRHMGGILAVANIRGGGEYGETWHKGGILANKQNCFDDFQCAAEYLIKEGYTSPKRLTI
.: : ::: ..::::: : :: : :..: : . :.. . : .:...:. :.
CCDS42 LVDD-GWILAYCHVRGGGELGLQWHADGRLTKKLNGLADLEACIKTLHGQGFSQPSLTTL
440 450 460 470 480 490
560 570 580 590 600
pF1KE4 NGGSNGGLLVAACANQRPDLFGCVIAQVGVMDMLKFHKYT---IGHAWTTDYGC-SDSKQ
.. : ::.:..: :. :.: : .. .:.:. : . ..: :....
CCDS42 TAFSAGGVLAGALCNSNPELVRAVTLEAPFLDVLNTMMDTTLPLTLEELEEWGNPSSDEK
500 510 520 530 540 550
610 620 630 640 650 660
pF1KE4 HFEWLVKYSPLHNVKLPEADDIQYPSMLLLTADHDDRVVPLHSL-KFIATLQYIVGRSRK
: ... .: : .:.: :. .:::. . . ..:.:: ::... .. :. ... :
CCDS42 HKNYIKRYCPYQNIK-PQ----HYPSIHITAYENDERV-PLKGIVSYTEKLKEAIAEHAK
560 570 580 590 600
670 680 690 700 710
pF1KE4 QSNPLLIHVDTKAGHGAGKPTAKVIEEVSDMFAFIARCLNVDWIP
..
CCDS42 DTGEGYQTPNIILDIQPGGNHVIEDSHKKITAQIKFLYEELGLDSTSVFEDLKKYLKF
610 620 630 640 650 660
>>CCDS42676.1 PREPL gene_id:9581|Hs108|chr2 (661 aa)
initn: 255 init1: 179 opt: 330 Z-score: 425.2 bits: 89.1 E(32554): 2.3e-17
Smith-Waterman score: 332; 25.2% identity (56.6% similar) in 401 aa overlap (284-667:237-605)
260 270 280 290 300 310
pF1KE4 GCDPVNRLWYCDLQQESSGIAGILKWVKLIDNFEGEYDYVTNEGTVFTFKTNRQSPNYRV
:: ..: :. .. . :.: .. . .
CCDS42 WVKDEEDEDVLFYTFQRNLRCHDVYRATFGDNKRNERFYTEKDPSYFVFLYLTKDSRFLT
210 220 230 240 250 260
320 330 340 350 360
pF1KE4 INIDFRDPEE-------SKWK--VLVPEHEKDVLEWIACVRSNFLVLCYLHDVKNILQLH
::: . : : : ::. .. . :: .. :.. : . : .: . ...
CCDS42 INIMNKTTSEVWLIDGLSPWDPPVLIQKRIHGVLYYVEH-RDDELYI--LTNVGEPTEFK
270 280 290 300 310 320
370 380 390 400 410 420
pF1KE4 DLTTGALLKTFPLDVGSIVGYS---GQKKDTEIFYQFTSFLSPGIIYHCDLTKEELEPRV
. :.: :. .:.... .:..:... .. : . :: : :.
CCDS42 LMRTAA-------DTPAIMNWDLFFTMKRNTKVI-DLDMFKD-----HCVLF---LKHSN
330 340 350 360
430 440 450 460 470 480
pF1KE4 FREVTVKGIDASDYQTVQIFYPSKDGTKIPMFIVHKKGIKLDGSHPAFLYGYGGFNISIT
. :.: :. :.: .:. . ::: .:: . :: . ..: ... ::......
CCDS42 LLYVNVIGL-ADD--SVRSL---KDGKLVPMTVFHKTDSEDLQKKPLLVHVYGAYGMDLK
370 380 390 400 410 420
490 500 510 520 530 540
pF1KE4 PNYSVSRLIFVRHMGGILAVANIRGGGEYGETWHKGGILANKQNCFDDFQCAAEYLIKEG
:. : ..: : ::: ..::::: : :: : :..: : . :.. . : .:
CCDS42 MNFRPERRVLVDD-GWILAYCHVRGGGELGLQWHADGRLTKKLNGLADLEACIKTLHGQG
430 440 450 460 470 480
550 560 570 580 590
pF1KE4 YTSPKRLTINGGSNGGLLVAACANQRPDLFGCVIAQVGVMDMLKFHKYT---IGHAWTTD
...:. :... : ::.:..: :. :.: : .. .:.:. : . .
CCDS42 FSQPSLTTLTAFSAGGVLAGALCNSNPELVRAVTLEAPFLDVLNTMMDTTLPLTLEELEE
490 500 510 520 530 540
600 610 620 630 640 650
pF1KE4 YGC-SDSKQHFEWLVKYSPLHNVKLPEADDIQYPSMLLLTADHDDRVVPLHSL-KFIATL
.: :....: ... .: : .:.: :. .:::. . . ..:.:: ::... .. :
CCDS42 WGNPSSDEKHKNYIKRYCPYQNIK-PQ----HYPSIHITAYENDERV-PLKGIVSYTEKL
550 560 570 580 590
660 670 680 690 700 710
pF1KE4 QYIVGRSRKQSNPLLIHVDTKAGHGAGKPTAKVIEEVSDMFAFIARCLNVDWIP
. ... :..
CCDS42 KEAIAEHAKDTGEGYQTPNIILDIQPGGNHVIEDSHKKITAQIKFLYEELGLDSTSVFED
600 610 620 630 640 650
710 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 17:34:19 2016 done: Mon Nov 7 17:34:20 2016
Total Scan time: 3.440 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]