FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4566, 710 aa 1>>>pF1KE4566 710 - 710 aa - 710 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4626+/-0.00107; mu= 18.2956+/- 0.064 mean_var=58.0631+/-11.549, 0's: 0 Z-trim(101.0): 31 B-trim: 0 in 0/51 Lambda= 0.168315 statistics sampled from 6348 (6359) to 6348 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.548), E-opt: 0.2 (0.195), width: 16 Scan time: 3.440 The best scores are: opt bits E(32554) CCDS5053.1 PREP gene_id:5550|Hs108|chr6 ( 710) 4891 1196.7 0 CCDS54353.1 PREPL gene_id:9581|Hs108|chr2 ( 638) 372 99.3 1.9e-20 CCDS33190.1 PREPL gene_id:9581|Hs108|chr2 ( 727) 372 99.3 2.1e-20 CCDS42675.1 PREPL gene_id:9581|Hs108|chr2 ( 665) 356 95.4 2.9e-19 CCDS42676.1 PREPL gene_id:9581|Hs108|chr2 ( 661) 330 89.1 2.3e-17 >>CCDS5053.1 PREP gene_id:5550|Hs108|chr6 (710 aa) initn: 4891 init1: 4891 opt: 4891 Z-score: 6410.4 bits: 1196.7 E(32554): 0 Smith-Waterman score: 4891; 100.0% identity (100.0% similar) in 710 aa overlap (1-710:1-710) 10 20 30 40 50 60 pF1KE4 MLSLQYPDVYRDETAVQDYHGHKICDPYAWLEDPDSEQTKAFVEAQNKITVPFLEQCPIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 MLSLQYPDVYRDETAVQDYHGHKICDPYAWLEDPDSEQTKAFVEAQNKITVPFLEQCPIR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 GLYKERMTELYDYPKYSCHFKKGKRYFYFYNTGLQNQRVLYVQDSLEGEARVFLDPNILS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 GLYKERMTELYDYPKYSCHFKKGKRYFYFYNTGLQNQRVLYVQDSLEGEARVFLDPNILS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 DDGTVALRGYAFSEDGEYFAYGLSASGSDWVTIKFMKVDGAKELPDVLERVKFSCMAWTH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 DDGTVALRGYAFSEDGEYFAYGLSASGSDWVTIKFMKVDGAKELPDVLERVKFSCMAWTH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 DGKGMFYNSYPQQDGKSDGTETSTNLHQKLYYHVLGTDQSEDILCAEFPDEPKWMGGAEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 DGKGMFYNSYPQQDGKSDGTETSTNLHQKLYYHVLGTDQSEDILCAEFPDEPKWMGGAEL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 SDDGRYVLLSIREGCDPVNRLWYCDLQQESSGIAGILKWVKLIDNFEGEYDYVTNEGTVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 SDDGRYVLLSIREGCDPVNRLWYCDLQQESSGIAGILKWVKLIDNFEGEYDYVTNEGTVF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 TFKTNRQSPNYRVINIDFRDPEESKWKVLVPEHEKDVLEWIACVRSNFLVLCYLHDVKNI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 TFKTNRQSPNYRVINIDFRDPEESKWKVLVPEHEKDVLEWIACVRSNFLVLCYLHDVKNI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 LQLHDLTTGALLKTFPLDVGSIVGYSGQKKDTEIFYQFTSFLSPGIIYHCDLTKEELEPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 LQLHDLTTGALLKTFPLDVGSIVGYSGQKKDTEIFYQFTSFLSPGIIYHCDLTKEELEPR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 VFREVTVKGIDASDYQTVQIFYPSKDGTKIPMFIVHKKGIKLDGSHPAFLYGYGGFNISI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 VFREVTVKGIDASDYQTVQIFYPSKDGTKIPMFIVHKKGIKLDGSHPAFLYGYGGFNISI 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 TPNYSVSRLIFVRHMGGILAVANIRGGGEYGETWHKGGILANKQNCFDDFQCAAEYLIKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 TPNYSVSRLIFVRHMGGILAVANIRGGGEYGETWHKGGILANKQNCFDDFQCAAEYLIKE 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 GYTSPKRLTINGGSNGGLLVAACANQRPDLFGCVIAQVGVMDMLKFHKYTIGHAWTTDYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 GYTSPKRLTINGGSNGGLLVAACANQRPDLFGCVIAQVGVMDMLKFHKYTIGHAWTTDYG 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE4 CSDSKQHFEWLVKYSPLHNVKLPEADDIQYPSMLLLTADHDDRVVPLHSLKFIATLQYIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 CSDSKQHFEWLVKYSPLHNVKLPEADDIQYPSMLLLTADHDDRVVPLHSLKFIATLQYIV 610 620 630 640 650 660 670 680 690 700 710 pF1KE4 GRSRKQSNPLLIHVDTKAGHGAGKPTAKVIEEVSDMFAFIARCLNVDWIP :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 GRSRKQSNPLLIHVDTKAGHGAGKPTAKVIEEVSDMFAFIARCLNVDWIP 670 680 690 700 710 >>CCDS54353.1 PREPL gene_id:9581|Hs108|chr2 (638 aa) initn: 260 init1: 179 opt: 372 Z-score: 480.6 bits: 99.3 E(32554): 1.9e-20 Smith-Waterman score: 398; 24.9% identity (54.5% similar) in 473 aa overlap (210-667:141-582) 180 190 200 210 220 230 pF1KE4 HDGKGMFYNSYPQQDGKSDGTETSTNLHQKLYYHVLGTDQSEDILCAEFPDEPKWMGGAE .: ..: .. .. . .: .:... CCDS54 PNVSSFEWVKDEEDEDVLFYTFQRNLRCHDVYRATFGDNKRNERFYTE--KDPSYFVFLY 120 130 140 150 160 240 250 260 270 280 290 pF1KE4 LSDDGRYVLLSIREGCDPVNRLWYCD---------LQQESSGIAGILKWVKLIDNFEGEY :. :.:.. ..: . ....: : : :. : :.: .:. :. : CCDS54 LTKDSRFLTINIMN--KTTSEVWLIDGLSPWDPPVLIQKR--IHGVLYYVEHRDD---EL 170 180 190 200 210 220 300 310 320 330 340 pF1KE4 DYVTNEGTVFTFKTNRQSPNY-RVINIDFRDPEESKWKVLVPEHEKDVLEWIACVRSNFL .:: : :: : . . ..: :. . . ::. . :: :: :: CCDS54 YILTNVGEPTEFKLMRTAADTPAIMNWDLFFTMKRNTKVIDLDMFKD-----HCVL--FL 230 240 250 260 270 350 360 370 380 390 400 pF1KE4 VLCYLHDVKNILQLHDLTTGALLKTFPLDVGSIVGYSGQKKDTEIFYQFTSFLSPGIIYH : : :.. : : .. .: : : : :. ... :. .:. : . : : CCDS54 KHSNLLYV-NVIGLADDSVRSL-KLPPWACGFIMDTNSDPKNCP--FQLCSPIRPPKYY- 280 290 300 310 320 410 420 430 440 450 460 pF1KE4 CDLTKEELEPRVFREVTVKGIDASDYQTVQIFYPSKDGTKIPMFIVHKKGIKLDGSHPAF : . : ..:.:. . .. ..... :::: .:: . :: . ..: . CCDS54 ---TYKFAEGKLFEETGHEDPITKTSRVLRLEAKSKDGKLVPMTVFHKTDSEDLQKKPLL 330 340 350 360 370 380 470 480 490 500 510 520 pF1KE4 LYGYGGFNISITPNYSVSRLIFVRHMGGILAVANIRGGGEYGETWHKGGILANKQNCFDD .. ::...... :. : ..: : ::: ..::::: : :: : :..: : . : CCDS54 VHVYGAYGMDLKMNFRPERRVLVDD-GWILAYCHVRGGGELGLQWHADGRLTKKLNGLAD 390 400 410 420 430 440 530 540 550 560 570 580 pF1KE4 FQCAAEYLIKEGYTSPKRLTINGGSNGGLLVAACANQRPDLFGCVIAQVGVMDMLKFHKY .. . : .:...:. :... : ::.:..: :. :.: : .. .:.:. CCDS54 LEACIKTLHGQGFSQPSLTTLTAFSAGGVLAGALCNSNPELVRAVTLEAPFLDVLNTMMD 450 460 470 480 490 500 590 600 610 620 630 640 pF1KE4 T---IGHAWTTDYGC-SDSKQHFEWLVKYSPLHNVKLPEADDIQYPSMLLLTADHDDRVV : . ..: :....: ... .: : .:.: :. .:::. . . ..:.:: CCDS54 TTLPLTLEELEEWGNPSSDEKHKNYIKRYCPYQNIK-PQ----HYPSIHITAYENDERV- 510 520 530 540 550 650 660 670 680 690 700 pF1KE4 PLHSL-KFIATLQYIVGRSRKQSNPLLIHVDTKAGHGAGKPTAKVIEEVSDMFAFIARCL ::... .. :. ... :.. CCDS54 PLKGIVSYTEKLKEAIAEHAKDTGEGYQTPNIILDIQPGGNHVIEDSHKKITAQIKFLYE 560 570 580 590 600 610 >>CCDS33190.1 PREPL gene_id:9581|Hs108|chr2 (727 aa) initn: 260 init1: 179 opt: 372 Z-score: 479.7 bits: 99.3 E(32554): 2.1e-20 Smith-Waterman score: 398; 24.9% identity (54.5% similar) in 473 aa overlap (210-667:230-671) 180 190 200 210 220 230 pF1KE4 HDGKGMFYNSYPQQDGKSDGTETSTNLHQKLYYHVLGTDQSEDILCAEFPDEPKWMGGAE .: ..: .. .. . .: .:... CCDS33 PNVSSFEWVKDEEDEDVLFYTFQRNLRCHDVYRATFGDNKRNERFYTE--KDPSYFVFLY 200 210 220 230 240 250 240 250 260 270 280 290 pF1KE4 LSDDGRYVLLSIREGCDPVNRLWYCD---------LQQESSGIAGILKWVKLIDNFEGEY :. :.:.. ..: . ....: : : :. : :.: .:. :. : CCDS33 LTKDSRFLTINIMN--KTTSEVWLIDGLSPWDPPVLIQKR--IHGVLYYVEHRDD---EL 260 270 280 290 300 310 300 310 320 330 340 pF1KE4 DYVTNEGTVFTFKTNRQSPNY-RVINIDFRDPEESKWKVLVPEHEKDVLEWIACVRSNFL .:: : :: : . . ..: :. . . ::. . :: :: :: CCDS33 YILTNVGEPTEFKLMRTAADTPAIMNWDLFFTMKRNTKVIDLDMFKD-----HCVL--FL 320 330 340 350 360 350 360 370 380 390 400 pF1KE4 VLCYLHDVKNILQLHDLTTGALLKTFPLDVGSIVGYSGQKKDTEIFYQFTSFLSPGIIYH : : :.. : : .. .: : : : :. ... :. .:. : . : : CCDS33 KHSNLLYV-NVIGLADDSVRSL-KLPPWACGFIMDTNSDPKNCP--FQLCSPIRPPKYY- 370 380 390 400 410 410 420 430 440 450 460 pF1KE4 CDLTKEELEPRVFREVTVKGIDASDYQTVQIFYPSKDGTKIPMFIVHKKGIKLDGSHPAF : . : ..:.:. . .. ..... :::: .:: . :: . ..: . CCDS33 ---TYKFAEGKLFEETGHEDPITKTSRVLRLEAKSKDGKLVPMTVFHKTDSEDLQKKPLL 420 430 440 450 460 470 470 480 490 500 510 520 pF1KE4 LYGYGGFNISITPNYSVSRLIFVRHMGGILAVANIRGGGEYGETWHKGGILANKQNCFDD .. ::...... :. : ..: : ::: ..::::: : :: : :..: : . : CCDS33 VHVYGAYGMDLKMNFRPERRVLVDD-GWILAYCHVRGGGELGLQWHADGRLTKKLNGLAD 480 490 500 510 520 530 530 540 550 560 570 580 pF1KE4 FQCAAEYLIKEGYTSPKRLTINGGSNGGLLVAACANQRPDLFGCVIAQVGVMDMLKFHKY .. . : .:...:. :... : ::.:..: :. :.: : .. .:.:. CCDS33 LEACIKTLHGQGFSQPSLTTLTAFSAGGVLAGALCNSNPELVRAVTLEAPFLDVLNTMMD 540 550 560 570 580 590 590 600 610 620 630 640 pF1KE4 T---IGHAWTTDYGC-SDSKQHFEWLVKYSPLHNVKLPEADDIQYPSMLLLTADHDDRVV : . ..: :....: ... .: : .:.: :. .:::. . . ..:.:: CCDS33 TTLPLTLEELEEWGNPSSDEKHKNYIKRYCPYQNIK-PQ----HYPSIHITAYENDERV- 600 610 620 630 640 650 660 670 680 690 700 pF1KE4 PLHSL-KFIATLQYIVGRSRKQSNPLLIHVDTKAGHGAGKPTAKVIEEVSDMFAFIARCL ::... .. :. ... :.. CCDS33 PLKGIVSYTEKLKEAIAEHAKDTGEGYQTPNIILDIQPGGNHVIEDSHKKITAQIKFLYE 650 660 670 680 690 700 >>CCDS42675.1 PREPL gene_id:9581|Hs108|chr2 (665 aa) initn: 260 init1: 179 opt: 356 Z-score: 459.3 bits: 95.4 E(32554): 2.9e-19 Smith-Waterman score: 367; 24.5% identity (55.1% similar) in 392 aa overlap (284-667:237-609) 260 270 280 290 300 310 pF1KE4 GCDPVNRLWYCDLQQESSGIAGILKWVKLIDNFEGEYDYVTNEGTVFTFKTNRQSPNYRV :: ..: :. .. . :.: .. . . CCDS42 WVKDEEDEDVLFYTFQRNLRCHDVYRATFGDNKRNERFYTEKDPSYFVFLYLTKDSRFLT 210 220 230 240 250 260 320 330 340 350 360 370 pF1KE4 INIDFRDPEESKWKV--LVPEHEKDVLEWIACVRSNFLVLCYL-HDVKNILQLHDLTTGA ::: . : : . : : ... . :: :. : .. : .. . CCDS42 INIMNKTTSEV-WLIDGLSPWDPPVLIQ-----KRIHGVLYYVEHRDDELYILTNVGEPT 270 280 290 300 310 320 380 390 400 410 420 430 pF1KE4 LLKTFPLDVGSIVGYSGQKKDTEIFYQFTSFLSPGIIYHCDLTKEELEPRVFREVTVKGI .: : : :. ... :. .:. : . : : : . : ..:.:. . CCDS42 EFKLPPWACGFIMDTNSDPKNCP--FQLCSPIRPPKYY----TYKFAEGKLFEETGHEDP 330 340 350 360 370 440 450 460 470 480 490 pF1KE4 DASDYQTVQIFYPSKDGTKIPMFIVHKKGIKLDGSHPAFLYGYGGFNISITPNYSVSRLI .. ..... :::: .:: . :: . ..: ... ::...... :. : . CCDS42 ITKTSRVLRLEAKSKDGKLVPMTVFHKTDSEDLQKKPLLVHVYGAYGMDLKMNFRPERRV 380 390 400 410 420 430 500 510 520 530 540 550 pF1KE4 FVRHMGGILAVANIRGGGEYGETWHKGGILANKQNCFDDFQCAAEYLIKEGYTSPKRLTI .: : ::: ..::::: : :: : :..: : . :.. . : .:...:. :. CCDS42 LVDD-GWILAYCHVRGGGELGLQWHADGRLTKKLNGLADLEACIKTLHGQGFSQPSLTTL 440 450 460 470 480 490 560 570 580 590 600 pF1KE4 NGGSNGGLLVAACANQRPDLFGCVIAQVGVMDMLKFHKYT---IGHAWTTDYGC-SDSKQ .. : ::.:..: :. :.: : .. .:.:. : . ..: :.... CCDS42 TAFSAGGVLAGALCNSNPELVRAVTLEAPFLDVLNTMMDTTLPLTLEELEEWGNPSSDEK 500 510 520 530 540 550 610 620 630 640 650 660 pF1KE4 HFEWLVKYSPLHNVKLPEADDIQYPSMLLLTADHDDRVVPLHSL-KFIATLQYIVGRSRK : ... .: : .:.: :. .:::. . . ..:.:: ::... .. :. ... : CCDS42 HKNYIKRYCPYQNIK-PQ----HYPSIHITAYENDERV-PLKGIVSYTEKLKEAIAEHAK 560 570 580 590 600 670 680 690 700 710 pF1KE4 QSNPLLIHVDTKAGHGAGKPTAKVIEEVSDMFAFIARCLNVDWIP .. CCDS42 DTGEGYQTPNIILDIQPGGNHVIEDSHKKITAQIKFLYEELGLDSTSVFEDLKKYLKF 610 620 630 640 650 660 >>CCDS42676.1 PREPL gene_id:9581|Hs108|chr2 (661 aa) initn: 255 init1: 179 opt: 330 Z-score: 425.2 bits: 89.1 E(32554): 2.3e-17 Smith-Waterman score: 332; 25.2% identity (56.6% similar) in 401 aa overlap (284-667:237-605) 260 270 280 290 300 310 pF1KE4 GCDPVNRLWYCDLQQESSGIAGILKWVKLIDNFEGEYDYVTNEGTVFTFKTNRQSPNYRV :: ..: :. .. . :.: .. . . CCDS42 WVKDEEDEDVLFYTFQRNLRCHDVYRATFGDNKRNERFYTEKDPSYFVFLYLTKDSRFLT 210 220 230 240 250 260 320 330 340 350 360 pF1KE4 INIDFRDPEE-------SKWK--VLVPEHEKDVLEWIACVRSNFLVLCYLHDVKNILQLH ::: . : : : ::. .. . :: .. :.. : . : .: . ... CCDS42 INIMNKTTSEVWLIDGLSPWDPPVLIQKRIHGVLYYVEH-RDDELYI--LTNVGEPTEFK 270 280 290 300 310 320 370 380 390 400 410 420 pF1KE4 DLTTGALLKTFPLDVGSIVGYS---GQKKDTEIFYQFTSFLSPGIIYHCDLTKEELEPRV . :.: :. .:.... .:..:... .. : . :: : :. CCDS42 LMRTAA-------DTPAIMNWDLFFTMKRNTKVI-DLDMFKD-----HCVLF---LKHSN 330 340 350 360 430 440 450 460 470 480 pF1KE4 FREVTVKGIDASDYQTVQIFYPSKDGTKIPMFIVHKKGIKLDGSHPAFLYGYGGFNISIT . :.: :. :.: .:. . ::: .:: . :: . ..: ... ::...... CCDS42 LLYVNVIGL-ADD--SVRSL---KDGKLVPMTVFHKTDSEDLQKKPLLVHVYGAYGMDLK 370 380 390 400 410 420 490 500 510 520 530 540 pF1KE4 PNYSVSRLIFVRHMGGILAVANIRGGGEYGETWHKGGILANKQNCFDDFQCAAEYLIKEG :. : ..: : ::: ..::::: : :: : :..: : . :.. . : .: CCDS42 MNFRPERRVLVDD-GWILAYCHVRGGGELGLQWHADGRLTKKLNGLADLEACIKTLHGQG 430 440 450 460 470 480 550 560 570 580 590 pF1KE4 YTSPKRLTINGGSNGGLLVAACANQRPDLFGCVIAQVGVMDMLKFHKYT---IGHAWTTD ...:. :... : ::.:..: :. :.: : .. .:.:. : . . CCDS42 FSQPSLTTLTAFSAGGVLAGALCNSNPELVRAVTLEAPFLDVLNTMMDTTLPLTLEELEE 490 500 510 520 530 540 600 610 620 630 640 650 pF1KE4 YGC-SDSKQHFEWLVKYSPLHNVKLPEADDIQYPSMLLLTADHDDRVVPLHSL-KFIATL .: :....: ... .: : .:.: :. .:::. . . ..:.:: ::... .. : CCDS42 WGNPSSDEKHKNYIKRYCPYQNIK-PQ----HYPSIHITAYENDERV-PLKGIVSYTEKL 550 560 570 580 590 660 670 680 690 700 710 pF1KE4 QYIVGRSRKQSNPLLIHVDTKAGHGAGKPTAKVIEEVSDMFAFIARCLNVDWIP . ... :.. CCDS42 KEAIAEHAKDTGEGYQTPNIILDIQPGGNHVIEDSHKKITAQIKFLYEELGLDSTSVFED 600 610 620 630 640 650 710 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 17:34:19 2016 done: Mon Nov 7 17:34:20 2016 Total Scan time: 3.440 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]