FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5611, 492 aa 1>>>pF1KE5611 492 - 492 aa - 492 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5644+/-0.000841; mu= 16.1163+/- 0.050 mean_var=63.3739+/-13.072, 0's: 0 Z-trim(107.1): 18 B-trim: 308 in 1/48 Lambda= 0.161109 statistics sampled from 9356 (9367) to 9356 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.664), E-opt: 0.2 (0.288), width: 16 Scan time: 2.790 The best scores are: opt bits E(32554) CCDS7030.1 DPP7 gene_id:29952|Hs108|chr9 ( 492) 3381 794.6 0 CCDS8262.1 PRCP gene_id:5547|Hs108|chr11 ( 496) 1267 303.2 4.1e-82 CCDS41695.1 PRCP gene_id:5547|Hs108|chr11 ( 517) 1218 291.9 1.1e-78 CCDS4623.1 PRSS16 gene_id:10279|Hs108|chr6 ( 514) 632 155.7 1.1e-37 >>CCDS7030.1 DPP7 gene_id:29952|Hs108|chr9 (492 aa) initn: 3381 init1: 3381 opt: 3381 Z-score: 4243.2 bits: 794.6 E(32554): 0 Smith-Waterman score: 3381; 99.8% identity (100.0% similar) in 492 aa overlap (1-492:1-492) 10 20 30 40 50 60 pF1KE5 MGSAPWAPVLLLALGLRGLQAGARRAPDPGFQERFFQQRLDHFNFERFGNKTFPQRFLVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 MGSAPWAPVLLLALGLRGLQAGARRAPDPGFQERFFQQRLDHFNFERFGNKTFPQRFLVS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 DRFWVRGEGPIFFYTGNEGDVWAFANNSGFVAELAAERGALLVFAEHRYYGKSLPFGAQS ::::::::::::::::::::::::::::.::::::::::::::::::::::::::::::: CCDS70 DRFWVRGEGPIFFYTGNEGDVWAFANNSAFVAELAAERGALLVFAEHRYYGKSLPFGAQS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 TQRGHTELLTVEQALADFAELLRALRRDLGAQDAPAIAFGGSYGGMLSAYLRMKYPHLVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 TQRGHTELLTVEQALADFAELLRALRRDLGAQDAPAIAFGGSYGGMLSAYLRMKYPHLVA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 GALAASAPVLAVAGLGDSNQFFRDVTADFEGQSPKCTQGVREAFRQIKDLFLQGAYDTVR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 GALAASAPVLAVAGLGDSNQFFRDVTADFEGQSPKCTQGVREAFRQIKDLFLQGAYDTVR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 WEFGTCQPLSDEKDLTQLFMFARNAFTVLAMMDYPYPTDFLGPLPANPVKVGCDRLLSEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 WEFGTCQPLSDEKDLTQLFMFARNAFTVLAMMDYPYPTDFLGPLPANPVKVGCDRLLSEA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 QRITGLRALAGLVYNASGSEHCYDIYRLYHSCADPTGCGTGPDARAWDYQACTEINLTFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 QRITGLRALAGLVYNASGSEHCYDIYRLYHSCADPTGCGTGPDARAWDYQACTEINLTFA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 SNNVTDMFPDLPFTDELRQRYCLDTWGVWPRPDWLLTSFWGGDLRAASNIIFSNGNLDPW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 SNNVTDMFPDLPFTDELRQRYCLDTWGVWPRPDWLLTSFWGGDLRAASNIIFSNGNLDPW 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 AGGGIRRNLSASVIAVTIQGGAHHLDLRASHPEDPASVVEARKLEATIIGEWVKAARREQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 AGGGIRRNLSASVIAVTIQGGAHHLDLRASHPEDPASVVEARKLEATIIGEWVKAARREQ 430 440 450 460 470 480 490 pF1KE5 QPALRGGPRLSL :::::::::::: CCDS70 QPALRGGPRLSL 490 >>CCDS8262.1 PRCP gene_id:5547|Hs108|chr11 (496 aa) initn: 1210 init1: 425 opt: 1267 Z-score: 1587.6 bits: 303.2 E(32554): 4.1e-82 Smith-Waterman score: 1294; 42.6% identity (69.9% similar) in 488 aa overlap (4-474:15-486) 10 20 30 40 pF1KE5 MGSAPWAPVLLL----ALGLRGLQAGARRAPD--PGFQERFFQQRLDHF :::: . : ::: : .. : ... .:::..::: CCDS82 MGRRALLLLLLSFLAPWATIALRPALRALGSLHLPTNPTSLPAVAKNYSVLYFQQKVDHF 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE5 NFERFGNKTFPQRFLVSDRFWVRGEGPIFFYTGNEGDVWAFANNSGFVAELAAERGALLV .:. ::: ::.::.:..: .. : :.::::::::. : ::.::. ..: : :.:: CCDS82 GFNTV--KTFNQRYLVADKYWKKNGGSILFYTGNEGDIIWFCNNTGFMWDVAEELKAMLV 70 80 90 100 110 110 120 130 140 150 160 pF1KE5 FAEHRYYGKSLPFGAQSTQRG-HTELLTVEQALADFAELLRALRRDL-GAQDAPAIAFGG ::::::::.::::: .: . . : ..:: ::::::::::.. :.: . ::.. :.::.:: CCDS82 FAEHRYYGESLPFGDNSFKDSRHLNFLTSEQALADFAELIKHLKRTIPGAENQPVIAIGG 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE5 SYGGMLSAYLRMKYPHLVAGALAASAPVLAVAGLGDSNQFFRDVTADFEGQSPKCTQGVR ::::::.:..::::::.:.::::::::. : . :.. ::.::. ..:.:..... CCDS82 SYGGMLAAWFRMKYPHMVVGALAASAPIWQFEDLVPCGVFMKIVTTDFRKSGPHCSESIH 180 190 200 210 220 230 230 240 250 260 270 pF1KE5 EAFRQIKDLFLQGAYDTVRWEFGT---CQPLSDEKDLTQLFMFARNAFTVLAMMDYPYPT ... :. : :. ..: :. :.::... :. .: . .... :::.:::: . CCDS82 RSWDAINRLSNTGS--GLQWLTGALHLCSPLTSQ-DIQHLKDWISETWVNLAMVDYPYAS 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE5 DFLGPLPANPVKVGCDRL----LSEAQRITGLRALAGLVYNASGSEHCYDIYRLYHSCAD .:: :::: :.:: :. : .:.. . .. .. :: ::. .: .: . : CCDS82 NFLQPLPAWPIKVVCQYLKNPNVSDSLLLQNIFQALNVYYNYSGQVKCLNISETATSSLG 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE5 PTGCGTGPDARAWDYQACTEINLTFASNNVTDMFPDLPFTDELRQRY--CLDTWGVWPRP : :.::::::. . : .:.: ::: : . .:.. :.. ::: ::: CCDS82 TLG---------WSYQACTEVVMPFCTNGVDDMFE--PHSWNLKELSDDCFQQWGVRPRP 360 370 380 390 400 400 410 420 430 440 450 pF1KE5 DWLLTSFWGGDLRAASNIIFSNGNLDPWAGGGIRRNLSASVIAVTIQGGAHHLDLRASHP .:. : . : .. . .::.::::.::::.:::. .... ...::::. ::::::::... CCDS82 SWITTMYGGKNISSHTNIVFSNGELDPWSGGGVTKDITDTLVAVTISEGAHHLDLRTKNA 410 420 430 440 450 460 460 470 480 490 pF1KE5 EDPASVVEARKLEATIIGEWVKAARREQQPALRGGPRLSL :: ::. ::.::. . .:.. CCDS82 LDPMSVLLARSLEVRHMKNWIRDFYDSAGKQH 470 480 490 >>CCDS41695.1 PRCP gene_id:5547|Hs108|chr11 (517 aa) initn: 1164 init1: 425 opt: 1218 Z-score: 1525.8 bits: 291.9 E(32554): 1.1e-78 Smith-Waterman score: 1245; 43.7% identity (71.7% similar) in 446 aa overlap (40-474:78-507) 10 20 30 40 50 60 pF1KE5 LLLALGLRGLQAGARRAPDPGFQERFFQQRLDHFNFERFGNKTFPQRFLVSDRFWVRGEG .:::.:. ::: ::.::.:..: .. : CCDS41 YSVLYFQQKALAAGQLHICIIQLNHYKTPLVDHFGFNTV--KTFNQRYLVADKYWKKNGG 50 60 70 80 90 100 70 80 90 100 110 120 pF1KE5 PIFFYTGNEGDVWAFANNSGFVAELAAERGALLVFAEHRYYGKSLPFGAQSTQRG-HTEL :.::::::::. : ::.::. ..: : :.::::::::::.::::: .: . . : .. CCDS41 SILFYTGNEGDIIWFCNNTGFMWDVAEELKAMLVFAEHRYYGESLPFGDNSFKDSRHLNF 110 120 130 140 150 160 130 140 150 160 170 180 pF1KE5 LTVEQALADFAELLRALRRDL-GAQDAPAIAFGGSYGGMLSAYLRMKYPHLVAGALAASA :: ::::::::::.. :.: . ::.. :.::.::::::::.:..::::::.:.::::::: CCDS41 LTSEQALADFAELIKHLKRTIPGAENQPVIAIGGSYGGMLAAWFRMKYPHMVVGALAASA 170 180 190 200 210 220 190 200 210 220 230 240 pF1KE5 PVLAVAGLGDSNQFFRDVTADFEGQSPKCTQGVREAFRQIKDLFLQGAYDTVRWEFGT-- :. : . :.. ::.::. ..:.:........ :. : :. ..: :. CCDS41 PIWQFEDLVPCGVFMKIVTTDFRKSGPHCSESIHRSWDAINRLSNTGS--GLQWLTGALH 230 240 250 260 270 280 250 260 270 280 290 300 pF1KE5 -CQPLSDEKDLTQLFMFARNAFTVLAMMDYPYPTDFLGPLPANPVKVGCDRL----LSEA :.::... :. .: . .... :::.:::: ..:: :::: :.:: :. : .:.. CCDS41 LCSPLTSQ-DIQHLKDWISETWVNLAMVDYPYASNFLQPLPAWPIKVVCQYLKNPNVSDS 290 300 310 320 330 340 310 320 330 340 350 360 pF1KE5 QRITGLRALAGLVYNASGSEHCYDIYRLYHSCADPTGCGTGPDARAWDYQACTEINLTFA . .. .. :: ::. .: .: . : : :.::::::. . : CCDS41 LLLQNIFQALNVYYNYSGQVKCLNISETATSSLGTLG---------WSYQACTEVVMPFC 350 360 370 380 390 370 380 390 400 410 pF1KE5 SNNVTDMFPDLPFTDELRQRY--CLDTWGVWPRPDWLLTSFWGGDLRAASNIIFSNGNLD .:.: ::: : . .:.. :.. ::: :::.:. : . : .. . .::.::::.:: CCDS41 TNGVDDMFE--PHSWNLKELSDDCFQQWGVRPRPSWITTMYGGKNISSHTNIVFSNGELD 400 410 420 430 440 450 420 430 440 450 460 470 pF1KE5 PWAGGGIRRNLSASVIAVTIQGGAHHLDLRASHPEDPASVVEARKLEATIIGEWVKAARR ::.:::. .... ...::::. ::::::::... :: ::. ::.::. . .:.. CCDS41 PWSGGGVTKDITDTLVAVTISEGAHHLDLRTKNALDPMSVLLARSLEVRHMKNWIRDFYD 460 470 480 490 500 510 480 490 pF1KE5 EQQPALRGGPRLSL CCDS41 SAGKQH >>CCDS4623.1 PRSS16 gene_id:10279|Hs108|chr6 (514 aa) initn: 507 init1: 192 opt: 632 Z-score: 789.7 bits: 155.7 E(32554): 1.1e-37 Smith-Waterman score: 632; 30.7% identity (57.3% similar) in 485 aa overlap (14-480:45-509) 10 20 30 40 pF1KE5 MGSAPWAPVLLLALGLRGLQAGARRAPDPGFQERFFQQRLDHF ::: .: :: : :. : : :: : CCDS46 VSLWGLLAPASLLRRLGEHIQQFQESSAQGLGL-SLGPGAAALPKVGWLE----QLLDPF 20 30 40 50 60 50 60 70 80 90 100 pF1KE5 NFERFGNKTFPQRFLVSDRFWVRGEGPIFFYTGNEGDVWAFANNSGFVAELAAERGALLV : ..: ::. :.:. :: .::::.. :.::.. . : : :: :::.. CCDS46 NVS--DRRSFLQRYWVNDQHWVGQDGPIFLHLGGEGSLGPGSVMRGHPAALAPAWGALVI 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE5 FAEHRYYGKSLPFGAQSTQRGHTELLTVEQALADFAELLRALRRDLG-AQDAPAIAFGGS :::.:: :.: : . . .. ..:. . :::: . :: : .. ....: : :::: CCDS46 SLEHRFYGLSIPAG--GLEMAQLRFLSSRLALADVVSARLALSRLFNISSSSPWICFGGS 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE5 YGGMLSAYLRMKYPHLVAGALAASAPVLAVAGLGDSNQFF-RDVTADFEGQSPKCTQGVR :.: :.:. :.:.:::. ...:.:::: :: ... :. :.. . : : .: .: CCDS46 YAGSLAAWARLKFPHLIFASVASSAPVRAVLDFSEYNDVVSRSLMSTAIGGSLECRAAVS 190 200 210 220 230 240 230 240 250 260 270 pF1KE5 EAFRQIKDLFLQG--AYDTVRWEFGTCQPLSDEKDLTQLFMFARNAFTVLAMMDYPYPTD :: ... . .: : ..: :...: ::. .. ..:. .:. .:. : . CCDS46 VAFAEVERRLRSGGAAQAALRTELSACGPLGRAENQAELL----GALQALVGGVVQYDGQ 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE5 FLGPLPANPVKVGCDRLL------SEAQRITGLRALAGLVYNASGSEHCYDIYRLYH--- .:: :. : :: :.. ::: . .: .. : ..: .. : CCDS46 TGAPLS---VRQLCGLLLGGGGNRSHSTPYCGLRRAVQIVLHSLG-QKCLSFSRAETVAQ 310 320 330 340 350 340 350 360 370 380 pF1KE5 -SCADPTGCGTGPDARAWDYQACTEINLTFASNNVTDMFPDLPFT----DELRQRYCLDT ..: :.: : : ::.:::... . .: : .:: : .: . :.. CCDS46 LRSTEPQLSGVGD--RQWLYQTCTEFGFYVTCENPRCPFSQLPALPSQLDLCEQVFGLSA 360 370 380 390 400 410 390 400 410 420 430 440 pF1KE5 WGVWPRPDWLLTSFWGGDLRAASNIIFSNGNLDPWAGGGIRRNLSASVIAVTIQGGAHHL .: . .:..::. .:....: ::. ::: .. . :..: .. :. :.: : CCDS46 LSV-AQAVAQTNSYYGGQTPGANKVLFVNGDTDPWHVLSVTQALGSSESTLLIRTGSHCL 420 430 440 450 460 470 450 460 470 480 490 pF1KE5 DLRASHPEDPASVVEARKLEATIIGEWVKAARREQQPALRGGPRLSL :. .: : :. .:. . :.: :.. : CCDS46 DMAPERPSDSPSLRLGRQNIFQQLQTWLKLAKESQIKGEV 480 490 500 510 492 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 05:08:13 2016 done: Tue Nov 8 05:08:13 2016 Total Scan time: 2.790 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]