FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5776, 624 aa 1>>>pF1KE5776 624 - 624 aa - 624 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7828+/-0.000995; mu= 16.3317+/- 0.060 mean_var=70.0794+/-13.915, 0's: 0 Z-trim(104.2): 25 B-trim: 0 in 0/50 Lambda= 0.153207 statistics sampled from 7779 (7784) to 7779 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.608), E-opt: 0.2 (0.239), width: 16 Scan time: 2.070 The best scores are: opt bits E(32554) CCDS3676.1 PAPSS1 gene_id:9061|Hs108|chr4 ( 624) 4285 956.7 0 CCDS7385.1 PAPSS2 gene_id:9060|Hs108|chr10 ( 614) 3381 756.9 1.7e-218 CCDS44453.1 PAPSS2 gene_id:9060|Hs108|chr10 ( 619) 3370 754.5 9.3e-218 >>CCDS3676.1 PAPSS1 gene_id:9061|Hs108|chr4 (624 aa) initn: 4285 init1: 4285 opt: 4285 Z-score: 5115.8 bits: 956.7 E(32554): 0 Smith-Waterman score: 4285; 100.0% identity (100.0% similar) in 624 aa overlap (1-624:1-624) 10 20 30 40 50 60 pF1KE5 MEIPGSLCKKVKLSNNAQNWGMQRATNVTYQAHHVSRNKRGQVVGTRGGFRGCTVWLTGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 MEIPGSLCKKVKLSNNAQNWGMQRATNVTYQAHHVSRNKRGQVVGTRGGFRGCTVWLTGL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 SGAGKTTVSMALEEYLVCHGIPCYTLDGDNIRQGLNKNLGFSPEDREENVRRIAEVAKLF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 SGAGKTTVSMALEEYLVCHGIPCYTLDGDNIRQGLNKNLGFSPEDREENVRRIAEVAKLF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 ADAGLVCITSFISPYTQDRNNARQIHEGASLPFFEVFVDAPLHVCEQRDVKGLYKKARAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 ADAGLVCITSFISPYTQDRNNARQIHEGASLPFFEVFVDAPLHVCEQRDVKGLYKKARAG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 EIKGFTGIDSEYEKPEAPELVLKTDSCDVNDCVQQVVELLQERDIVPVDASYEVKELYVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 EIKGFTGIDSEYEKPEAPELVLKTDSCDVNDCVQQVVELLQERDIVPVDASYEVKELYVP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 ENKLHLAKTDAETLPALKINKVDMQWVQVLAEGWATPLNGFMREREYLQCLHFDCLLDGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 ENKLHLAKTDAETLPALKINKVDMQWVQVLAEGWATPLNGFMREREYLQCLHFDCLLDGG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 VINLSVPIVLTATHEDKERLDGCTAFALMYEGRRVAILRNPEFFEHRKEERCARQWGTTC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 VINLSVPIVLTATHEDKERLDGCTAFALMYEGRRVAILRNPEFFEHRKEERCARQWGTTC 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 KNHPYIKMVMEQGDWLIGGDLQVLDRVYWNDGLDQYRLTPTELKQKFKDMNADAVFAFQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 KNHPYIKMVMEQGDWLIGGDLQVLDRVYWNDGLDQYRLTPTELKQKFKDMNADAVFAFQL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 RNPVHNGHALLMQDTHKQLLERGYRRPVLLLHPLGGWTKDDDVPLMWRMKQHAAVLEEGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 RNPVHNGHALLMQDTHKQLLERGYRRPVLLLHPLGGWTKDDDVPLMWRMKQHAAVLEEGV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE5 LNPETTVVAIFPSPMMYAGPTEVQWHCRARMVAGANFYIVGRDPAGMPHPETGKDLYEPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 LNPETTVVAIFPSPMMYAGPTEVQWHCRARMVAGANFYIVGRDPAGMPHPETGKDLYEPS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE5 HGAKVLTMAPGLITLEIVPFRVAAYNKKKKRMDYYDSEHHEDFEFISGTRMRKLAREGQK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 HGAKVLTMAPGLITLEIVPFRVAAYNKKKKRMDYYDSEHHEDFEFISGTRMRKLAREGQK 550 560 570 580 590 600 610 620 pF1KE5 PPEGFMAPKAWTVLTEYYKSLEKA :::::::::::::::::::::::: CCDS36 PPEGFMAPKAWTVLTEYYKSLEKA 610 620 >>CCDS7385.1 PAPSS2 gene_id:9060|Hs108|chr10 (614 aa) initn: 3381 init1: 3381 opt: 3381 Z-score: 4036.1 bits: 756.9 E(32554): 1.7e-218 Smith-Waterman score: 3381; 78.4% identity (94.0% similar) in 601 aa overlap (23-623:13-613) 10 20 30 40 50 60 pF1KE5 MEIPGSLCKKVKLSNNAQNWGMQRATNVTYQAHHVSRNKRGQVVGTRGGFRGCTVWLTGL :..:::.::::::::::::::::::::::::::::::: CCDS73 MSGIKKQKTENQQKSTNVVYQAHHVSRNKRGQVVGTRGGFRGCTVWLTGL 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 SGAGKTTVSMALEEYLVCHGIPCYTLDGDNIRQGLNKNLGFSPEDREENVRRIAEVAKLF :::::::.:.::::::: :.::::.:::::.:.:::.:::::: :::::.:::::::::: CCDS73 SGAGKTTISFALEEYLVSHAIPCYSLDGDNVRHGLNRNLGFSPGDREENIRRIAEVAKLF 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE5 ADAGLVCITSFISPYTQDRNNARQIHEGASLPFFEVFVDAPLHVCEQRDVKGLYKKARAG ::::::::::::::...::.:::.:::.:.:::::.::::::..::.::::::::.:::: CCDS73 ADAGLVCITSFISPFAKDRENARKIHESAGLPFFEIFVDAPLNICESRDVKGLYKRARAG 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE5 EIKGFTGIDSEYEKPEAPELVLKTDSCDVNDCVQQVVELLQERDIVPVDASYEVKELYVP ::::::::::.:::::.:: ::::. :.:::.::::::::..::: ...::.:: CCDS73 EIKGFTGIDSDYEKPETPERVLKTNLSTVSDCVHQVVELLQEQNIVPYTIIKDIHELFVP 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE5 ENKLHLAKTDAETLPALKINKVDMQWVQVLAEGWATPLNGFMREREYLQCLHFDCLLDGG :::: ....:::::.:.:.:.:.::::::.:::::::.:::::.:::: .::: ::: : CCDS73 ENKLDHVRAEAETLPSLSITKLDLQWVQVLSEGWATPLKGFMREKEYLQVMHFDTLLDDG 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE5 VINLSVPIVLTATHEDKERLDGCTAFALMYEGRRVAILRNPEFFEHRKEERCARQWGTTC :::.:.:::: .. ::: ::.::. :.: . ::::::::. ::.::::::::.: ::::: CCDS73 VINMSIPIVLPVSAEDKTRLEGCSKFVLAHGGRRVAILRDAEFYEHRKEERCSRVWGTTC 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE5 KNHPYIKMVMEQGDWLIGGDLQVLDRVYWNDGLDQYRLTPTELKQKFKDMNADAVFAFQL .::.::::::.::::.:::::::... :::::::::::: ::::: :.::::::::::: CCDS73 TKHPHIKMVMESGDWLVGGDLQVLEKIRWNDGLDQYRLTPLELKQKCKEMNADAVFAFQL 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE5 RNPVHNGHALLMQDTHKQLLERGYRRPVLLLHPLGGWTKDDDVPLMWRMKQHAAVLEEGV :::::::::::::::...::::::..::::::::::::::::::: :::::::::::::: CCDS73 RNPVHNGHALLMQDTRRRLLERGYKHPVLLLHPLGGWTKDDDVPLDWRMKQHAAVLEEGV 420 430 440 450 460 470 490 500 510 520 530 540 pF1KE5 LNPETTVVAIFPSPMMYAGPTEVQWHCRARMVAGANFYIVGRDPAGMPHPETGKDLYEPS :.:..:.::::::::.::::::::::::.::.:::::::::::::::::::: ::::::. CCDS73 LDPKSTIVAIFPSPMLYAGPTEVQWHCRSRMIAGANFYIVGRDPAGMPHPETKKDLYEPT 480 490 500 510 520 530 550 560 570 580 590 600 pF1KE5 HGAKVLTMAPGLITLEIVPFRVAAYNKKKKRMDYYDSEHHEDFEFISGTRMRKLAREGQK ::.:::.::::: ..::.::::::::: :: ::.:: .:..:.::::::::::::::.. CCDS73 HGGKVLSMAPGLTSVEIIPFRVAAYNKAKKAMDFYDPARHNEFDFISGTRMRKLAREGEN 540 550 560 570 580 590 610 620 pF1KE5 PPEGFMAPKAWTVLTEYYKSLEKA ::.:::::::: :::.::.:::: CCDS73 PPDGFMAPKAWKVLTDYYRSLEKN 600 610 >>CCDS44453.1 PAPSS2 gene_id:9060|Hs108|chr10 (619 aa) initn: 1885 init1: 1885 opt: 3370 Z-score: 4022.9 bits: 754.5 E(32554): 9.3e-218 Smith-Waterman score: 3370; 77.9% identity (93.4% similar) in 606 aa overlap (23-623:13-618) 10 20 30 40 50 60 pF1KE5 MEIPGSLCKKVKLSNNAQNWGMQRATNVTYQAHHVSRNKRGQVVGTRGGFRGCTVWLTGL :..:::.::::::::::::::::::::::::::::::: CCDS44 MSGIKKQKTENQQKSTNVVYQAHHVSRNKRGQVVGTRGGFRGCTVWLTGL 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 SGAGKTTVSMALEEYLVCHGIPCYTLDGDNIRQGLNKNLGFSPEDREENVRRIAEVAKLF :::::::.:.::::::: :.::::.:::::.:.:::.:::::: :::::.:::::::::: CCDS44 SGAGKTTISFALEEYLVSHAIPCYSLDGDNVRHGLNRNLGFSPGDREENIRRIAEVAKLF 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE5 ADAGLVCITSFISPYTQDRNNARQIHEGASLPFFEVFVDAPLHVCEQRDVKGLYKKARAG ::::::::::::::...::.:::.:::.:.:::::.::::::..::.::::::::.:::: CCDS44 ADAGLVCITSFISPFAKDRENARKIHESAGLPFFEIFVDAPLNICESRDVKGLYKRARAG 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE5 EIKGFTGIDSEYEKPEAPELVLKTDSCDVNDCVQQVVELLQERDIVPVDASYEVKELYVP ::::::::::.:::::.:: ::::. :.:::.::::::::..::: ...::.:: CCDS44 EIKGFTGIDSDYEKPETPERVLKTNLSTVSDCVHQVVELLQEQNIVPYTIIKDIHELFVP 180 190 200 210 220 230 250 260 270 280 290 pF1KE5 ENKLHLAKTDAETLPALKINKVDMQWVQVLAEGWATPLNGFMREREYLQCLHFDCLLDG- :::: ....:::::.:.:.:.:.::::::.:::::::.:::::.:::: .::: :::: CCDS44 ENKLDHVRAEAETLPSLSITKLDLQWVQVLSEGWATPLKGFMREKEYLQVMHFDTLLDGM 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 ----GVINLSVPIVLTATHEDKERLDGCTAFALMYEGRRVAILRNPEFFEHRKEERCARQ ::::.:.:::: .. ::: ::.::. :.: . ::::::::. ::.::::::::.: CCDS44 ALPDGVINMSIPIVLPVSAEDKTRLEGCSKFVLAHGGRRVAILRDAEFYEHRKEERCSRV 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 WGTTCKNHPYIKMVMEQGDWLIGGDLQVLDRVYWNDGLDQYRLTPTELKQKFKDMNADAV ::::: .::.::::::.::::.:::::::... :::::::::::: ::::: :.:::::: CCDS44 WGTTCTKHPHIKMVMESGDWLVGGDLQVLEKIRWNDGLDQYRLTPLELKQKCKEMNADAV 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE5 FAFQLRNPVHNGHALLMQDTHKQLLERGYRRPVLLLHPLGGWTKDDDVPLMWRMKQHAAV ::::::::::::::::::::...::::::..::::::::::::::::::: ::::::::: CCDS44 FAFQLRNPVHNGHALLMQDTRRRLLERGYKHPVLLLHPLGGWTKDDDVPLDWRMKQHAAV 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE5 LEEGVLNPETTVVAIFPSPMMYAGPTEVQWHCRARMVAGANFYIVGRDPAGMPHPETGKD ::::::.:..:.::::::::.::::::::::::.::.:::::::::::::::::::: :: CCDS44 LEEGVLDPKSTIVAIFPSPMLYAGPTEVQWHCRSRMIAGANFYIVGRDPAGMPHPETKKD 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE5 LYEPSHGAKVLTMAPGLITLEIVPFRVAAYNKKKKRMDYYDSEHHEDFEFISGTRMRKLA ::::.::.:::.::::: ..::.::::::::: :: ::.:: .:..:.::::::::::: CCDS44 LYEPTHGGKVLSMAPGLTSVEIIPFRVAAYNKAKKAMDFYDPARHNEFDFISGTRMRKLA 540 550 560 570 580 590 600 610 620 pF1KE5 REGQKPPEGFMAPKAWTVLTEYYKSLEKA :::..::.:::::::: :::.::.:::: CCDS44 REGENPPDGFMAPKAWKVLTDYYRSLEKN 600 610 624 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 06:32:40 2016 done: Tue Nov 8 06:32:40 2016 Total Scan time: 2.070 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]