FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4529, 580 aa 1>>>pF1KE4529 580 - 580 aa - 580 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.4684+/-0.000701; mu= 14.9003+/- 0.043 mean_var=98.9270+/-19.719, 0's: 0 Z-trim(112.6): 6 B-trim: 0 in 0/52 Lambda= 0.128949 statistics sampled from 13374 (13379) to 13374 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.728), E-opt: 0.2 (0.411), width: 16 Scan time: 2.750 The best scores are: opt bits E(32554) CCDS12180.1 MCOLN1 gene_id:57192|Hs108|chr19 ( 580) 3938 742.6 3e-214 CCDS81347.1 MCOLN2 gene_id:255231|Hs108|chr1 ( 538) 1673 321.3 2e-87 CCDS30762.1 MCOLN2 gene_id:255231|Hs108|chr1 ( 566) 1673 321.3 2.1e-87 CCDS58009.1 MCOLN3 gene_id:55283|Hs108|chr1 ( 497) 1619 311.2 2e-84 CCDS701.1 MCOLN3 gene_id:55283|Hs108|chr1 ( 553) 1619 311.2 2.1e-84 >>CCDS12180.1 MCOLN1 gene_id:57192|Hs108|chr19 (580 aa) initn: 3938 init1: 3938 opt: 3938 Z-score: 3959.9 bits: 742.6 E(32554): 3e-214 Smith-Waterman score: 3938; 100.0% identity (100.0% similar) in 580 aa overlap (1-580:1-580) 10 20 30 40 50 60 pF1KE4 MTAPAGPRGSETERLLTPNPGYGTQAGPSPAPPTPPEEEDLRRRLKYFFMSPCDKFRAKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MTAPAGPRGSETERLLTPNPGYGTQAGPSPAPPTPPEEEDLRRRLKYFFMSPCDKFRAKG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 RKPCKLMLQVVKILVVTVQLILFGLSNQLAVTFREENTIAFRHLFLLGYSDGADDTFAAY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 RKPCKLMLQVVKILVVTVQLILFGLSNQLAVTFREENTIAFRHLFLLGYSDGADDTFAAY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 TREQLYQAIFHAVDQYLALPDVSLGRYAYVRGGGDPWTNGSGLALCQRYYHRGHVDPAND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 TREQLYQAIFHAVDQYLALPDVSLGRYAYVRGGGDPWTNGSGLALCQRYYHRGHVDPAND 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 TFDIDPMVVTDCIQVDPPERPPPPPSDDLTLLESSSSYKNLTLKFHKLVNVTIHFRLKTI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 TFDIDPMVVTDCIQVDPPERPPPPPSDDLTLLESSSSYKNLTLKFHKLVNVTIHFRLKTI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 NLQSLINNEIPDCYTFSVLITFDNKAHSGRIPISLETQAHIQECKHPSVFQHGDNSFRLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 NLQSLINNEIPDCYTFSVLITFDNKAHSGRIPISLETQAHIQECKHPSVFQHGDNSFRLL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 FDVVVILTCSLSFLLCARSLLRGFLLQNEFVGFMWRQRGRVISLWERLEFVNGWYILLVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 FDVVVILTCSLSFLLCARSLLRGFLLQNEFVGFMWRQRGRVISLWERLEFVNGWYILLVT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 SDVLTISGTIMKIGIEAKNLASYDVCSILLGTSTLLVWVGVIRYLTFFHNYNILIATLRV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 SDVLTISGTIMKIGIEAKNLASYDVCSILLGTSTLLVWVGVIRYLTFFHNYNILIATLRV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 ALPSVMRFCCCVAVIYLGYCFCGWIVLGPYHVKFRSLSMVSECLFSLINGDDMFVTFAAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 ALPSVMRFCCCVAVIYLGYCFCGWIVLGPYHVKFRSLSMVSECLFSLINGDDMFVTFAAM 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 QAQQGRSSLVWLFSQLYLYSFISLFIYMVLSLFIALITGAYDTIKHPGGAGAEESELQAY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 QAQQGRSSLVWLFSQLYLYSFISLFIYMVLSLFIALITGAYDTIKHPGGAGAEESELQAY 490 500 510 520 530 540 550 560 570 580 pF1KE4 IAQCQDSPTSGKFRRGSGSACSLLCCCGRDPSEEHSLLVN :::::::::::::::::::::::::::::::::::::::: CCDS12 IAQCQDSPTSGKFRRGSGSACSLLCCCGRDPSEEHSLLVN 550 560 570 580 >>CCDS81347.1 MCOLN2 gene_id:255231|Hs108|chr1 (538 aa) initn: 1666 init1: 758 opt: 1673 Z-score: 1683.1 bits: 321.3 E(32554): 2e-87 Smith-Waterman score: 1771; 49.4% identity (77.7% similar) in 543 aa overlap (37-575:9-533) 10 20 30 40 50 60 pF1KE4 PRGSETERLLTPNPGYGTQAGPSPAPPTPPEEEDLRRRLKYFFMSPCDKFRAKGRKPCKL .:: ::. ::..:::::.:.::. . : :: CCDS81 MAHRDSEMKEECLREDLKFYFMSPCEKYRARRQIPWKL 10 20 30 70 80 90 100 110 120 pF1KE4 MLQVVKILVVTVQLILFGLSNQLAVTFREENTIAFRHLFLLGYSDGADDTFA--AYTREQ ::..::..::.::. :::::::.:.:.:.::.::.:::: ::: .: .. .::.:. CCDS81 GLQILKIVMVTTQLVRFGLSNQLVVAFKEDNTVAFKHLFLKGYSGTDEDDYSCSVYTQED 40 50 60 70 80 90 130 140 150 160 170 180 pF1KE4 LYQAIFHAVDQYLALPDVSLGRYAYVRGGGDPWTNGSGLALCQRYYHRGHVDPANDTFDI :..:: :..:: : :..:: .: :. : :: .:...:..: . :.:.:..: CCDS81 AYESIFFAINQYHQLKDITLGTLGY----GENEDNRIGLKVCKQHYKKGTMFPSNETLNI 100 110 120 130 140 150 190 200 210 220 230 240 pF1KE4 DPMVVTDCIQVDPPERPPPPPSDDLTLLESSSSYKNLTLKFHKLVNVTIHFRLKTINLQS : : ::.:.: . ::. ..:: .. :.:..:..: : :.:: :.::. CCDS81 DNDVELDCVQLDLQDLSKKPPD-----WKNSSFFR---LEFYRLLQVEISFHLKGIDLQT 160 170 180 190 200 250 260 270 280 290 300 pF1KE4 LINNEIPDCYTFSVLITFDNKAHSGRIPISLETQAHIQECKHPSVF--QHGDNSFRLLFD . . :.::::.:. : ::::::::.: : ....:.:.::: ..: . . .. :.:: CCDS81 IHSRELPDCYVFQNTIIFDNKAHSGKIKIYFDSDAKIEECKDLNIFGSTQKNAQYVLVFD 210 220 230 240 250 260 310 320 330 340 350 360 pF1KE4 VVVILTCSLSFLLCARSLLRGFLLQNEFVGFMWRQRGRVISLWERLEFVNGWYILLVTSD . ::. : :..::.::.. .. :...:..:. .. : . .. ::.::::.:.. :: CCDS81 AFVIVICLASLILCTRSIVLALRLRKRFLNFFLEKYKRPVCDTDQWEFINGWYVLVIISD 270 280 290 300 310 320 370 380 390 400 410 420 pF1KE4 VLTISGTIMKIGIEAKNLASYDVCSILLGTSTLLVWVGVIRYLTFFHNYNILIATLRVAL ..:: :.:.:. :.::::..::.:::.:::::::::::::::: .:. ::.:: :....: CCDS81 LMTIIGSILKMEIKAKNLTNYDLCSIFLGTSTLLVWVGVIRYLGYFQAYNVLILTMQASL 330 340 350 360 370 380 430 440 450 460 470 480 pF1KE4 PSVMRFCCCVAVIYLGYCFCGWIVLGPYHVKFRSLSMVSECLFSLINGDDMFVTFAAMQA :.:.::: :...::::: ::::::::::: ::..:. :.::::::.::::::.::: : CCDS81 PKVLRFCACAGMIYLGYTFCGWIVLGPYHDKFENLNTVAECLFSLVNGDDMFATFA--QI 390 400 410 420 430 440 490 500 510 520 530 540 pF1KE4 QQGRSSLVWLFSQLYLYSFISLFIYMVLSLFIALITGAYDTIKHPGGAGAEESELQAYIA :: .: ::::::.:::::::::::::.::::::::: .:::::. : :..:: .. CCDS81 QQ-KSILVWLFSRLYLYSFISLFIYMILSLFIALITDSYDTIKKFQQNGFPETDLQEFLK 450 460 470 480 490 500 550 560 570 580 pF1KE4 QCQDSPTSGKFRRGSGSACSLLCCCGRDPSEEHSLLVN .:. .. .... :.. : .:: : :..: CCDS81 ECS---SKEEYQKESSAFLSCICCRRRKRSDDHLIPIS 510 520 530 >>CCDS30762.1 MCOLN2 gene_id:255231|Hs108|chr1 (566 aa) initn: 1752 init1: 758 opt: 1673 Z-score: 1682.8 bits: 321.3 E(32554): 2.1e-87 Smith-Waterman score: 1771; 49.4% identity (77.7% similar) in 543 aa overlap (37-575:37-561) 10 20 30 40 50 60 pF1KE4 PRGSETERLLTPNPGYGTQAGPSPAPPTPPEEEDLRRRLKYFFMSPCDKFRAKGRKPCKL .:: ::. ::..:::::.:.::. . : :: CCDS30 RFPQARIPERGSGVFRLTVRNAMAHRDSEMKEECLREDLKFYFMSPCEKYRARRQIPWKL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 MLQVVKILVVTVQLILFGLSNQLAVTFREENTIAFRHLFLLGYSDGADDTFA--AYTREQ ::..::..::.::. :::::::.:.:.:.::.::.:::: ::: .: .. .::.:. CCDS30 GLQILKIVMVTTQLVRFGLSNQLVVAFKEDNTVAFKHLFLKGYSGTDEDDYSCSVYTQED 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 LYQAIFHAVDQYLALPDVSLGRYAYVRGGGDPWTNGSGLALCQRYYHRGHVDPANDTFDI :..:: :..:: : :..:: .: :. : :: .:...:..: . :.:.:..: CCDS30 AYESIFFAINQYHQLKDITLGTLGY----GENEDNRIGLKVCKQHYKKGTMFPSNETLNI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 DPMVVTDCIQVDPPERPPPPPSDDLTLLESSSSYKNLTLKFHKLVNVTIHFRLKTINLQS : : ::.:.: . ::. ..:: .. :.:..:..: : :.:: :.::. CCDS30 DNDVELDCVQLDLQDLSKKPPD-----WKNSSFFR---LEFYRLLQVEISFHLKGIDLQT 190 200 210 220 230 250 260 270 280 290 300 pF1KE4 LINNEIPDCYTFSVLITFDNKAHSGRIPISLETQAHIQECKHPSVF--QHGDNSFRLLFD . . :.::::.:. : ::::::::.: : ....:.:.::: ..: . . .. :.:: CCDS30 IHSRELPDCYVFQNTIIFDNKAHSGKIKIYFDSDAKIEECKDLNIFGSTQKNAQYVLVFD 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE4 VVVILTCSLSFLLCARSLLRGFLLQNEFVGFMWRQRGRVISLWERLEFVNGWYILLVTSD . ::. : :..::.::.. .. :...:..:. .. : . .. ::.::::.:.. :: CCDS30 AFVIVICLASLILCTRSIVLALRLRKRFLNFFLEKYKRPVCDTDQWEFINGWYVLVIISD 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE4 VLTISGTIMKIGIEAKNLASYDVCSILLGTSTLLVWVGVIRYLTFFHNYNILIATLRVAL ..:: :.:.:. :.::::..::.:::.:::::::::::::::: .:. ::.:: :....: CCDS30 LMTIIGSILKMEIKAKNLTNYDLCSIFLGTSTLLVWVGVIRYLGYFQAYNVLILTMQASL 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE4 PSVMRFCCCVAVIYLGYCFCGWIVLGPYHVKFRSLSMVSECLFSLINGDDMFVTFAAMQA :.:.::: :...::::: ::::::::::: ::..:. :.::::::.::::::.::: : CCDS30 PKVLRFCACAGMIYLGYTFCGWIVLGPYHDKFENLNTVAECLFSLVNGDDMFATFA--QI 420 430 440 450 460 470 490 500 510 520 530 540 pF1KE4 QQGRSSLVWLFSQLYLYSFISLFIYMVLSLFIALITGAYDTIKHPGGAGAEESELQAYIA :: .: ::::::.:::::::::::::.::::::::: .:::::. : :..:: .. CCDS30 QQ-KSILVWLFSRLYLYSFISLFIYMILSLFIALITDSYDTIKKFQQNGFPETDLQEFLK 480 490 500 510 520 530 550 560 570 580 pF1KE4 QCQDSPTSGKFRRGSGSACSLLCCCGRDPSEEHSLLVN .:. .. .... :.. : .:: : :..: CCDS30 ECS---SKEEYQKESSAFLSCICCRRRKRSDDHLIPIS 540 550 560 >>CCDS58009.1 MCOLN3 gene_id:55283|Hs108|chr1 (497 aa) initn: 1818 init1: 887 opt: 1619 Z-score: 1629.3 bits: 311.2 E(32554): 2e-84 Smith-Waterman score: 1723; 50.9% identity (71.7% similar) in 544 aa overlap (34-569:27-497) 10 20 30 40 50 pF1KE4 PAGPRGSETERLLTPNPGYGTQAGPSPAPPTPPEE---ED-LRRRLKYFFMSPCDKFRAK .: :: :: .::.::.:::.::.:: :. CCDS58 MADPEVVVSSCSSHEEENRCNFNQQTSPSEELLLEDQMRRKLKFFFMNPCEKFWAR 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 GRKPCKLMLQVVKILVVTVQLILFGLSNQLAVTFREENTIAFRHLFLLGYSDGADDTFAA :::: :: .:..:: .::.: CCDS58 GRKPWKLAIQILKIAMVTIQ---------------------------------------- 60 70 120 130 140 150 160 170 pF1KE4 YTREQLYQAIFHAVDQYLALPDVSLGRYAYVRGGGDPWTNGSGLALCQRYYHRGHVDPAN :: : .::.: .:: : :. :..:.::..:.::.. :.: CCDS58 ----------------YLQLYNVSVGNHAYENKG----TKQSAMAICQHFYKRGNIYPGN 80 90 100 110 180 190 200 210 220 230 pF1KE4 DTFDIDPMVVTDCIQVDP--PERPPPPPSDDLTLLESSSSYKNLTLKFHKLVNVTIHFRL ::::::: . :.:. :.: : . : . : :::: ::.:..: ..:.: CCDS58 DTFDIDPEIETECFFVEPDEPFHIGTPAENKL----------NLTLDFHRLLTVELQFKL 120 130 140 150 160 240 250 260 270 280 290 pF1KE4 KTINLQSLINNEIPDCYTFSVLITFDNKAHSGRIPISLETQAHIQECK--HPSVFQHGDN :.::::.. ..:.:::: :.. :::::::::::: :::... :.::: : : . .. CCDS58 KAINLQTVRHQELPDCYDFTLTITFDNKAHSGRIKISLDNDISIRECKDWHVSGSIQKNT 170 180 190 200 210 220 300 310 320 330 340 350 pF1KE4 SFRLLFDVVVILTCSLSFLLCARSLLRGFLLQNEFVGFMWRQRGRVISLWERLEFVNGWY . ..::. ::::: .:..:: ::..::. ::.:::.:. . . .:. ...::::::: CCDS58 HYMMIFDAFVILTCLVSLILCIRSVIRGLQLQQEFVNFFLLHYKKEVSVSDQMEFVNGWY 230 240 250 260 270 280 360 370 380 390 400 410 pF1KE4 ILLVTSDVLTISGTIMKIGIEAKNLASYDVCSILLGTSTLLVWVGVIRYLTFFHNYNILI :... ::.::: :.:.:. :.::.:.:::::::::::::.:::.:::::: :: .::.:: CCDS58 IMIIISDILTIIGSILKMEIQAKSLTSYDVCSILLGTSTMLVWLGVIRYLGFFAKYNLLI 290 300 310 320 330 340 420 430 440 450 460 470 pF1KE4 ATLRVALPSVMRFCCCVAVIYLGYCFCGWIVLGPYHVKFRSLSMVSECLFSLINGDDMFV ::..:::.:.:::::.:.::::::::::::::::: :::::.::::::::::::::::. CCDS58 LTLQAALPNVIRFCCCAAMIYLGYCFCGWIVLGPYHDKFRSLNMVSECLFSLINGDDMFA 350 360 370 380 390 400 480 490 500 510 520 530 pF1KE4 TFAAMQAQQGRSSLVWLFSQLYLYSFISLFIYMVLSLFIALITGAYDTIKHPGGAGAEES ::: :: .: ::::::..::::::::::::.::::::::: .:.:::. : :. CCDS58 TFAKMQQ---KSYLVWLFSRIYLYSFISLFIYMILSLFIALITDTYETIKQYQQDGFPET 410 420 430 440 450 460 540 550 560 570 580 pF1KE4 ELQAYIAQCQDSPTSGKFRRGSGSACSLLCCCGRDPSEEHSLLVN ::...:..:.: :.:::.: . ::.::: . CCDS58 ELRTFISECKDLPNSGKYRLEDDPPVSLFCCCKK 470 480 490 >>CCDS701.1 MCOLN3 gene_id:55283|Hs108|chr1 (553 aa) initn: 2111 init1: 887 opt: 1619 Z-score: 1628.6 bits: 311.2 E(32554): 2.1e-84 Smith-Waterman score: 2077; 57.2% identity (80.7% similar) in 544 aa overlap (34-569:27-553) 10 20 30 40 50 pF1KE4 PAGPRGSETERLLTPNPGYGTQAGPSPAPPTPPEE---ED-LRRRLKYFFMSPCDKFRAK .: :: :: .::.::.:::.::.:: :. CCDS70 MADPEVVVSSCSSHEEENRCNFNQQTSPSEELLLEDQMRRKLKFFFMNPCEKFWAR 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 GRKPCKLMLQVVKILVVTVQLILFGLSNQLAVTFREENTIAFRHLFLLGYSDGADDTFAA :::: :: .:..:: .::.::.:::::::..:.:.:::::::.:::: :: : :::.:. CCDS70 GRKPWKLAIQILKIAMVTIQLVLFGLSNQMVVAFKEENTIAFKHLFLKGYMDRMDDTYAV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 YTREQLYQAIFHAVDQYLALPDVSLGRYAYVRGGGDPWTNGSGLALCQRYYHRGHVDPAN ::. ..:. .. ::.::: : .::.: .:: : :. :..:.::..:.::.. :.: CCDS70 YTQSDVYDQLIFAVNQYLQLYNVSVGNHAYENKG----TKQSAMAICQHFYKRGNIYPGN 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE4 DTFDIDPMVVTDCIQVDP--PERPPPPPSDDLTLLESSSSYKNLTLKFHKLVNVTIHFRL ::::::: . :.:. :.: : . : . : :::: ::.:..: ..:.: CCDS70 DTFDIDPEIETECFFVEPDEPFHIGTPAENKL----------NLTLDFHRLLTVELQFKL 180 190 200 210 220 240 250 260 270 280 290 pF1KE4 KTINLQSLINNEIPDCYTFSVLITFDNKAHSGRIPISLETQAHIQECK--HPSVFQHGDN :.::::.. ..:.:::: :.. :::::::::::: :::... :.::: : : . .. CCDS70 KAINLQTVRHQELPDCYDFTLTITFDNKAHSGRIKISLDNDISIRECKDWHVSGSIQKNT 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE4 SFRLLFDVVVILTCSLSFLLCARSLLRGFLLQNEFVGFMWRQRGRVISLWERLEFVNGWY . ..::. ::::: .:..:: ::..::. ::.:::.:. . . .:. ...::::::: CCDS70 HYMMIFDAFVILTCLVSLILCIRSVIRGLQLQQEFVNFFLLHYKKEVSVSDQMEFVNGWY 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE4 ILLVTSDVLTISGTIMKIGIEAKNLASYDVCSILLGTSTLLVWVGVIRYLTFFHNYNILI :... ::.::: :.:.:. :.::.:.:::::::::::::.:::.:::::: :: .::.:: CCDS70 IMIIISDILTIIGSILKMEIQAKSLTSYDVCSILLGTSTMLVWLGVIRYLGFFAKYNLLI 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE4 ATLRVALPSVMRFCCCVAVIYLGYCFCGWIVLGPYHVKFRSLSMVSECLFSLINGDDMFV ::..:::.:.:::::.:.::::::::::::::::: :::::.::::::::::::::::. CCDS70 LTLQAALPNVIRFCCCAAMIYLGYCFCGWIVLGPYHDKFRSLNMVSECLFSLINGDDMFA 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE4 TFAAMQAQQGRSSLVWLFSQLYLYSFISLFIYMVLSLFIALITGAYDTIKHPGGAGAEES ::: :: .: ::::::..::::::::::::.::::::::: .:.:::. : :. CCDS70 TFAKMQQ---KSYLVWLFSRIYLYSFISLFIYMILSLFIALITDTYETIKQYQQDGFPET 470 480 490 500 510 540 550 560 570 580 pF1KE4 ELQAYIAQCQDSPTSGKFRRGSGSACSLLCCCGRDPSEEHSLLVN ::...:..:.: :.:::.: . ::.::: . CCDS70 ELRTFISECKDLPNSGKYRLEDDPPVSLFCCCKK 520 530 540 550 580 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 16:56:21 2016 done: Mon Nov 7 16:56:22 2016 Total Scan time: 2.750 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]