FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5751, 708 aa 1>>>pF1KE5751 708 - 708 aa - 708 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5375+/-0.0012; mu= 18.0904+/- 0.072 mean_var=60.0199+/-12.221, 0's: 0 Z-trim(100.5): 33 B-trim: 3 in 1/47 Lambda= 0.165549 statistics sampled from 6110 (6120) to 6110 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.53), E-opt: 0.2 (0.188), width: 16 Scan time: 2.480 The best scores are: opt bits E(32554) CCDS9489.1 SLC15A1 gene_id:6564|Hs108|chr13 ( 708) 4657 1121.4 0 CCDS3007.1 SLC15A2 gene_id:6565|Hs108|chr3 ( 729) 1683 411.1 2.9e-114 CCDS54631.1 SLC15A2 gene_id:6565|Hs108|chr3 ( 698) 1668 407.6 3.3e-113 >>CCDS9489.1 SLC15A1 gene_id:6564|Hs108|chr13 (708 aa) initn: 4657 init1: 4657 opt: 4657 Z-score: 6003.9 bits: 1121.4 E(32554): 0 Smith-Waterman score: 4657; 99.9% identity (100.0% similar) in 708 aa overlap (1-708:1-708) 10 20 30 40 50 60 pF1KE5 MGMSKSHSFFGYPLSIFFIVVNEFCERFSYYGMRAILILYFTNFISWDDNLSTAIYHTFV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 MGMSKSHSFFGYPLSIFFIVVNEFCERFSYYGMRAILILYFTNFISWDDNLSTAIYHTFV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 ALCYLTPILGALIADSWLGKFKTIVSLSIVYTIGQAVTSVSSINDLTDHNHDGTPDSLPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 ALCYLTPILGALIADSWLGKFKTIVSLSIVYTIGQAVTSVSSINDLTDHNHDGTPDSLPV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 HVVLSLIGLALIALGTGGIKPCVSAFGGDQFEEGQEKQRNRFFSIFYLAINAGSLLSTII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 HVVLSLIGLALIALGTGGIKPCVSAFGGDQFEEGQEKQRNRFFSIFYLAINAGSLLSTII 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 TPMLRVQQCGIHSKQACYPLAFGVPAALMAVALIVFVLGSGMYKKFKPQGNIMGKVAKCI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 TPMLRVQQCGIHSKQACYPLAFGVPAALMAVALIVFVLGSGMYKKFKPQGNIMGKVAKCI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 GFAIKNRFRHRSKAFPKREHWLDWAKEKYDERLISQIKMVTRVMFLYIPLPMFWALFDQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 GFAIKNRFRHRSKAFPKREHWLDWAKEKYDERLISQIKMVTRVMFLYIPLPMFWALFDQQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 GSRWTLQATTMSGKIGAVEIQPDQMQTVNAILIVIMVPIFDAVLYPLIAKCGFNFTSLKK :::::::::::::::::.:::::::::::::::::::::::::::::::::::::::::: CCDS94 GSRWTLQATTMSGKIGALEIQPDQMQTVNAILIVIMVPIFDAVLYPLIAKCGFNFTSLKK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 MAVGMVLASMAFVVAAIVQVEIDKTLPVFPKGNEVQIKVLNIGNNTMNISLPGEMVTLGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 MAVGMVLASMAFVVAAIVQVEIDKTLPVFPKGNEVQIKVLNIGNNTMNISLPGEMVTLGP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 MSQTNAFMTFDVNKLTRINISSPGSPVTAVTDDFKQGQRHTLLVWAPNHYQVVKDGLNQK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 MSQTNAFMTFDVNKLTRINISSPGSPVTAVTDDFKQGQRHTLLVWAPNHYQVVKDGLNQK 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE5 PEKGENGIRFVNTFNELITITMSGKVYANISSYNASTYQFFPSGIKGFTISSTEIPPQCQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 PEKGENGIRFVNTFNELITITMSGKVYANISSYNASTYQFFPSGIKGFTISSTEIPPQCQ 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE5 PNFNTFYLEFGSAYTYIVQRKNDSCPEVKVFEDISANTVNMALQIPQYFLLTCGEVVFSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 PNFNTFYLEFGSAYTYIVQRKNDSCPEVKVFEDISANTVNMALQIPQYFLLTCGEVVFSV 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE5 TGLEFSYSQAPSNMKSVLQAGWLLTVAVGNIIVLIVAGAGQFSKQWAEYILFAALLLVVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 TGLEFSYSQAPSNMKSVLQAGWLLTVAVGNIIVLIVAGAGQFSKQWAEYILFAALLLVVC 610 620 630 640 650 660 670 680 690 700 pF1KE5 VIFAIMARFYTYINPAEIEAQFDEDEKKNRLEKSNPYFMSGANSQKQM :::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 VIFAIMARFYTYINPAEIEAQFDEDEKKNRLEKSNPYFMSGANSQKQM 670 680 690 700 >>CCDS3007.1 SLC15A2 gene_id:6565|Hs108|chr3 (729 aa) initn: 2171 init1: 891 opt: 1683 Z-score: 2164.9 bits: 411.1 E(32554): 2.9e-114 Smith-Waterman score: 2136; 49.9% identity (75.9% similar) in 696 aa overlap (12-684:42-710) 10 20 30 40 pF1KE5 MGMSKSHSFFGYPLSIFFIVVNEFCERFSYYGMRAILILYF ::::: ::::::::::::::::.:.::::: CCDS30 TLFSPVSIEEVPPRPPSPPKKPSPTICGSNYPLSIAFIVVNEFCERFSYYGMKAVLILYF 20 30 40 50 60 70 50 60 70 80 90 100 pF1KE5 TNFISWDDNLSTAIYHTFVALCYLTPILGALIADSWLGKFKTIVSLSIVYTIGQAVTSVS :. :... ::.:::.: .:::.:::::: ::::::::::::. ::.::..:... :.. CCDS30 LYFLHWNEDTSTSIYHAFSSLCYFTPILGAAIADSWLGKFKTIIYLSLVYVLGHVIKSLG 80 90 100 110 120 130 110 120 130 140 150 160 pF1KE5 SINDLTDHNHDGTPDSLPVHVVLSLIGLALIALGTGGIKPCVSAFGGDQFEEGQEKQRNR .. : . ::.:::::::.:::::::::::::.::::::::: . ..:.: CCDS30 ALPILGGQV---------VHTVLSLIGLSLIALGTGGIKPCVAAFGGDQFEEKHAEERTR 140 150 160 170 180 170 180 190 200 210 220 pF1KE5 FFSIFYLAINAGSLLSTIITPMLRVQ-QCGIHSKQACYPLAFGVPAALMAVALIVFVLGS .::.:::.::::::.::.:::::: . :: . :: ::::::. ::..::.::..:: CCDS30 YFSVFYLSINAGSLISTFITPMLRGDVQC---FGEDCYALAFGVPGLLMVIALVVFAMGS 190 200 210 220 230 230 240 250 260 270 280 pF1KE5 GMYKKFKPQGNIMGKVAKCIGFAIKNRFRHRSKAFPKREHWLDWAKEKYDERLISQIKMV .:.: :.:::...: ::: :::.:::..:: .:::.:::::: ::: ..:: ..: . CCDS30 KIYNKPPPEGNIVAQVFKCIWFAISNRFKNRSGDIPKRQHWLDWAAEKYPKQLIMDVKAL 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE5 TRVMFLYIPLPMFWALFDQQGSRWTLQATTMSGKIGAVEIQPDQMQTVNAILIVIMVPIF :::.::::::::::::.::::::::::: :. ..: .::::::..: .:..:..:.: CCDS30 TRVLFLYIPLPMFWALLDQQGSRWTLQAIRMNRNLGFFVLQPDQMQVLNPLLVLIFIPLF 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE5 DAVLYPLIAKCGFNFTSLKKMAVGMVLASMAFVVAAIVQVEIDKTLPVFPKGNEVQIKVL : :.: :..:::.::.::.::::::.:: .::.::: :...:.. :. : .:: ..:: CCDS30 DFVIYRLVSKCGINFSSLRKMAVGMILACLAFAVAAAVEIKINEMAPAQPGPQEVFLQVL 360 370 380 390 400 410 410 420 430 440 450 pF1KE5 NIGNNTMNISLPGEMVTLGPMSQTNAFM-TFDVNKLTRINISSPGSPVTAVTDDFKQGQR :.... ..... :. . . . ..:. : .:: ... .: ... . CCDS30 NLADDEVKVTVVGNENNSLLIESIKSFQKTPHYSKL-HLKTKSQDFHFHLKYHNLSLYTE 420 430 440 450 460 470 460 470 480 490 500 pF1KE5 HTLLVWAPNHYQVV--KDG----------LNQKPEKGENGIRFVNTFNELITITMSGKVY :. : : :..: .:: ... .: . .:::::... ..:..: . CCDS30 HS--VQEKNWYSLVIREDGNSISSMMVKDTESRTTNGMTTVRFVNTLHKDVNISLSTDTS 480 490 500 510 520 530 510 520 530 540 550 560 pF1KE5 ANIS-SYNASTYQFFPSGIKGFTISSTEIPP-QCQP---NF--NTFYLEFGSAYTYIVQR :.. .:..:.:. :.. : : .:. :: : :.::.:: ... CCDS30 LNVGEDYGVSAYR---------TVQRGEYPAVHCRTEDKNFSLNLGLLDFGAAYLFVITN 540 550 560 570 580 570 580 590 600 610 620 pF1KE5 KNDSCPEVKVFEDISANTVNMALQIPQYFLLTCGEVVFSVTGLEFSYSQAPSNMKSVLQA .... .. .::: :: ...: :.::: :.: :::.:::::::::::::::.::::::: CCDS30 NTNQGLQAWKIEDIPANKMSIAWQLPQYALVTAGEVMFSVTGLEFSYSQAPSSMKSVLQA 590 600 610 620 630 640 630 640 650 660 670 pF1KE5 GWLLTVAVGNIIVLIVAGAGQFSK--QWAEYILFAALLLVVCVIFAIMARFYTYINPAEI .::::.::::::::.:: ::: ::::.:::. ::::.:.::.::. .:. .. .. CCDS30 AWLLTIAVGNIIVLVVA---QFSGLVQWAEFILFSCLLLVICLIFSIMGYYYVPVKTEDM 650 660 670 680 690 700 680 690 700 pF1KE5 EAQFDEDEKKNRLEKSNPYFMSGANSQKQM .. :. CCDS30 RGPADKHIPHIQGNMIKLETKKTKL 710 720 >>CCDS54631.1 SLC15A2 gene_id:6565|Hs108|chr3 (698 aa) initn: 1776 init1: 891 opt: 1668 Z-score: 2145.9 bits: 407.6 E(32554): 3.3e-113 Smith-Waterman score: 2005; 48.3% identity (72.4% similar) in 696 aa overlap (12-684:42-679) 10 20 30 40 pF1KE5 MGMSKSHSFFGYPLSIFFIVVNEFCERFSYYGMRAILILYF ::::: ::::::::::::::::.:.::::: CCDS54 TLFSPVSIEEVPPRPPSPPKKPSPTICGSNYPLSIAFIVVNEFCERFSYYGMKAVLILYF 20 30 40 50 60 70 50 60 70 80 90 100 pF1KE5 TNFISWDDNLSTAIYHTFVALCYLTPILGALIADSWLGKFKTIVSLSIVYTIGQAVTSVS :. :... ::.:::.: .:::.:::::: :::::::::: CCDS54 LYFLHWNEDTSTSIYHAFSSLCYFTPILGAAIADSWLGKFK------------------- 80 90 100 110 110 120 130 140 150 160 pF1KE5 SINDLTDHNHDGTPDSLPVHVVLSLIGLALIALGTGGIKPCVSAFGGDQFEEGQEKQRNR :::::::.:::::::::::::.::::::::: . ..:.: CCDS54 ---------------------VLSLIGLSLIALGTGGIKPCVAAFGGDQFEEKHAEERTR 120 130 140 150 170 180 190 200 210 220 pF1KE5 FFSIFYLAINAGSLLSTIITPMLRVQ-QCGIHSKQACYPLAFGVPAALMAVALIVFVLGS .::.:::.::::::.::.:::::: . :: . :: ::::::. ::..::.::..:: CCDS54 YFSVFYLSINAGSLISTFITPMLRGDVQC---FGEDCYALAFGVPGLLMVIALVVFAMGS 160 170 180 190 200 230 240 250 260 270 280 pF1KE5 GMYKKFKPQGNIMGKVAKCIGFAIKNRFRHRSKAFPKREHWLDWAKEKYDERLISQIKMV .:.: :.:::...: ::: :::.:::..:: .:::.:::::: ::: ..:: ..: . CCDS54 KIYNKPPPEGNIVAQVFKCIWFAISNRFKNRSGDIPKRQHWLDWAAEKYPKQLIMDVKAL 210 220 230 240 250 260 290 300 310 320 330 340 pF1KE5 TRVMFLYIPLPMFWALFDQQGSRWTLQATTMSGKIGAVEIQPDQMQTVNAILIVIMVPIF :::.::::::::::::.::::::::::: :. ..: .::::::..: .:..:..:.: CCDS54 TRVLFLYIPLPMFWALLDQQGSRWTLQAIRMNRNLGFFVLQPDQMQVLNPLLVLIFIPLF 270 280 290 300 310 320 350 360 370 380 390 400 pF1KE5 DAVLYPLIAKCGFNFTSLKKMAVGMVLASMAFVVAAIVQVEIDKTLPVFPKGNEVQIKVL : :.: :..:::.::.::.::::::.:: .::.::: :...:.. :. : .:: ..:: CCDS54 DFVIYRLVSKCGINFSSLRKMAVGMILACLAFAVAAAVEIKINEMAPAQPGPQEVFLQVL 330 340 350 360 370 380 410 420 430 440 450 pF1KE5 NIGNNTMNISLPGEMVTLGPMSQTNAFM-TFDVNKLTRINISSPGSPVTAVTDDFKQGQR :.... ..... :. . . . ..:. : .:: ... .: ... . CCDS54 NLADDEVKVTVVGNENNSLLIESIKSFQKTPHYSKL-HLKTKSQDFHFHLKYHNLSLYTE 390 400 410 420 430 440 460 470 480 490 500 pF1KE5 HTLLVWAPNHYQVV--KDG----------LNQKPEKGENGIRFVNTFNELITITMSGKVY :. : : :..: .:: ... .: . .:::::... ..:..: . CCDS54 HS--VQEKNWYSLVIREDGNSISSMMVKDTESRTTNGMTTVRFVNTLHKDVNISLSTDTS 450 460 470 480 490 500 510 520 530 540 550 560 pF1KE5 ANIS-SYNASTYQFFPSGIKGFTISSTEIPP-QCQP---NF--NTFYLEFGSAYTYIVQR :.. .:..:.:. :.. : : .:. :: : :.::.:: ... CCDS54 LNVGEDYGVSAYR---------TVQRGEYPAVHCRTEDKNFSLNLGLLDFGAAYLFVITN 510 520 530 540 550 570 580 590 600 610 620 pF1KE5 KNDSCPEVKVFEDISANTVNMALQIPQYFLLTCGEVVFSVTGLEFSYSQAPSNMKSVLQA .... .. .::: :: ...: :.::: :.: :::.:::::::::::::::.::::::: CCDS54 NTNQGLQAWKIEDIPANKMSIAWQLPQYALVTAGEVMFSVTGLEFSYSQAPSSMKSVLQA 560 570 580 590 600 610 630 640 650 660 670 pF1KE5 GWLLTVAVGNIIVLIVAGAGQFSK--QWAEYILFAALLLVVCVIFAIMARFYTYINPAEI .::::.::::::::.:: ::: ::::.:::. ::::.:.::.::. .:. .. .. CCDS54 AWLLTIAVGNIIVLVVA---QFSGLVQWAEFILFSCLLLVICLIFSIMGYYYVPVKTEDM 620 630 640 650 660 670 680 690 700 pF1KE5 EAQFDEDEKKNRLEKSNPYFMSGANSQKQM .. :. CCDS54 RGPADKHIPHIQGNMIKLETKKTKL 680 690 708 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 10:38:36 2016 done: Tue Nov 8 10:38:36 2016 Total Scan time: 2.480 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]