FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2448, 599 aa 1>>>pF1KE2448 599 - 599 aa - 599 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4136+/-0.000844; mu= 19.1562+/- 0.051 mean_var=72.1618+/-14.846, 0's: 0 Z-trim(107.3): 17 B-trim: 0 in 0/52 Lambda= 0.150980 statistics sampled from 9477 (9491) to 9477 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.65), E-opt: 0.2 (0.292), width: 16 Scan time: 3.660 The best scores are: opt bits E(32554) CCDS7038.1 SLC34A3 gene_id:142680|Hs108|chr9 ( 599) 3883 855.1 0 CCDS4418.1 SLC34A1 gene_id:6569|Hs108|chr5 ( 639) 1897 422.6 7.8e-118 CCDS54750.1 SLC34A2 gene_id:10568|Hs108|chr4 ( 689) 1110 251.2 3.3e-66 CCDS3435.1 SLC34A2 gene_id:10568|Hs108|chr4 ( 690) 1110 251.2 3.3e-66 CCDS54953.1 SLC34A1 gene_id:6569|Hs108|chr5 ( 340) 838 191.7 1.3e-48 >>CCDS7038.1 SLC34A3 gene_id:142680|Hs108|chr9 (599 aa) initn: 3883 init1: 3883 opt: 3883 Z-score: 4567.3 bits: 855.1 E(32554): 0 Smith-Waterman score: 3883; 99.8% identity (99.8% similar) in 599 aa overlap (1-599:1-599) 10 20 30 40 50 60 pF1KE2 MPSSLPGSQVPHPTLDAVDLVEKTLRNEGTSSSAPVLEEGDTDPWTLPQLKDTSQPWKEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 MPSSLPGSQVPHPTLDAVDLVEKTLRNEGTSSSAPVLEEGDTDPWTLPQLKDTSQPWKEL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 RVAGRLRRVAGSVLKACGLLGSLYFFICSLDVLSSAFQLLGSKVAGDIFKDNVVLSNPVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 RVAGRLRRVAGSVLKACGLLGSLYFFICSLDVLSSAFQLLGSKVAGDIFKDNVVLSNPVA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 GLVIGVLVTALVQSSSTSSSIVVSMVAAKLLTVRVSVPIIMGVNVGTSITSTLVSMAQSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 GLVIGVLVTALVQSSSTSSSIVVSMVAAKLLTVRVSVPIIMGVNVGTSITSTLVSMAQSG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 DRDEFQRAFSGSAVHGIFNWLTVLVLLPLESATALLERLSELALGAASLTPRAQAPDILK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 DRDEFQRAFSGSAVHGIFNWLTVLVLLPLESATALLERLSELALGAASLTPRAQAPDILK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 VLTKPLTHLIVQLDSDMIMSSATGNATNSSLIKHWCGTTGQPTQENSSCGAFGPCTEKNS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 VLTKPLTHLIVQLDSDMIMSSATGNATNSSLIKHWCGTTGQPTQENSSCGAFGPCTEKNS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 TAPADRLPCRHLFAGTELTDLAVGCILLAGSLLVLCGCLVLIVKLLNSVLRGRVAQVVRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 TAPADRLPCRHLFAGTELTDLAVGCILLAGSLLVLCGCLVLIVKLLNSVLRGRVAQVVRT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 VINADFPFPLGWLGGYLAVLAGAGLTFALQSSSVFTAAVVPLMGVGVISLDRAYPLLLGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 VINADFPFPLGWLGGYLAVLAGAGLTFALQSSSVFTAAVVPLMGVGVISLDRAYPLLLGS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 NIGTTTTALLAALASPADRMLSALQVALIHFFFNLAGILLWYLVPALRLPIPLARHFGVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 NIGTTTTALLAALASPADRMLSALQVALIHFFFNLAGILLWYLVPALRLPIPLARHFGVV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 TARYRWVAGVYLLLGFLLLPLAAFGLSLAGGMVLAAVGGPLVGLVLLVILVTVLQRRRPA :::::::::::::::::::::::::::::::: ::::::::::::::::::::::::::: CCDS70 TARYRWVAGVYLLLGFLLLPLAAFGLSLAGGMELAAVGGPLVGLVLLVILVTVLQRRRPA 490 500 510 520 530 540 550 560 570 580 590 pF1KE2 WLPVRLRSWAWLPVWLHSLEPWDRLVTRCCPCNVCSPPKATTKEAYCYENPEILASQQL ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 WLPVRLRSWAWLPVWLHSLEPWDRLVTRCCPCNVCSPPKATTKEAYCYENPEILASQQL 550 560 570 580 590 >>CCDS4418.1 SLC34A1 gene_id:6569|Hs108|chr5 (639 aa) initn: 1869 init1: 1069 opt: 1897 Z-score: 2229.0 bits: 422.6 E(32554): 7.8e-118 Smith-Waterman score: 1904; 52.1% identity (77.3% similar) in 591 aa overlap (5-584:41-618) 10 20 30 pF1KE2 MPSSLPG-SQVPHPTLDAVDLVEKTLRNEGTSSS .:: : :.: : :.:.: CCDS44 PAVSPLPVRGGHVMRGTAFAYVPSPQVLHRIPGTSAYAFPSLGPVALAEHT------CPC 20 30 40 50 60 40 50 60 70 80 90 pF1KE2 APVLEEGDTDPWTLPQLKDTSQPWKELRVAGRLRRVAGSVLKACGLLGSLYFFICSLDVL . :::. . : : :.. ..: : :.. .::.... .::. .: ::.:.::::.: CCDS44 GEVLERHEPLPAKLA-LEEEQKP--ESRLVPKLRQAGAMLLKVPLMLTFLYLFVCSLDML 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE2 SSAFQLLGSKVAGDIFKDNVVLSNPVAGLVIGVLVTALVQSSSTSSSIVVSMVAAKLLTV :::::: :.::::::::::..:::::::::.:.:::.::::::::.::.::::.. :: : CCDS44 SSAFQLAGGKVAGDIFKDNAILSNPVAGLVVGILVTVLVQSSSTSTSIIVSMVSSGLLEV 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE2 RVSVPIIMGVNVGTSITSTLVSMAQSGDRDEFQRAFSGSAVHGIFNWLTVLVLLPLESAT ..::::: :.:::.:.:.:.. :.::: .:.:::.:..:: ::::.::::::::.:: CCDS44 SSAIPIIMGSNIGTSVTNTIVALMQAGDRTDFRRAFAGATVHDCFNWLSVLVLLPLEAAT 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE2 ALLERLSELALGAASLTPRAQAPDILKVLTKPLTHLIVQLDSDMIMSSATGNAT--NSSL . :.....:.... .. .:::.::..:.:.:.::.::: ..: : :::. . : :: CCDS44 GYLHHITRLVVASFNIHGGRDAPDLLKIITEPFTKLIIQLDESVITSIATGDESLRNHSL 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE2 IKHWCGTTG-QPTQENSSCGAFGPCTEKNSTAPADRLPCRHLFAGTELTDLAVGCILLAG :. :: . : : : . : :.: : :.:. : : ::::: ::::: CCDS44 IQIWCHPDSLQAPTSMSRAEANSSQTLGNATME----KCNHIFVDTGLPDLAVGLILLAG 310 320 330 340 350 340 350 360 370 380 390 pF1KE2 SLLVLCGCLVLIVKLLNSVLRGRVAQVVRTVINADFPFPLGWLGGYLAVLAGAGLTFALQ ::..:: ::.:.::.:::.:.:.::.:.. :::.::: :. :. ::.:...::..::..: CCDS44 SLVLLCTCLILLVKMLNSLLKGQVAKVIQKVINTDFPAPFTWVTGYFAMVVGASMTFVVQ 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE2 SSSVFTAAVVPLMGVGVISLDRAYPLLLGSNIGTTTTALLAALASPADRMLSALQVALIH ::::::.:..::.:.::::..::::: :::::::::::.::::::: ... ::.:.:: : CCDS44 SSSVFTSAITPLIGLGVISIERAYPLTLGSNIGTTTTAILAALASPREKLSSAFQIALCH 420 430 440 450 460 470 460 470 480 490 500 510 pF1KE2 FFFNLAGILLWYLVPALRLPIPLARHFGVVTARYRWVAGVYLLLGFLLLPLAAFGLSLAG ::::..:::::: :: :::: .:. .: ::.::: : .:::. ::::: .::.:.:: CCDS44 FFFNISGILLWYPVPCTRLPIRMAKALGKRTAKYRWFAVLYLLVCFLLLPSLVFGISMAG 480 490 500 510 520 530 520 530 540 550 560 pF1KE2 GMVLAAVGGPLVGLVLLVILVTVLQRRRPAWLPVRLRSWAWLPVWLHSLEPWDRLVTR-- .:...:: :. .:. .:.:..::: : :. :: :..: .:: :.:::.: :.:.:: CCDS44 WQVMVGVGTPFGALLAFVVLINVLQSRSPGHLPKWLQTWDFLPRWMHSLKPLDHLITRAT 540 550 560 570 580 590 570 580 590 pF1KE2 -CC----PCNVCSPPKATTKEAYCYENPEILASQQL :: : . ::.. .: CCDS44 LCCARPEPRSPPLPPRVFLEELPPATPSPRLALPAHHNATRL 600 610 620 630 >>CCDS54750.1 SLC34A2 gene_id:10568|Hs108|chr4 (689 aa) initn: 1987 init1: 1094 opt: 1110 Z-score: 1302.1 bits: 251.2 E(32554): 3.3e-66 Smith-Waterman score: 1953; 53.1% identity (78.3% similar) in 571 aa overlap (32-575:54-624) 10 20 30 40 50 pF1KE2 PSSLPGSQVPHPTLDAVDLVEKTLRNEGTSSSAPVLEEGDT--DPWTLPQLKDTSQPWKE :.: ...: :::.:: :.:.. :.: CCDS54 QQPTAPDKSKETNKNNTEAPVTKIELLPSYSTATLIDEPTEVDDPWNLPTLQDSGIKWSE 30 40 50 60 70 80 60 70 80 90 100 110 pF1KE2 LRVAGRLRRVAGSVLKACGLLGSLYFFICSLDVLSSAFQLLGSKVAGDIFKDNVVLSNPV . :.. .. . ::: ::::.::::.:::::::.:.:.::..:... ..:::. CCDS54 RDTKGKILCFFQGIGRLILLLGFLYFFVCSLDILSSAFQLVGGKMAGQFFSNSSIMSNPL 90 100 110 120 130 140 120 130 140 150 160 170 pF1KE2 AGLVIGVLVTALVQSSSTSSSIVVSMVAAKLLTVRVSVPIIMGVNVGTSITSTLVSMAQS :::::::::.::::::::.:::::::...:::::...:::::.:.:::::.:.:.. : CCDS54 LGLVIGVLVTVLVQSSSTSTSIVVSMVSSSLLTVRAAIPIIMGANIGTSITNTIVALMQV 150 160 170 180 190 200 180 190 200 210 220 230 pF1KE2 GDRDEFQRAFSGSAVHGIFNWLTVLVLLPLESATALLERLSELALGAASLTPRAQAPDIL :::.::.:::.:..:: .::::.::::::.: :: :: ...: . . . .:::.: CCDS54 GDRSEFRRAFAGATVHDFFNWLSVLVLLPVEVATHYLEIITQLIVESFHFKNGEDAPDLL 210 220 230 240 250 260 240 250 260 270 280 290 pF1KE2 KVLTKPLTHLIVQLDSDMIMSSATGN--ATNSSLIKHWCGTTGQPTQEN------SSCGA ::.:::.:.::::::. .: . : .. : :.::.: :: : . :: : ..: . CCDS54 KVITKPFTKLIVQLDKKVISQIAMNDEKAKNKSLVKIWCKTFTNKTQINVTVPSTANCTS 270 280 290 300 310 320 300 310 320 330 340 pF1KE2 FGPC--------TEKNSTAPADRLPCRHLFAGTELTDLAVGCILLAGSLLVLCGCLVLIV . : : :: : . :.:.:.. .: ::::: ::: :::::::::..:: CCDS54 PSLCWTDGIQNWTMKNVTYKENIAKCQHIFVNFHLPDLAVGTILLILSLLVLCGCLIMIV 330 340 350 360 370 380 350 360 370 380 390 400 pF1KE2 KLLNSVLRGRVAQVVRTVINADFPFPLGWLGGYLAVLAGAGLTFALQSSSVFTAAVVPLM :.:.:::.:.:: :.. .::.:::::..:: ::::.:.:::.:: .:::::::.:..::. CCDS54 KILGSVLKGQVATVIKKTINTDFPFPFAWLTGYLAILVGAGMTFIVQSSSVFTSALTPLI 390 400 410 420 430 440 410 420 430 440 450 460 pF1KE2 GVGVISLDRAYPLLLGSNIGTTTTALLAALASPADRMLSALQVALIHFFFNLAGILLWYL :.:::...::::: :::::::::::.:::::::.. . :.::.:: :::::..:::::: CCDS54 GIGVITIERAYPLTLGSNIGTTTTAILAALASPGNALRSSLQIALCHFFFNISGILLWYP 450 460 470 480 490 500 470 480 490 500 510 520 pF1KE2 VPALRLPIPLARHFGVVTARYRWVAGVYLLLGFLLLPLAAFGLSLAGGMVLAAVGGPLVG .: :::: .:. .: ..:.::: : ::.. :.:.::..::::::: ::..:: :.: CCDS54 IPFTRLPIRMAKGLGNISAKYRWFAVFYLIIFFFLIPLTVFGLSLAGWRVLVGVGVPVVF 510 520 530 540 550 560 530 540 550 560 570 pF1KE2 LVLLVILVTVLQRRRPAWLPVRLRSWAWLPVWLHSLEPWDRLVTR---------CCPCNV ...::. . .:: : : :: .:..: .::.:..::.::: .:.. :: : : CCDS54 IIILVLCLRLLQSRCPRVLPKKLQNWNFLPLWMRSLKPWDAVVSKFTGCFQMRCCCCCRV 570 580 590 600 610 620 580 590 pF1KE2 CSPPKATTKEAYCYENPEILASQQL : CCDS54 CCRACCLLCDCPKCCRCSKCCEDLEEAQEGQDVPVKAPETFDNITISREAQGEVPASDSK 630 640 650 660 670 680 >>CCDS3435.1 SLC34A2 gene_id:10568|Hs108|chr4 (690 aa) initn: 1987 init1: 1094 opt: 1110 Z-score: 1302.1 bits: 251.2 E(32554): 3.3e-66 Smith-Waterman score: 1953; 53.1% identity (78.3% similar) in 571 aa overlap (32-575:55-625) 10 20 30 40 50 pF1KE2 PSSLPGSQVPHPTLDAVDLVEKTLRNEGTSSSAPVLEEGDT--DPWTLPQLKDTSQPWKE :.: ...: :::.:: :.:.. :.: CCDS34 QPTAPDKSKETNKTDNTEAPVTKIELLPSYSTATLIDEPTEVDDPWNLPTLQDSGIKWSE 30 40 50 60 70 80 60 70 80 90 100 110 pF1KE2 LRVAGRLRRVAGSVLKACGLLGSLYFFICSLDVLSSAFQLLGSKVAGDIFKDNVVLSNPV . :.. .. . ::: ::::.::::.:::::::.:.:.::..:... ..:::. CCDS34 RDTKGKILCFFQGIGRLILLLGFLYFFVCSLDILSSAFQLVGGKMAGQFFSNSSIMSNPL 90 100 110 120 130 140 120 130 140 150 160 170 pF1KE2 AGLVIGVLVTALVQSSSTSSSIVVSMVAAKLLTVRVSVPIIMGVNVGTSITSTLVSMAQS :::::::::.::::::::.:::::::...:::::...:::::.:.:::::.:.:.. : CCDS34 LGLVIGVLVTVLVQSSSTSTSIVVSMVSSSLLTVRAAIPIIMGANIGTSITNTIVALMQV 150 160 170 180 190 200 180 190 200 210 220 230 pF1KE2 GDRDEFQRAFSGSAVHGIFNWLTVLVLLPLESATALLERLSELALGAASLTPRAQAPDIL :::.::.:::.:..:: .::::.::::::.: :: :: ...: . . . .:::.: CCDS34 GDRSEFRRAFAGATVHDFFNWLSVLVLLPVEVATHYLEIITQLIVESFHFKNGEDAPDLL 210 220 230 240 250 260 240 250 260 270 280 290 pF1KE2 KVLTKPLTHLIVQLDSDMIMSSATGN--ATNSSLIKHWCGTTGQPTQEN------SSCGA ::.:::.:.::::::. .: . : .. : :.::.: :: : . :: : ..: . CCDS34 KVITKPFTKLIVQLDKKVISQIAMNDEKAKNKSLVKIWCKTFTNKTQINVTVPSTANCTS 270 280 290 300 310 320 300 310 320 330 340 pF1KE2 FGPC--------TEKNSTAPADRLPCRHLFAGTELTDLAVGCILLAGSLLVLCGCLVLIV . : : :: : . :.:.:.. .: ::::: ::: :::::::::..:: CCDS34 PSLCWTDGIQNWTMKNVTYKENIAKCQHIFVNFHLPDLAVGTILLILSLLVLCGCLIMIV 330 340 350 360 370 380 350 360 370 380 390 400 pF1KE2 KLLNSVLRGRVAQVVRTVINADFPFPLGWLGGYLAVLAGAGLTFALQSSSVFTAAVVPLM :.:.:::.:.:: :.. .::.:::::..:: ::::.:.:::.:: .:::::::.:..::. CCDS34 KILGSVLKGQVATVIKKTINTDFPFPFAWLTGYLAILVGAGMTFIVQSSSVFTSALTPLI 390 400 410 420 430 440 410 420 430 440 450 460 pF1KE2 GVGVISLDRAYPLLLGSNIGTTTTALLAALASPADRMLSALQVALIHFFFNLAGILLWYL :.:::...::::: :::::::::::.:::::::.. . :.::.:: :::::..:::::: CCDS34 GIGVITIERAYPLTLGSNIGTTTTAILAALASPGNALRSSLQIALCHFFFNISGILLWYP 450 460 470 480 490 500 470 480 490 500 510 520 pF1KE2 VPALRLPIPLARHFGVVTARYRWVAGVYLLLGFLLLPLAAFGLSLAGGMVLAAVGGPLVG .: :::: .:. .: ..:.::: : ::.. :.:.::..::::::: ::..:: :.: CCDS34 IPFTRLPIRMAKGLGNISAKYRWFAVFYLIIFFFLIPLTVFGLSLAGWRVLVGVGVPVVF 510 520 530 540 550 560 530 540 550 560 570 pF1KE2 LVLLVILVTVLQRRRPAWLPVRLRSWAWLPVWLHSLEPWDRLVTR---------CCPCNV ...::. . .:: : : :: .:..: .::.:..::.::: .:.. :: : : CCDS34 IIILVLCLRLLQSRCPRVLPKKLQNWNFLPLWMRSLKPWDAVVSKFTGCFQMRCCCCCRV 570 580 590 600 610 620 580 590 pF1KE2 CSPPKATTKEAYCYENPEILASQQL : CCDS34 CCRACCLLCDCPKCCRCSKCCEDLEEAQEGQDVPVKAPETFDNITISREAQGEVPASDSK 630 640 650 660 670 680 >>CCDS54953.1 SLC34A1 gene_id:6569|Hs108|chr5 (340 aa) initn: 838 init1: 769 opt: 838 Z-score: 986.4 bits: 191.7 E(32554): 1.3e-48 Smith-Waterman score: 845; 51.3% identity (78.5% similar) in 275 aa overlap (5-276:41-306) 10 20 30 pF1KE2 MPSSLPG-SQVPHPTLDAVDLVEKTLRNEGTSSS .:: : :.: : :.:. : CCDS54 PAVSPLPVRGGHVMRGTAFAYVPSPQVLHRIPGTSAYAFPSLGPVALAEH------TCPC 20 30 40 50 60 40 50 60 70 80 90 pF1KE2 APVLEEGDTDPWTLPQLKDTSQPWKELRVAGRLRRVAGSVLKACGLLGSLYFFICSLDVL . :::. . : : :.. ..: : :.. .::.... .::. .: ::.:.::::.: CCDS54 GEVLERHEPLPAKLA-LEEEQKP--ESRLVPKLRQAGAMLLKVPLMLTFLYLFVCSLDML 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE2 SSAFQLLGSKVAGDIFKDNVVLSNPVAGLVIGVLVTALVQSSSTSSSIVVSMVAAKLLTV :::::: :.::::::::::..:::::::::.:.:::.::::::::.::.::::.. :: : CCDS54 SSAFQLAGGKVAGDIFKDNAILSNPVAGLVVGILVTVLVQSSSTSTSIIVSMVSSGLLEV 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE2 RVSVPIIMGVNVGTSITSTLVSMAQSGDRDEFQRAFSGSAVHGIFNWLTVLVLLPLESAT ..::::: :.:::.:.:.:.. :.::: .:.:::.:..:: ::::.::::::::.:: CCDS54 SSAIPIIMGSNIGTSVTNTIVALMQAGDRTDFRRAFAGATVHDCFNWLSVLVLLPLEAAT 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE2 ALLERLSELALGAASLTPRAQAPDILKVLTKPLTHLIVQLDSDMIMSSATGNAT--NSSL . :.....:.... .. .:::.::..:.:.:.::.::: ..: : :::. . : :: CCDS54 GYLHHITRLVVASFNIHGGRDAPDLLKIITEPFTKLIIQLDESVITSIATGDESLRNHSL 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE2 IKHWCGTTGQPTQENSSCGAFGPCTEKNSTAPADRLPCRHLFAGTELTDLAVGCILLAGS :. :: CCDS54 IQIWCHPDSLQQNLEGREITHFDLRKKQAMEDSSVPHCP 310 320 330 340 599 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 20:03:43 2016 done: Mon Nov 7 20:03:43 2016 Total Scan time: 3.660 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]