FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2448, 599 aa
1>>>pF1KE2448 599 - 599 aa - 599 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.4136+/-0.000844; mu= 19.1562+/- 0.051
mean_var=72.1618+/-14.846, 0's: 0 Z-trim(107.3): 17 B-trim: 0 in 0/52
Lambda= 0.150980
statistics sampled from 9477 (9491) to 9477 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.65), E-opt: 0.2 (0.292), width: 16
Scan time: 3.660
The best scores are: opt bits E(32554)
CCDS7038.1 SLC34A3 gene_id:142680|Hs108|chr9 ( 599) 3883 855.1 0
CCDS4418.1 SLC34A1 gene_id:6569|Hs108|chr5 ( 639) 1897 422.6 7.8e-118
CCDS54750.1 SLC34A2 gene_id:10568|Hs108|chr4 ( 689) 1110 251.2 3.3e-66
CCDS3435.1 SLC34A2 gene_id:10568|Hs108|chr4 ( 690) 1110 251.2 3.3e-66
CCDS54953.1 SLC34A1 gene_id:6569|Hs108|chr5 ( 340) 838 191.7 1.3e-48
>>CCDS7038.1 SLC34A3 gene_id:142680|Hs108|chr9 (599 aa)
initn: 3883 init1: 3883 opt: 3883 Z-score: 4567.3 bits: 855.1 E(32554): 0
Smith-Waterman score: 3883; 99.8% identity (99.8% similar) in 599 aa overlap (1-599:1-599)
10 20 30 40 50 60
pF1KE2 MPSSLPGSQVPHPTLDAVDLVEKTLRNEGTSSSAPVLEEGDTDPWTLPQLKDTSQPWKEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 MPSSLPGSQVPHPTLDAVDLVEKTLRNEGTSSSAPVLEEGDTDPWTLPQLKDTSQPWKEL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 RVAGRLRRVAGSVLKACGLLGSLYFFICSLDVLSSAFQLLGSKVAGDIFKDNVVLSNPVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 RVAGRLRRVAGSVLKACGLLGSLYFFICSLDVLSSAFQLLGSKVAGDIFKDNVVLSNPVA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 GLVIGVLVTALVQSSSTSSSIVVSMVAAKLLTVRVSVPIIMGVNVGTSITSTLVSMAQSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 GLVIGVLVTALVQSSSTSSSIVVSMVAAKLLTVRVSVPIIMGVNVGTSITSTLVSMAQSG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 DRDEFQRAFSGSAVHGIFNWLTVLVLLPLESATALLERLSELALGAASLTPRAQAPDILK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 DRDEFQRAFSGSAVHGIFNWLTVLVLLPLESATALLERLSELALGAASLTPRAQAPDILK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 VLTKPLTHLIVQLDSDMIMSSATGNATNSSLIKHWCGTTGQPTQENSSCGAFGPCTEKNS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 VLTKPLTHLIVQLDSDMIMSSATGNATNSSLIKHWCGTTGQPTQENSSCGAFGPCTEKNS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 TAPADRLPCRHLFAGTELTDLAVGCILLAGSLLVLCGCLVLIVKLLNSVLRGRVAQVVRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 TAPADRLPCRHLFAGTELTDLAVGCILLAGSLLVLCGCLVLIVKLLNSVLRGRVAQVVRT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 VINADFPFPLGWLGGYLAVLAGAGLTFALQSSSVFTAAVVPLMGVGVISLDRAYPLLLGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 VINADFPFPLGWLGGYLAVLAGAGLTFALQSSSVFTAAVVPLMGVGVISLDRAYPLLLGS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 NIGTTTTALLAALASPADRMLSALQVALIHFFFNLAGILLWYLVPALRLPIPLARHFGVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 NIGTTTTALLAALASPADRMLSALQVALIHFFFNLAGILLWYLVPALRLPIPLARHFGVV
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 TARYRWVAGVYLLLGFLLLPLAAFGLSLAGGMVLAAVGGPLVGLVLLVILVTVLQRRRPA
:::::::::::::::::::::::::::::::: :::::::::::::::::::::::::::
CCDS70 TARYRWVAGVYLLLGFLLLPLAAFGLSLAGGMELAAVGGPLVGLVLLVILVTVLQRRRPA
490 500 510 520 530 540
550 560 570 580 590
pF1KE2 WLPVRLRSWAWLPVWLHSLEPWDRLVTRCCPCNVCSPPKATTKEAYCYENPEILASQQL
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 WLPVRLRSWAWLPVWLHSLEPWDRLVTRCCPCNVCSPPKATTKEAYCYENPEILASQQL
550 560 570 580 590
>>CCDS4418.1 SLC34A1 gene_id:6569|Hs108|chr5 (639 aa)
initn: 1869 init1: 1069 opt: 1897 Z-score: 2229.0 bits: 422.6 E(32554): 7.8e-118
Smith-Waterman score: 1904; 52.1% identity (77.3% similar) in 591 aa overlap (5-584:41-618)
10 20 30
pF1KE2 MPSSLPG-SQVPHPTLDAVDLVEKTLRNEGTSSS
.:: : :.: : :.:.:
CCDS44 PAVSPLPVRGGHVMRGTAFAYVPSPQVLHRIPGTSAYAFPSLGPVALAEHT------CPC
20 30 40 50 60
40 50 60 70 80 90
pF1KE2 APVLEEGDTDPWTLPQLKDTSQPWKELRVAGRLRRVAGSVLKACGLLGSLYFFICSLDVL
. :::. . : : :.. ..: : :.. .::.... .::. .: ::.:.::::.:
CCDS44 GEVLERHEPLPAKLA-LEEEQKP--ESRLVPKLRQAGAMLLKVPLMLTFLYLFVCSLDML
70 80 90 100 110 120
100 110 120 130 140 150
pF1KE2 SSAFQLLGSKVAGDIFKDNVVLSNPVAGLVIGVLVTALVQSSSTSSSIVVSMVAAKLLTV
:::::: :.::::::::::..:::::::::.:.:::.::::::::.::.::::.. :: :
CCDS44 SSAFQLAGGKVAGDIFKDNAILSNPVAGLVVGILVTVLVQSSSTSTSIIVSMVSSGLLEV
130 140 150 160 170 180
160 170 180 190 200 210
pF1KE2 RVSVPIIMGVNVGTSITSTLVSMAQSGDRDEFQRAFSGSAVHGIFNWLTVLVLLPLESAT
..::::: :.:::.:.:.:.. :.::: .:.:::.:..:: ::::.::::::::.::
CCDS44 SSAIPIIMGSNIGTSVTNTIVALMQAGDRTDFRRAFAGATVHDCFNWLSVLVLLPLEAAT
190 200 210 220 230 240
220 230 240 250 260 270
pF1KE2 ALLERLSELALGAASLTPRAQAPDILKVLTKPLTHLIVQLDSDMIMSSATGNAT--NSSL
. :.....:.... .. .:::.::..:.:.:.::.::: ..: : :::. . : ::
CCDS44 GYLHHITRLVVASFNIHGGRDAPDLLKIITEPFTKLIIQLDESVITSIATGDESLRNHSL
250 260 270 280 290 300
280 290 300 310 320 330
pF1KE2 IKHWCGTTG-QPTQENSSCGAFGPCTEKNSTAPADRLPCRHLFAGTELTDLAVGCILLAG
:. :: . : : : . : :.: : :.:. : : ::::: :::::
CCDS44 IQIWCHPDSLQAPTSMSRAEANSSQTLGNATME----KCNHIFVDTGLPDLAVGLILLAG
310 320 330 340 350
340 350 360 370 380 390
pF1KE2 SLLVLCGCLVLIVKLLNSVLRGRVAQVVRTVINADFPFPLGWLGGYLAVLAGAGLTFALQ
::..:: ::.:.::.:::.:.:.::.:.. :::.::: :. :. ::.:...::..::..:
CCDS44 SLVLLCTCLILLVKMLNSLLKGQVAKVIQKVINTDFPAPFTWVTGYFAMVVGASMTFVVQ
360 370 380 390 400 410
400 410 420 430 440 450
pF1KE2 SSSVFTAAVVPLMGVGVISLDRAYPLLLGSNIGTTTTALLAALASPADRMLSALQVALIH
::::::.:..::.:.::::..::::: :::::::::::.::::::: ... ::.:.:: :
CCDS44 SSSVFTSAITPLIGLGVISIERAYPLTLGSNIGTTTTAILAALASPREKLSSAFQIALCH
420 430 440 450 460 470
460 470 480 490 500 510
pF1KE2 FFFNLAGILLWYLVPALRLPIPLARHFGVVTARYRWVAGVYLLLGFLLLPLAAFGLSLAG
::::..:::::: :: :::: .:. .: ::.::: : .:::. ::::: .::.:.::
CCDS44 FFFNISGILLWYPVPCTRLPIRMAKALGKRTAKYRWFAVLYLLVCFLLLPSLVFGISMAG
480 490 500 510 520 530
520 530 540 550 560
pF1KE2 GMVLAAVGGPLVGLVLLVILVTVLQRRRPAWLPVRLRSWAWLPVWLHSLEPWDRLVTR--
.:...:: :. .:. .:.:..::: : :. :: :..: .:: :.:::.: :.:.::
CCDS44 WQVMVGVGTPFGALLAFVVLINVLQSRSPGHLPKWLQTWDFLPRWMHSLKPLDHLITRAT
540 550 560 570 580 590
570 580 590
pF1KE2 -CC----PCNVCSPPKATTKEAYCYENPEILASQQL
:: : . ::.. .:
CCDS44 LCCARPEPRSPPLPPRVFLEELPPATPSPRLALPAHHNATRL
600 610 620 630
>>CCDS54750.1 SLC34A2 gene_id:10568|Hs108|chr4 (689 aa)
initn: 1987 init1: 1094 opt: 1110 Z-score: 1302.1 bits: 251.2 E(32554): 3.3e-66
Smith-Waterman score: 1953; 53.1% identity (78.3% similar) in 571 aa overlap (32-575:54-624)
10 20 30 40 50
pF1KE2 PSSLPGSQVPHPTLDAVDLVEKTLRNEGTSSSAPVLEEGDT--DPWTLPQLKDTSQPWKE
:.: ...: :::.:: :.:.. :.:
CCDS54 QQPTAPDKSKETNKNNTEAPVTKIELLPSYSTATLIDEPTEVDDPWNLPTLQDSGIKWSE
30 40 50 60 70 80
60 70 80 90 100 110
pF1KE2 LRVAGRLRRVAGSVLKACGLLGSLYFFICSLDVLSSAFQLLGSKVAGDIFKDNVVLSNPV
. :.. .. . ::: ::::.::::.:::::::.:.:.::..:... ..:::.
CCDS54 RDTKGKILCFFQGIGRLILLLGFLYFFVCSLDILSSAFQLVGGKMAGQFFSNSSIMSNPL
90 100 110 120 130 140
120 130 140 150 160 170
pF1KE2 AGLVIGVLVTALVQSSSTSSSIVVSMVAAKLLTVRVSVPIIMGVNVGTSITSTLVSMAQS
:::::::::.::::::::.:::::::...:::::...:::::.:.:::::.:.:.. :
CCDS54 LGLVIGVLVTVLVQSSSTSTSIVVSMVSSSLLTVRAAIPIIMGANIGTSITNTIVALMQV
150 160 170 180 190 200
180 190 200 210 220 230
pF1KE2 GDRDEFQRAFSGSAVHGIFNWLTVLVLLPLESATALLERLSELALGAASLTPRAQAPDIL
:::.::.:::.:..:: .::::.::::::.: :: :: ...: . . . .:::.:
CCDS54 GDRSEFRRAFAGATVHDFFNWLSVLVLLPVEVATHYLEIITQLIVESFHFKNGEDAPDLL
210 220 230 240 250 260
240 250 260 270 280 290
pF1KE2 KVLTKPLTHLIVQLDSDMIMSSATGN--ATNSSLIKHWCGTTGQPTQEN------SSCGA
::.:::.:.::::::. .: . : .. : :.::.: :: : . :: : ..: .
CCDS54 KVITKPFTKLIVQLDKKVISQIAMNDEKAKNKSLVKIWCKTFTNKTQINVTVPSTANCTS
270 280 290 300 310 320
300 310 320 330 340
pF1KE2 FGPC--------TEKNSTAPADRLPCRHLFAGTELTDLAVGCILLAGSLLVLCGCLVLIV
. : : :: : . :.:.:.. .: ::::: ::: :::::::::..::
CCDS54 PSLCWTDGIQNWTMKNVTYKENIAKCQHIFVNFHLPDLAVGTILLILSLLVLCGCLIMIV
330 340 350 360 370 380
350 360 370 380 390 400
pF1KE2 KLLNSVLRGRVAQVVRTVINADFPFPLGWLGGYLAVLAGAGLTFALQSSSVFTAAVVPLM
:.:.:::.:.:: :.. .::.:::::..:: ::::.:.:::.:: .:::::::.:..::.
CCDS54 KILGSVLKGQVATVIKKTINTDFPFPFAWLTGYLAILVGAGMTFIVQSSSVFTSALTPLI
390 400 410 420 430 440
410 420 430 440 450 460
pF1KE2 GVGVISLDRAYPLLLGSNIGTTTTALLAALASPADRMLSALQVALIHFFFNLAGILLWYL
:.:::...::::: :::::::::::.:::::::.. . :.::.:: :::::..::::::
CCDS54 GIGVITIERAYPLTLGSNIGTTTTAILAALASPGNALRSSLQIALCHFFFNISGILLWYP
450 460 470 480 490 500
470 480 490 500 510 520
pF1KE2 VPALRLPIPLARHFGVVTARYRWVAGVYLLLGFLLLPLAAFGLSLAGGMVLAAVGGPLVG
.: :::: .:. .: ..:.::: : ::.. :.:.::..::::::: ::..:: :.:
CCDS54 IPFTRLPIRMAKGLGNISAKYRWFAVFYLIIFFFLIPLTVFGLSLAGWRVLVGVGVPVVF
510 520 530 540 550 560
530 540 550 560 570
pF1KE2 LVLLVILVTVLQRRRPAWLPVRLRSWAWLPVWLHSLEPWDRLVTR---------CCPCNV
...::. . .:: : : :: .:..: .::.:..::.::: .:.. :: : :
CCDS54 IIILVLCLRLLQSRCPRVLPKKLQNWNFLPLWMRSLKPWDAVVSKFTGCFQMRCCCCCRV
570 580 590 600 610 620
580 590
pF1KE2 CSPPKATTKEAYCYENPEILASQQL
:
CCDS54 CCRACCLLCDCPKCCRCSKCCEDLEEAQEGQDVPVKAPETFDNITISREAQGEVPASDSK
630 640 650 660 670 680
>>CCDS3435.1 SLC34A2 gene_id:10568|Hs108|chr4 (690 aa)
initn: 1987 init1: 1094 opt: 1110 Z-score: 1302.1 bits: 251.2 E(32554): 3.3e-66
Smith-Waterman score: 1953; 53.1% identity (78.3% similar) in 571 aa overlap (32-575:55-625)
10 20 30 40 50
pF1KE2 PSSLPGSQVPHPTLDAVDLVEKTLRNEGTSSSAPVLEEGDT--DPWTLPQLKDTSQPWKE
:.: ...: :::.:: :.:.. :.:
CCDS34 QPTAPDKSKETNKTDNTEAPVTKIELLPSYSTATLIDEPTEVDDPWNLPTLQDSGIKWSE
30 40 50 60 70 80
60 70 80 90 100 110
pF1KE2 LRVAGRLRRVAGSVLKACGLLGSLYFFICSLDVLSSAFQLLGSKVAGDIFKDNVVLSNPV
. :.. .. . ::: ::::.::::.:::::::.:.:.::..:... ..:::.
CCDS34 RDTKGKILCFFQGIGRLILLLGFLYFFVCSLDILSSAFQLVGGKMAGQFFSNSSIMSNPL
90 100 110 120 130 140
120 130 140 150 160 170
pF1KE2 AGLVIGVLVTALVQSSSTSSSIVVSMVAAKLLTVRVSVPIIMGVNVGTSITSTLVSMAQS
:::::::::.::::::::.:::::::...:::::...:::::.:.:::::.:.:.. :
CCDS34 LGLVIGVLVTVLVQSSSTSTSIVVSMVSSSLLTVRAAIPIIMGANIGTSITNTIVALMQV
150 160 170 180 190 200
180 190 200 210 220 230
pF1KE2 GDRDEFQRAFSGSAVHGIFNWLTVLVLLPLESATALLERLSELALGAASLTPRAQAPDIL
:::.::.:::.:..:: .::::.::::::.: :: :: ...: . . . .:::.:
CCDS34 GDRSEFRRAFAGATVHDFFNWLSVLVLLPVEVATHYLEIITQLIVESFHFKNGEDAPDLL
210 220 230 240 250 260
240 250 260 270 280 290
pF1KE2 KVLTKPLTHLIVQLDSDMIMSSATGN--ATNSSLIKHWCGTTGQPTQEN------SSCGA
::.:::.:.::::::. .: . : .. : :.::.: :: : . :: : ..: .
CCDS34 KVITKPFTKLIVQLDKKVISQIAMNDEKAKNKSLVKIWCKTFTNKTQINVTVPSTANCTS
270 280 290 300 310 320
300 310 320 330 340
pF1KE2 FGPC--------TEKNSTAPADRLPCRHLFAGTELTDLAVGCILLAGSLLVLCGCLVLIV
. : : :: : . :.:.:.. .: ::::: ::: :::::::::..::
CCDS34 PSLCWTDGIQNWTMKNVTYKENIAKCQHIFVNFHLPDLAVGTILLILSLLVLCGCLIMIV
330 340 350 360 370 380
350 360 370 380 390 400
pF1KE2 KLLNSVLRGRVAQVVRTVINADFPFPLGWLGGYLAVLAGAGLTFALQSSSVFTAAVVPLM
:.:.:::.:.:: :.. .::.:::::..:: ::::.:.:::.:: .:::::::.:..::.
CCDS34 KILGSVLKGQVATVIKKTINTDFPFPFAWLTGYLAILVGAGMTFIVQSSSVFTSALTPLI
390 400 410 420 430 440
410 420 430 440 450 460
pF1KE2 GVGVISLDRAYPLLLGSNIGTTTTALLAALASPADRMLSALQVALIHFFFNLAGILLWYL
:.:::...::::: :::::::::::.:::::::.. . :.::.:: :::::..::::::
CCDS34 GIGVITIERAYPLTLGSNIGTTTTAILAALASPGNALRSSLQIALCHFFFNISGILLWYP
450 460 470 480 490 500
470 480 490 500 510 520
pF1KE2 VPALRLPIPLARHFGVVTARYRWVAGVYLLLGFLLLPLAAFGLSLAGGMVLAAVGGPLVG
.: :::: .:. .: ..:.::: : ::.. :.:.::..::::::: ::..:: :.:
CCDS34 IPFTRLPIRMAKGLGNISAKYRWFAVFYLIIFFFLIPLTVFGLSLAGWRVLVGVGVPVVF
510 520 530 540 550 560
530 540 550 560 570
pF1KE2 LVLLVILVTVLQRRRPAWLPVRLRSWAWLPVWLHSLEPWDRLVTR---------CCPCNV
...::. . .:: : : :: .:..: .::.:..::.::: .:.. :: : :
CCDS34 IIILVLCLRLLQSRCPRVLPKKLQNWNFLPLWMRSLKPWDAVVSKFTGCFQMRCCCCCRV
570 580 590 600 610 620
580 590
pF1KE2 CSPPKATTKEAYCYENPEILASQQL
:
CCDS34 CCRACCLLCDCPKCCRCSKCCEDLEEAQEGQDVPVKAPETFDNITISREAQGEVPASDSK
630 640 650 660 670 680
>>CCDS54953.1 SLC34A1 gene_id:6569|Hs108|chr5 (340 aa)
initn: 838 init1: 769 opt: 838 Z-score: 986.4 bits: 191.7 E(32554): 1.3e-48
Smith-Waterman score: 845; 51.3% identity (78.5% similar) in 275 aa overlap (5-276:41-306)
10 20 30
pF1KE2 MPSSLPG-SQVPHPTLDAVDLVEKTLRNEGTSSS
.:: : :.: : :.:. :
CCDS54 PAVSPLPVRGGHVMRGTAFAYVPSPQVLHRIPGTSAYAFPSLGPVALAEH------TCPC
20 30 40 50 60
40 50 60 70 80 90
pF1KE2 APVLEEGDTDPWTLPQLKDTSQPWKELRVAGRLRRVAGSVLKACGLLGSLYFFICSLDVL
. :::. . : : :.. ..: : :.. .::.... .::. .: ::.:.::::.:
CCDS54 GEVLERHEPLPAKLA-LEEEQKP--ESRLVPKLRQAGAMLLKVPLMLTFLYLFVCSLDML
70 80 90 100 110 120
100 110 120 130 140 150
pF1KE2 SSAFQLLGSKVAGDIFKDNVVLSNPVAGLVIGVLVTALVQSSSTSSSIVVSMVAAKLLTV
:::::: :.::::::::::..:::::::::.:.:::.::::::::.::.::::.. :: :
CCDS54 SSAFQLAGGKVAGDIFKDNAILSNPVAGLVVGILVTVLVQSSSTSTSIIVSMVSSGLLEV
130 140 150 160 170 180
160 170 180 190 200 210
pF1KE2 RVSVPIIMGVNVGTSITSTLVSMAQSGDRDEFQRAFSGSAVHGIFNWLTVLVLLPLESAT
..::::: :.:::.:.:.:.. :.::: .:.:::.:..:: ::::.::::::::.::
CCDS54 SSAIPIIMGSNIGTSVTNTIVALMQAGDRTDFRRAFAGATVHDCFNWLSVLVLLPLEAAT
190 200 210 220 230 240
220 230 240 250 260 270
pF1KE2 ALLERLSELALGAASLTPRAQAPDILKVLTKPLTHLIVQLDSDMIMSSATGNAT--NSSL
. :.....:.... .. .:::.::..:.:.:.::.::: ..: : :::. . : ::
CCDS54 GYLHHITRLVVASFNIHGGRDAPDLLKIITEPFTKLIIQLDESVITSIATGDESLRNHSL
250 260 270 280 290 300
280 290 300 310 320 330
pF1KE2 IKHWCGTTGQPTQENSSCGAFGPCTEKNSTAPADRLPCRHLFAGTELTDLAVGCILLAGS
:. ::
CCDS54 IQIWCHPDSLQQNLEGREITHFDLRKKQAMEDSSVPHCP
310 320 330 340
599 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 20:03:43 2016 done: Mon Nov 7 20:03:43 2016
Total Scan time: 3.660 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]