FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6355, 349 aa
1>>>pF1KE6355 349 - 349 aa - 349 aa
Library: /omim/omim.rfq.tfa
64704883 residues in 91410 sequences
Statistics: Expectation_n fit: rho(ln(x))= 4.7479+/-0.000405; mu= 19.1908+/- 0.025
mean_var=68.5609+/-14.435, 0's: 0 Z-trim(111.6): 41 B-trim: 1203 in 1/50
Lambda= 0.154895
statistics sampled from 20889 (20923) to 20889 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.585), E-opt: 0.2 (0.229), width: 16
Scan time: 3.440
The best scores are: opt bits E(91410)
NP_003040 (OMIM: 182396) sodium/bile acid cotransp ( 349) 2311 525.8 5.9e-149
NP_932069 (OMIM: 613366) solute carrier family 10 ( 377) 722 170.7 4.9e-42
NP_000443 (OMIM: 601295,613291) ileal sodium/bile ( 348) 709 167.8 3.4e-41
NP_001135863 (OMIM: 312090) P3 protein isoform 2 p ( 448) 438 107.3 7e-23
NP_001135864 (OMIM: 312090) P3 protein isoform 1 p ( 477) 438 107.4 7.4e-23
NP_062822 (OMIM: 312090) P3 protein isoform 1 prec ( 477) 438 107.4 7.4e-23
XP_011529503 (OMIM: 312090) P3 protein isoform X5 ( 477) 438 107.4 7.4e-23
XP_011529502 (OMIM: 312090) P3 protein isoform X3 ( 532) 438 107.4 8e-23
XP_005277970 (OMIM: 312090) P3 protein isoform X4 ( 532) 438 107.4 8e-23
XP_006724911 (OMIM: 312090) P3 protein isoform X2 ( 541) 438 107.4 8.1e-23
XP_006724910 (OMIM: 312090) P3 protein isoform X1 ( 570) 438 107.4 8.4e-23
>>NP_003040 (OMIM: 182396) sodium/bile acid cotransporte (349 aa)
initn: 2311 init1: 2311 opt: 2311 Z-score: 2795.8 bits: 525.8 E(91410): 5.9e-149
Smith-Waterman score: 2311; 100.0% identity (100.0% similar) in 349 aa overlap (1-349:1-349)
10 20 30 40 50 60
pF1KE6 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLSLGCTMEFSKIKAHLWKPKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_003 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLSLGCTMEFSKIKAHLWKPKG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 LAIALVAQYGIMPLTAFVLGKVFRLKNIEALAILVCGCSPGGNLSNVFSLAMKGDMNLSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_003 LAIALVAQYGIMPLTAFVLGKVFRLKNIEALAILVCGCSPGGNLSNVFSLAMKGDMNLSI
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 VMTTCSTFCALGMMPLLLYIYSRGIYDGDLKDKVPYKGIVISLVLVLIPCTIGIVLKSKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_003 VMTTCSTFCALGMMPLLLYIYSRGIYDGDLKDKVPYKGIVISLVLVLIPCTIGIVLKSKR
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 PQYMRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLMPFIGFLLGYVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_003 PQYMRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLMPFIGFLLGYVL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE6 SALFCLNGRCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLLYMIFQLGEGLLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_003 SALFCLNGRCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLLYMIFQLGEGLLL
250 260 270 280 290 300
310 320 330 340
pF1KE6 IAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCTA
:::::::::::::::::::::::::::::::::::::::::::::::::
NP_003 IAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCTA
310 320 330 340
>>NP_932069 (OMIM: 613366) solute carrier family 10 memb (377 aa)
initn: 695 init1: 402 opt: 722 Z-score: 876.3 bits: 170.7 E(91410): 4.9e-42
Smith-Waterman score: 722; 38.7% identity (73.6% similar) in 292 aa overlap (24-309:31-313)
10 20 30 40 50
pF1KE6 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLSLGCTMEFSKIKA
.:...:. . :. ..:.::::..:. :. .
NP_932 MRANCSSSSACPANSSEEELPVGLEVHGNLELVFTVVSTVMMGLLMFSLGCSVEIRKLWS
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE6 HLWKPKGLAIALVAQYGIMPLTAFVLGKVFRLKNIEALAILVCGCSPGGNLSNVFSLAMK
:. .: :.:..:. :.:.::.::..:. : :: ..:.:.:. :: :::..::.:.. .
NP_932 HIRRPWGIAVGLLCQFGLMPFTAYLLAISFSLKPVQAIAVLIMGCCPGGTISNIFTFWVD
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE6 GDMNLSIVMTTCSTFCALGMMPLLLYIYSRGIYDGDLKDK--VPYKGIVISLVLVLIPCT
:::.::: :::::: ::::::: .:.:. .. .:... .::..: :.:: . :: .
NP_932 GDMDLSISMTTCSTVAALGMMPLCIYLYT---WSWSLQQNLTIPYQNIGITLVCLTIPVA
130 140 150 160 170
180 190 200 210 220
pF1KE6 IGIVLKSKRPQYMRYVIKGGMII--ILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLM
.:. .. . :. . ..: : .. .:: ::: ... ..:. . :.. : ..
NP_932 FGVYVNYRWPKQSKIILKIGAVVGGVLLLVVAV---AGVVLAKG-SWNSDITLLTISFIF
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE6 PFIGFLLGYVLSALFCLNG--RCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPL
:.:: . :..: ::: .. ::: :.:.::: ::.:.: :.:...: : . .. :::
NP_932 PLIGHVTGFLL-ALFTHQSWQRCR-TISLETGAQNIQMCITMLQLSFTAEHLVQMLSFPL
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE6 LYMIFQLGEGLLLIAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPC
: .::: .:.:..: . :..
NP_932 AYGLFQLIDGFLIVAAYQTYKRRLKNKHGKKNSGCTEVCHTRKSTSSRETNAFLEVNEEG
300 310 320 330 340 350
>>NP_000443 (OMIM: 601295,613291) ileal sodium/bile acid (348 aa)
initn: 691 init1: 401 opt: 709 Z-score: 861.0 bits: 167.8 E(91410): 3.4e-41
Smith-Waterman score: 709; 38.4% identity (73.4% similar) in 297 aa overlap (25-319:32-322)
10 20 30 40 50
pF1KE6 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLSLGCTMEFSKIKAH
..::..:...: ..:.:.::..:..:. .:
NP_000 NDPNSCVDNATVCSGASCVVPESNFNNILSVVLSTVLTILLALVMFSMGCNVEIKKFLGH
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE6 LWKPKGLAIALVAQYGIMPLTAFVLGKVFRLKNIEALAILVCGCSPGGNLSNVFSLAMKG
. .: :. .... :.::::::.:.:. .: . ..:...:. :: :::. ::... . :
NP_000 IKRPWGICVGFLCQFGIMPLTGFILSVAFDILPLQAVVVLIIGCCPGGTASNILAYWVDG
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE6 DMNLSIVMTTCSTFCALGMMPLLLYIYSRGIYD-GDLKDKVPYKGIVISLVLVLIPCTIG
::.::. ::::::. ::::::: : ::.. : :.. .:: .: ::: ...: .::
NP_000 DMDLSVSMTTCSTLLALGMMPLCLLIYTKMWVDSGSI--VIPYDNIGTSLVALVVPVSIG
130 140 150 160 170
180 190 200 210 220 230
pF1KE6 IVLKSKRPQYMRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLMPFIG
. .. : :: . ..: : : . : ..:...: .. ..: : : ....: :
NP_000 MFVNHKWPQKAKIILKIGSIAGAILIVLIAVVGGILYQSAWIIA--PKLWIIGTIFPVAG
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE6 FLLGYVLSALFCLNG-RCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLLYMIF
. ::..:. . : ::: ::..::: ::.::::::....: :: .. .: :::.: ::
NP_000 YSLGFLLARIAGLPWYRCR-TVAFETGMQNTQLCSTIVQLSFTPEELNVVFTFPLIYSIF
240 250 260 270 280 290
300 310 320 330 340
pF1KE6 QLGEGLLLIAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCTA
::. . ...... :.: . :.:...
NP_000 QLAFAAIFLGFYVAYKKCHG-KNKAEIPESKENGTEPESSFYKANGGFQPDEK
300 310 320 330 340
>>NP_001135863 (OMIM: 312090) P3 protein isoform 2 precu (448 aa)
initn: 409 init1: 271 opt: 438 Z-score: 532.3 bits: 107.3 E(91410): 7e-23
Smith-Waterman score: 438; 32.7% identity (66.1% similar) in 248 aa overlap (30-274:166-408)
10 20 30 40 50
pF1KE6 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLSLGCTMEFSKIKAHLWKPK
.:. ..: :.:: .:. .:. . .:.
NP_001 DFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQ
140 150 160 170 180 190
60 70 80 90 100 110
pF1KE6 GLAIALVAQYGIMPLTAFVLGKVFRLKNIEALAILVCGCSPGGNLSNVFSLAMKGDMNLS
. ..:..:. .::: ::...::: : . ::.... ::::. : .::: . ::..:.
NP_001 PMLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLA
200 210 220 230 240 250
120 130 140 150 160 170
pF1KE6 IVMTTCSTFCALGMMPLLLYIYSRGIYDGDLKDKVPYKGIVISLVLVLIPCTIGIVLKSK
: :: :: : :..:: :::: . . .:: . :. .:... :: ..:...:::
NP_001 ISMTFLSTVAATGFLPLSSAIYSRLLSIHETL-HVPISKILGTLLFIAIPIAVGVLIKSK
260 270 280 290 300 310
180 190 200 210 220 230
pF1KE6 RPQY---MRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLMPFIGFLL
:.. . :.: ...:: .. . : .: :. .. .. .. .:..:.:.
NP_001 LPKFSQLLLQVVKPFSFVLLLGGL----FLAYRMGVFILAGIRLPIVLVGITVPLVGLLV
320 330 340 350 360 370
240 250 260 270 280 290
pF1KE6 GYVLSALFCLNGRCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLLYMIFQLGE
:: :.. . : :::::.:.: :: : ..:....
NP_001 GYCLATCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSE
380 390 400 410 420 430
300 310 320 330 340
pF1KE6 GLLLIAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCTA
NP_001 MLALVIGHFIYSSLFPVP
440
>>NP_001135864 (OMIM: 312090) P3 protein isoform 1 precu (477 aa)
initn: 409 init1: 271 opt: 438 Z-score: 531.9 bits: 107.4 E(91410): 7.4e-23
Smith-Waterman score: 438; 32.7% identity (66.1% similar) in 248 aa overlap (30-274:195-437)
10 20 30 40 50
pF1KE6 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLSLGCTMEFSKIKAHLWKPK
.:. ..: :.:: .:. .:. . .:.
NP_001 DFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQ
170 180 190 200 210 220
60 70 80 90 100 110
pF1KE6 GLAIALVAQYGIMPLTAFVLGKVFRLKNIEALAILVCGCSPGGNLSNVFSLAMKGDMNLS
. ..:..:. .::: ::...::: : . ::.... ::::. : .::: . ::..:.
NP_001 PMLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLA
230 240 250 260 270 280
120 130 140 150 160 170
pF1KE6 IVMTTCSTFCALGMMPLLLYIYSRGIYDGDLKDKVPYKGIVISLVLVLIPCTIGIVLKSK
: :: :: : :..:: :::: . . .:: . :. .:... :: ..:...:::
NP_001 ISMTFLSTVAATGFLPLSSAIYSRLLSIHETL-HVPISKILGTLLFIAIPIAVGVLIKSK
290 300 310 320 330 340
180 190 200 210 220 230
pF1KE6 RPQY---MRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLMPFIGFLL
:.. . :.: ...:: .. . : .: :. .. .. .. .:..:.:.
NP_001 LPKFSQLLLQVVKPFSFVLLLGGL----FLAYRMGVFILAGIRLPIVLVGITVPLVGLLV
350 360 370 380 390
240 250 260 270 280 290
pF1KE6 GYVLSALFCLNGRCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLLYMIFQLGE
:: :.. . : :::::.:.: :: : ..:....
NP_001 GYCLATCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSE
400 410 420 430 440 450
300 310 320 330 340
pF1KE6 GLLLIAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCTA
NP_001 MLALVIGHFIYSSLFPVP
460 470
>>NP_062822 (OMIM: 312090) P3 protein isoform 1 precurso (477 aa)
initn: 409 init1: 271 opt: 438 Z-score: 531.9 bits: 107.4 E(91410): 7.4e-23
Smith-Waterman score: 438; 32.7% identity (66.1% similar) in 248 aa overlap (30-274:195-437)
10 20 30 40 50
pF1KE6 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLSLGCTMEFSKIKAHLWKPK
.:. ..: :.:: .:. .:. . .:.
NP_062 DFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQ
170 180 190 200 210 220
60 70 80 90 100 110
pF1KE6 GLAIALVAQYGIMPLTAFVLGKVFRLKNIEALAILVCGCSPGGNLSNVFSLAMKGDMNLS
. ..:..:. .::: ::...::: : . ::.... ::::. : .::: . ::..:.
NP_062 PMLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLA
230 240 250 260 270 280
120 130 140 150 160 170
pF1KE6 IVMTTCSTFCALGMMPLLLYIYSRGIYDGDLKDKVPYKGIVISLVLVLIPCTIGIVLKSK
: :: :: : :..:: :::: . . .:: . :. .:... :: ..:...:::
NP_062 ISMTFLSTVAATGFLPLSSAIYSRLLSIHETL-HVPISKILGTLLFIAIPIAVGVLIKSK
290 300 310 320 330 340
180 190 200 210 220 230
pF1KE6 RPQY---MRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLMPFIGFLL
:.. . :.: ...:: .. . : .: :. .. .. .. .:..:.:.
NP_062 LPKFSQLLLQVVKPFSFVLLLGGL----FLAYRMGVFILAGIRLPIVLVGITVPLVGLLV
350 360 370 380 390
240 250 260 270 280 290
pF1KE6 GYVLSALFCLNGRCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLLYMIFQLGE
:: :.. . : :::::.:.: :: : ..:....
NP_062 GYCLATCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSE
400 410 420 430 440 450
300 310 320 330 340
pF1KE6 GLLLIAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCTA
NP_062 MLALVIGHFIYSSLFPVP
460 470
>>XP_011529503 (OMIM: 312090) P3 protein isoform X5 [Hom (477 aa)
initn: 409 init1: 271 opt: 438 Z-score: 531.9 bits: 107.4 E(91410): 7.4e-23
Smith-Waterman score: 438; 32.7% identity (66.1% similar) in 248 aa overlap (30-274:195-437)
10 20 30 40 50
pF1KE6 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLSLGCTMEFSKIKAHLWKPK
.:. ..: :.:: .:. .:. . .:.
XP_011 DFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQ
170 180 190 200 210 220
60 70 80 90 100 110
pF1KE6 GLAIALVAQYGIMPLTAFVLGKVFRLKNIEALAILVCGCSPGGNLSNVFSLAMKGDMNLS
. ..:..:. .::: ::...::: : . ::.... ::::. : .::: . ::..:.
XP_011 PMLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLA
230 240 250 260 270 280
120 130 140 150 160 170
pF1KE6 IVMTTCSTFCALGMMPLLLYIYSRGIYDGDLKDKVPYKGIVISLVLVLIPCTIGIVLKSK
: :: :: : :..:: :::: . . .:: . :. .:... :: ..:...:::
XP_011 ISMTFLSTVAATGFLPLSSAIYSRLLSIHETL-HVPISKILGTLLFIAIPIAVGVLIKSK
290 300 310 320 330 340
180 190 200 210 220 230
pF1KE6 RPQY---MRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLMPFIGFLL
:.. . :.: ...:: .. . : .: :. .. .. .. .:..:.:.
XP_011 LPKFSQLLLQVVKPFSFVLLLGGL----FLAYRMGVFILAGIRLPIVLVGITVPLVGLLV
350 360 370 380 390
240 250 260 270 280 290
pF1KE6 GYVLSALFCLNGRCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLLYMIFQLGE
:: :.. . : :::::.:.: :: : ..:....
XP_011 GYCLATCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSE
400 410 420 430 440 450
300 310 320 330 340
pF1KE6 GLLLIAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCTA
XP_011 MLALVIGHFIYSSLFPVP
460 470
>>XP_011529502 (OMIM: 312090) P3 protein isoform X3 [Hom (532 aa)
initn: 409 init1: 271 opt: 438 Z-score: 531.3 bits: 107.4 E(91410): 8e-23
Smith-Waterman score: 438; 32.7% identity (66.1% similar) in 248 aa overlap (30-274:250-492)
10 20 30 40 50
pF1KE6 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLSLGCTMEFSKIKAHLWKPK
.:. ..: :.:: .:. .:. . .:.
XP_011 DFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQ
220 230 240 250 260 270
60 70 80 90 100 110
pF1KE6 GLAIALVAQYGIMPLTAFVLGKVFRLKNIEALAILVCGCSPGGNLSNVFSLAMKGDMNLS
. ..:..:. .::: ::...::: : . ::.... ::::. : .::: . ::..:.
XP_011 PMLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLA
280 290 300 310 320 330
120 130 140 150 160 170
pF1KE6 IVMTTCSTFCALGMMPLLLYIYSRGIYDGDLKDKVPYKGIVISLVLVLIPCTIGIVLKSK
: :: :: : :..:: :::: . . .:: . :. .:... :: ..:...:::
XP_011 ISMTFLSTVAATGFLPLSSAIYSRLLSIHETL-HVPISKILGTLLFIAIPIAVGVLIKSK
340 350 360 370 380 390
180 190 200 210 220 230
pF1KE6 RPQY---MRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLMPFIGFLL
:.. . :.: ...:: .. . : .: :. .. .. .. .:..:.:.
XP_011 LPKFSQLLLQVVKPFSFVLLLGGL----FLAYRMGVFILAGIRLPIVLVGITVPLVGLLV
400 410 420 430 440 450
240 250 260 270 280 290
pF1KE6 GYVLSALFCLNGRCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLLYMIFQLGE
:: :.. . : :::::.:.: :: : ..:....
XP_011 GYCLATCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSE
460 470 480 490 500 510
300 310 320 330 340
pF1KE6 GLLLIAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCTA
XP_011 MLALVIGHFIYSSLFPVP
520 530
>>XP_005277970 (OMIM: 312090) P3 protein isoform X4 [Hom (532 aa)
initn: 409 init1: 271 opt: 438 Z-score: 531.3 bits: 107.4 E(91410): 8e-23
Smith-Waterman score: 438; 32.7% identity (66.1% similar) in 248 aa overlap (30-274:250-492)
10 20 30 40 50
pF1KE6 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLSLGCTMEFSKIKAHLWKPK
.:. ..: :.:: .:. .:. . .:.
XP_005 DFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQ
220 230 240 250 260 270
60 70 80 90 100 110
pF1KE6 GLAIALVAQYGIMPLTAFVLGKVFRLKNIEALAILVCGCSPGGNLSNVFSLAMKGDMNLS
. ..:..:. .::: ::...::: : . ::.... ::::. : .::: . ::..:.
XP_005 PMLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLA
280 290 300 310 320 330
120 130 140 150 160 170
pF1KE6 IVMTTCSTFCALGMMPLLLYIYSRGIYDGDLKDKVPYKGIVISLVLVLIPCTIGIVLKSK
: :: :: : :..:: :::: . . .:: . :. .:... :: ..:...:::
XP_005 ISMTFLSTVAATGFLPLSSAIYSRLLSIHETL-HVPISKILGTLLFIAIPIAVGVLIKSK
340 350 360 370 380 390
180 190 200 210 220 230
pF1KE6 RPQY---MRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLMPFIGFLL
:.. . :.: ...:: .. . : .: :. .. .. .. .:..:.:.
XP_005 LPKFSQLLLQVVKPFSFVLLLGGL----FLAYRMGVFILAGIRLPIVLVGITVPLVGLLV
400 410 420 430 440 450
240 250 260 270 280 290
pF1KE6 GYVLSALFCLNGRCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLLYMIFQLGE
:: :.. . : :::::.:.: :: : ..:....
XP_005 GYCLATCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSE
460 470 480 490 500 510
300 310 320 330 340
pF1KE6 GLLLIAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCTA
XP_005 MLALVIGHFIYSSLFPVP
520 530
>>XP_006724911 (OMIM: 312090) P3 protein isoform X2 [Hom (541 aa)
initn: 409 init1: 271 opt: 438 Z-score: 531.2 bits: 107.4 E(91410): 8.1e-23
Smith-Waterman score: 438; 32.7% identity (66.1% similar) in 248 aa overlap (30-274:259-501)
10 20 30 40 50
pF1KE6 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLSLGCTMEFSKIKAHLWKPK
.:. ..: :.:: .:. .:. . .:.
XP_006 DFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQ
230 240 250 260 270 280
60 70 80 90 100 110
pF1KE6 GLAIALVAQYGIMPLTAFVLGKVFRLKNIEALAILVCGCSPGGNLSNVFSLAMKGDMNLS
. ..:..:. .::: ::...::: : . ::.... ::::. : .::: . ::..:.
XP_006 PMLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLA
290 300 310 320 330 340
120 130 140 150 160 170
pF1KE6 IVMTTCSTFCALGMMPLLLYIYSRGIYDGDLKDKVPYKGIVISLVLVLIPCTIGIVLKSK
: :: :: : :..:: :::: . . .:: . :. .:... :: ..:...:::
XP_006 ISMTFLSTVAATGFLPLSSAIYSRLLSIHETL-HVPISKILGTLLFIAIPIAVGVLIKSK
350 360 370 380 390 400
180 190 200 210 220 230
pF1KE6 RPQY---MRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLMPFIGFLL
:.. . :.: ...:: .. . : .: :. .. .. .. .:..:.:.
XP_006 LPKFSQLLLQVVKPFSFVLLLGGL----FLAYRMGVFILAGIRLPIVLVGITVPLVGLLV
410 420 430 440 450 460
240 250 260 270 280 290
pF1KE6 GYVLSALFCLNGRCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLLYMIFQLGE
:: :.. . : :::::.:.: :: : ..:....
XP_006 GYCLATCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSE
470 480 490 500 510 520
300 310 320 330 340
pF1KE6 GLLLIAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCTA
XP_006 MLALVIGHFIYSSLFPVP
530 540
349 residues in 1 query sequences
64704883 residues in 91410 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Jul 14 21:19:41 2018 done: Sat Jul 14 21:19:41 2018
Total Scan time: 3.440 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]