FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4410, 423 aa
1>>>pF1KE4410 423 - 423 aa - 423 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.7881+/-0.000476; mu= 13.6798+/- 0.029
mean_var=61.3724+/-12.296, 0's: 0 Z-trim(107.8): 41 B-trim: 139 in 1/49
Lambda= 0.163715
statistics sampled from 15830 (15860) to 15830 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.541), E-opt: 0.2 (0.186), width: 16
Scan time: 8.250
The best scores are: opt bits E(85289)
NP_001053 (OMIM: 189905) transcobalamin-1 precurso ( 433) 2731 654.2 1.8e-187
NP_005133 (OMIM: 261000,609342) gastric intrinsic ( 417) 595 149.7 1.3e-35
NP_000346 (OMIM: 275350,613441) transcobalamin-2 i ( 427) 432 111.2 5e-24
NP_001171655 (OMIM: 275350,613441) transcobalamin- ( 400) 406 105.1 3.3e-22
XP_011543241 (OMIM: 261000,609342) PREDICTED: gast ( 403) 349 91.6 3.8e-18
>>NP_001053 (OMIM: 189905) transcobalamin-1 precursor [H (433 aa)
initn: 2731 init1: 2731 opt: 2731 Z-score: 3486.9 bits: 654.2 E(85289): 1.8e-187
Smith-Waterman score: 2731; 100.0% identity (100.0% similar) in 423 aa overlap (1-423:1-423)
10 20 30 40 50 60
pF1KE4 MRQSHQLPLVGLLLFSFIPSQLCEICEVSEENYIRLKPLLNTMIQSNYNRGTSAVNVVLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 MRQSHQLPLVGLLLFSFIPSQLCEICEVSEENYIRLKPLLNTMIQSNYNRGTSAVNVVLS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 LKLVGIQIQTLMQKMIQQIKYNVKSRLSDVSSGELALIILALGVCRNAEENLIYDYHLID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LKLVGIQIQTLMQKMIQQIKYNVKSRLSDVSSGELALIILALGVCRNAEENLIYDYHLID
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 KLENKFQAEIENMEAHNGTPLTNYYQLSLDVLALCLFNGNYSTAEVVNHFTPENKNYYFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 KLENKFQAEIENMEAHNGTPLTNYYQLSLDVLALCLFNGNYSTAEVVNHFTPENKNYYFG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 SQFSVDTGAMAVLALTCVKKSLINGQIKADEGSLKNISIYTKSLVEKILSEKKENGLIGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 SQFSVDTGAMAVLALTCVKKSLINGQIKADEGSLKNISIYTKSLVEKILSEKKENGLIGN
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 TFSTGEAMQALFVSSDYYNENDWNCQQTLNTVLTEISQGAFSNPNAAAQVLPALMGKTFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 TFSTGEAMQALFVSSDYYNENDWNCQQTLNTVLTEISQGAFSNPNAAAQVLPALMGKTFL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 DINKDSSCVSASGNFNISADEPITVTPPDSQSYISVNYSVRINETYFTNVTVLNGSVFLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 DINKDSSCVSASGNFNISADEPITVTPPDSQSYISVNYSVRINETYFTNVTVLNGSVFLS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 VMEKAQKMNDTIFGFTMEERSWGPYITCIQGLCANNNDRTYWELLSGGEPLSQGAGSYVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 VMEKAQKMNDTIFGFTMEERSWGPYITCIQGLCANNNDRTYWELLSGGEPLSQGAGSYVV
370 380 390 400 410 420
pF1KE4 RNG
:::
NP_001 RNGENLEVRWSKY
430
>>NP_005133 (OMIM: 261000,609342) gastric intrinsic fact (417 aa)
initn: 505 init1: 179 opt: 595 Z-score: 760.6 bits: 149.7 E(85289): 1.3e-35
Smith-Waterman score: 631; 34.3% identity (61.4% similar) in 399 aa overlap (37-422:33-406)
10 20 30 40 50 60
pF1KE4 LPLVGLLLFSFIPSQLCEICEVSEENYIRLKPLLNTMIQSNYNRGTSAV----NVVLSLK
.::.: . : ::.. .......
NP_005 WFALYLLSLLWATAGTSTQTQSSCSVPSAQEPLVNGIQVLMENSVTSSAYPNPSILIAMN
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 LVGIQIQTLMQKMIQQIKYNVKSRLSDVSSGELALIILAL-GVCRNAEENLIYDYHLIDK
:.: .. . :. ..: .:.. :.:.: :.:: . ::. ... : .
NP_005 LAGAYNLKAQKLLTYQL---MSSDNNDLTIGQLGLTIMALTSSCRDPGDKVSI---LQRQ
70 80 90 100 110
130 140 150 160 170 180
pF1KE4 LENKFQAEIENMEAHNGTPLTNYYQLSLDVLALCLFNGNYSTAEVVNHFTPENKNYYFGS
.:: . : :: . .: :: .:::: :.. . .: : .:
NP_005 MEN-WAPSSPNAEA------SAFYGPSLAILALCQKNSEATLPIAVRFAKTLLAN---SS
120 130 140 150 160
190 200 210 220 230 240
pF1KE4 QFSVDTGAMAVLALTCVKKSLINGQIKADEGSLKNISIYTKSLVEKILSEKKENGLIGNT
:.:::::::.:::::. ... : ..:: . .. :..:::: . :.::.::.
NP_005 PFNVDTGAMATLALTCMYNKIPVG---SEEGYRSLFGQVLKDIVEKISMKIKDNGIIGDI
170 180 190 200 210 220
250 260 270 280 290 300
pF1KE4 FSTGEAMQALFVSSDYYNENDWNCQQTLNTVLTEISQGAFSNPNAAAQVLPALMGKTFLD
.::: ::::: :. . ....:::..: . .:.::.:: : :: . ::.::.: :::.::
NP_005 YSTGLAMQALSVTPEP-SKKEWNCKKTTDMILNEIKQGKFHNPMSIAQILPSLKGKTYLD
230 240 250 260 270 280
310 320 330 340 350
pF1KE4 INKDSSCVSASGNFNISADEPITVTP-PDSQSYISVNYSV----RINETYFT---NVTVL
. . :. : . ... : . : : : : :.: :.. : : :. ::.:
NP_005 VPQ----VTCSPDHEVQPTLPSNPGPGPTSASNITVIYTINNQLRGVELLFNETINVSVK
290 300 310 320 330
360 370 380 390 400 410
pF1KE4 NGSVFLSVMEKAQKMNDTIFGFTMEERSWGPYITCIQGLCANNNDRTYWELLSGGEPLSQ
.:::.: :.:.::. : .: : ::: .. :... : : .:::..::: ::..
NP_005 SGSVLLVVLEEAQRKNP-MFKFETTMTSWGLVVSSINNIAENVNHKTYWQFLSGVTPLNE
340 350 360 370 380 390
420
pF1KE4 GAGSYVVRNG
:...:. :
NP_005 GVADYIPFNHEHITANFTQY
400 410
>>NP_000346 (OMIM: 275350,613441) transcobalamin-2 isofo (427 aa)
initn: 342 init1: 134 opt: 432 Z-score: 552.3 bits: 111.2 E(85289): 5e-24
Smith-Waterman score: 464; 29.1% identity (58.2% similar) in 440 aa overlap (10-423:4-417)
10 20 30 40 50
pF1KE4 MRQSHQLPLVGLLLFSF-IPSQLCEICEVSEENYIRLKPLLNTMIQSNYNRGTSAVN--V
.: .:: . . . : :.::. : . .. : . .. . .: .
NP_000 MRHLGAFLFLLGVLGALTEMCEIPEMDSHLVEKLGQHLLPWMDRLSLEHLNPSI
10 20 30 40 50
60 70 80 90 100
pF1KE4 VLSLKLVGIQIQTLMQKMIQQIKYNVKSRL---------SDV----SSGELALIILALGV
..:.: ..: : . .....: . .. : .: : :.::: .:::
NP_000 YVGLRLSSLQAGTKEDLYLHSLKLGYQQCLLGSAFSEDDGDCQGKPSMGQLALYLLAL--
60 70 80 90 100 110
110 120 130 140 150
pF1KE4 CRNAEENLIYDYHLIDKLENKFQAEIENMEA-----HNGTPLTNYYQLSLDVLALCLFNG
:. ... : :.: .... .:. . :.: : :.::: .: .::::: .
NP_000 --RANCEFVRG-HKGDRLVSQLKWFLEDEKRAIGHDHKGHPHTSYYQYGLGILALCLHQK
120 130 140 150 160
160 170 180 190 200 210
pF1KE4 NYSTAEVVNHFTPENKNYYFGSQFSVDTGAMAVLALTCVKKSLINGQIKADEGSLKNISI
. ::... . .. : . ::::.::: ::.::.:.: .: : . :..
NP_000 RVHDS-VVDKLLYAVEPFHQG-HHSVDTAAMAGLAFTCLKRSNFN------PGRRQRITM
170 180 190 200 210 220
220 230 240 250 260 270
pF1KE4 YTKSLVEKILSEKKENGLIGNTFSTGEAMQALFVSSDYYNENDWNCQQTLNTVLTEISQG
... :.::. . .: .::..:: :.: :..: : : .. ..:. ...:
NP_000 AIRTVREEILKAQTPEGHFGNVYSTPLALQFLMTSPMRGAELGTACLKARVALLASLQDG
230 240 250 260 270 280
280 290 300 310 320 330
pF1KE4 AFSNPNAAAQVLPALMGKTFLD-INKDSSCVSASGNFNISADEPITVTPPDSQSYISVNY
::.: .:.::.: ::..: : : :.. . :: . : :..: :::.
NP_000 AFQNALMISQLLPVLNHKTYIDLIFPD--CLAPRVML-----EPAAETIPQTQEIISVTL
290 300 310 320 330
340 350 360 370 380 390
pF1KE4 SV-RINETYFTNVTVLNGSVFLSVMEKAQKMNDTIFGFTMEERSW--GPYITCIQGLCAN
.: . : ...:: ::. .:..::.... :::.: .. :::.: ..: :.
NP_000 QVLSLLPPYRQSISVLAGSTVEDVLKKAHELG----GFTYETQASLSGPYLTSVMGKAAG
340 350 360 370 380 390
400 410 420
pF1KE4 NNDRTYWELLSG-GEPLSQGAGSYVVRNG
.: .:.:: . :: :: ..: ..:
NP_000 --EREFWQLLRDPNTPLLQGIADYRPKDGETIELRLVSW
400 410 420
>>NP_001171655 (OMIM: 275350,613441) transcobalamin-2 is (400 aa)
initn: 346 init1: 134 opt: 406 Z-score: 519.6 bits: 105.1 E(85289): 3.3e-22
Smith-Waterman score: 442; 28.4% identity (57.1% similar) in 422 aa overlap (10-423:4-390)
10 20 30 40 50
pF1KE4 MRQSHQLPLVGLLLFSF-IPSQLCEICEVSEENYIRLKPLLNTMIQSNYNRGTSAVN--V
.: .:: . . . : :.::. : . .. : . .. . .: .
NP_001 MRHLGAFLFLLGVLGALTEMCEIPEMDSHLVEKLGQHLLPWMDRLSLEHLNPSI
10 20 30 40 50
60 70 80 90 100 110
pF1KE4 VLSLKLVGIQIQTLMQKMIQQIKYNVKSRLSDVSSGELALIILALGVCRNAEENLIYDYH
..:.: ..: : . .....: . .. : . .: : :..
NP_001 YVGLRLSSLQAGTKEDLYLHSLKLGYQQCLLGSAFSEDD------GDCQGKPS-------
60 70 80 90 100
120 130 140 150 160 170
pF1KE4 LIDKLENKFQAEIENMEAHNGTPLTNYYQLSLDVLALCLFNGNYSTAEVVNHFTPENKNY
. .: . : : . :.: : :.::: .: .::::: . . ::... . .
NP_001 -MGQLALYLLALRANWHDHKGHPHTSYYQYGLGILALCLHQKRVHDS-VVDKLLYAVEPF
110 120 130 140 150
180 190 200 210 220 230
pF1KE4 YFGSQFSVDTGAMAVLALTCVKKSLINGQIKADEGSLKNISIYTKSLVEKILSEKKENGL
. : . ::::.::: ::.::.:.: .: : . :.. ... :.::. . .:
NP_001 HQG-HHSVDTAAMAGLAFTCLKRSNFN------PGRRQRITMAIRTVREEILKAQTPEGH
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE4 IGNTFSTGEAMQALFVSSDYYNENDWNCQQTLNTVLTEISQGAFSNPNAAAQVLPALMGK
.::..:: :.: :..: : : .. ..:. ...:::.: .:.::.: :
NP_001 FGNVYSTPLALQFLMTSPMRGAELGTACLKARVALLASLQDGAFQNALMISQLLPVLNHK
220 230 240 250 260 270
300 310 320 330 340 350
pF1KE4 TFLD-INKDSSCVSASGNFNISADEPITVTPPDSQSYISVNYSV-RINETYFTNVTVLNG
:..: : : :.. . :: . : :..: :::. .: . : ...:: :
NP_001 TYIDLIFPD--CLAPRVML-----EPAAETIPQTQEIISVTLQVLSLLPPYRQSISVLAG
280 290 300 310 320
360 370 380 390 400 410
pF1KE4 SVFLSVMEKAQKMNDTIFGFTMEERSW--GPYITCIQGLCANNNDRTYWELLSG-GEPLS
:. .:..::.... :::.: .. :::.: ..: :. .: .:.:: . ::
NP_001 STVEDVLKKAHELG----GFTYETQASLSGPYLTSVMGKAAG--EREFWQLLRDPNTPLL
330 340 350 360 370
420
pF1KE4 QGAGSYVVRNG
:: ..: ..:
NP_001 QGIADYRPKDGETIELRLVSW
380 390 400
>>XP_011543241 (OMIM: 261000,609342) PREDICTED: gastric (403 aa)
initn: 527 init1: 141 opt: 349 Z-score: 446.8 bits: 91.6 E(85289): 3.8e-18
Smith-Waterman score: 558; 33.1% identity (58.9% similar) in 399 aa overlap (37-422:33-392)
10 20 30 40 50 60
pF1KE4 LPLVGLLLFSFIPSQLCEICEVSEENYIRLKPLLNTMIQSNYNRGTSAV----NVVLSLK
.::.: . : ::.. .......
XP_011 WFALYLLSLLWATAGTSTQTQSSCSVPSAQEPLVNGIQVLMENSVTSSAYPNPSILIAMN
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 LVGIQIQTLMQKMIQQIKYNVKSRLSDVSSGELALIILAL-GVCRNAEENLIYDYHLIDK
:.: .. . :. ..: .:.. :.:.: :.:: . ::. ... : .
XP_011 LAGAYNLKAQKLLTYQL---MSSDNNDLTIGQLGLTIMALTSSCRDPGDKVSI---LQRQ
70 80 90 100 110
130 140 150 160 170 180
pF1KE4 LENKFQAEIENMEAHNGTPLTNYYQLSLDVLALCLFNGNYSTAEVVNHFTPENKNYYFGS
.:: . : :: . .: :: .:::: :.. . .: : .:
XP_011 MEN-WAPSSPNAEA------SAFYGPSLAILALCQKNSEATLPIAVRFAKTLLAN---SS
120 130 140 150 160
190 200 210 220 230 240
pF1KE4 QFSVDTGAMAVLALTCVKKSLINGQIKADEGSLKNISIYTKSLVEKILSEKKENGLIGNT
:.:::::::.:::::. ... : ..:: . .. :..:::: . :.::.::.
XP_011 PFNVDTGAMATLALTCMYNKIPVG---SEEGYRSLFGQVLKDIVEKISMKIKDNGIIGDI
170 180 190 200 210 220
250 260 270 280 290 300
pF1KE4 FSTGEAMQALFVSSDYYNENDWNCQQTLNTVLTEISQGAFSNPNAAAQVLPALMGKTFLD
.::: ::::: :. . ....:::..: . .:.::.:: : :: . ::.::.:
XP_011 YSTGLAMQALSVTPEP-SKKEWNCKKTTDMILNEIKQGKFHNPMSIAQILPSL-------
230 240 250 260 270
310 320 330 340 350
pF1KE4 INKDSSCVSASGNFNISADEPITVTP-PDSQSYISVNYSV----RINETYFT---NVTVL
:: ... : . : : : : :.: :.. : : :. ::.:
XP_011 --KDH---------EVQPTLPSNPGPGPTSASNITVIYTINNQLRGVELLFNETINVSVK
280 290 300 310 320
360 370 380 390 400 410
pF1KE4 NGSVFLSVMEKAQKMNDTIFGFTMEERSWGPYITCIQGLCANNNDRTYWELLSGGEPLSQ
.:::.: :.:.::. : .: : ::: .. :... : : .:::..::: ::..
XP_011 SGSVLLVVLEEAQRKNP-MFKFETTMTSWGLVVSSINNIAENVNHKTYWQFLSGVTPLNE
330 340 350 360 370 380
420
pF1KE4 GAGSYVVRNG
:...:. :
XP_011 GVADYIPFNHEHITANFTQY
390 400
423 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 01:18:06 2016 done: Sun Nov 6 01:18:07 2016
Total Scan time: 8.250 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]