FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4410, 423 aa 1>>>pF1KE4410 423 - 423 aa - 423 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7881+/-0.000476; mu= 13.6798+/- 0.029 mean_var=61.3724+/-12.296, 0's: 0 Z-trim(107.8): 41 B-trim: 139 in 1/49 Lambda= 0.163715 statistics sampled from 15830 (15860) to 15830 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.541), E-opt: 0.2 (0.186), width: 16 Scan time: 8.250 The best scores are: opt bits E(85289) NP_001053 (OMIM: 189905) transcobalamin-1 precurso ( 433) 2731 654.2 1.8e-187 NP_005133 (OMIM: 261000,609342) gastric intrinsic ( 417) 595 149.7 1.3e-35 NP_000346 (OMIM: 275350,613441) transcobalamin-2 i ( 427) 432 111.2 5e-24 NP_001171655 (OMIM: 275350,613441) transcobalamin- ( 400) 406 105.1 3.3e-22 XP_011543241 (OMIM: 261000,609342) PREDICTED: gast ( 403) 349 91.6 3.8e-18 >>NP_001053 (OMIM: 189905) transcobalamin-1 precursor [H (433 aa) initn: 2731 init1: 2731 opt: 2731 Z-score: 3486.9 bits: 654.2 E(85289): 1.8e-187 Smith-Waterman score: 2731; 100.0% identity (100.0% similar) in 423 aa overlap (1-423:1-423) 10 20 30 40 50 60 pF1KE4 MRQSHQLPLVGLLLFSFIPSQLCEICEVSEENYIRLKPLLNTMIQSNYNRGTSAVNVVLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 MRQSHQLPLVGLLLFSFIPSQLCEICEVSEENYIRLKPLLNTMIQSNYNRGTSAVNVVLS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 LKLVGIQIQTLMQKMIQQIKYNVKSRLSDVSSGELALIILALGVCRNAEENLIYDYHLID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 LKLVGIQIQTLMQKMIQQIKYNVKSRLSDVSSGELALIILALGVCRNAEENLIYDYHLID 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 KLENKFQAEIENMEAHNGTPLTNYYQLSLDVLALCLFNGNYSTAEVVNHFTPENKNYYFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 KLENKFQAEIENMEAHNGTPLTNYYQLSLDVLALCLFNGNYSTAEVVNHFTPENKNYYFG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 SQFSVDTGAMAVLALTCVKKSLINGQIKADEGSLKNISIYTKSLVEKILSEKKENGLIGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 SQFSVDTGAMAVLALTCVKKSLINGQIKADEGSLKNISIYTKSLVEKILSEKKENGLIGN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 TFSTGEAMQALFVSSDYYNENDWNCQQTLNTVLTEISQGAFSNPNAAAQVLPALMGKTFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 TFSTGEAMQALFVSSDYYNENDWNCQQTLNTVLTEISQGAFSNPNAAAQVLPALMGKTFL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 DINKDSSCVSASGNFNISADEPITVTPPDSQSYISVNYSVRINETYFTNVTVLNGSVFLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 DINKDSSCVSASGNFNISADEPITVTPPDSQSYISVNYSVRINETYFTNVTVLNGSVFLS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 VMEKAQKMNDTIFGFTMEERSWGPYITCIQGLCANNNDRTYWELLSGGEPLSQGAGSYVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 VMEKAQKMNDTIFGFTMEERSWGPYITCIQGLCANNNDRTYWELLSGGEPLSQGAGSYVV 370 380 390 400 410 420 pF1KE4 RNG ::: NP_001 RNGENLEVRWSKY 430 >>NP_005133 (OMIM: 261000,609342) gastric intrinsic fact (417 aa) initn: 505 init1: 179 opt: 595 Z-score: 760.6 bits: 149.7 E(85289): 1.3e-35 Smith-Waterman score: 631; 34.3% identity (61.4% similar) in 399 aa overlap (37-422:33-406) 10 20 30 40 50 60 pF1KE4 LPLVGLLLFSFIPSQLCEICEVSEENYIRLKPLLNTMIQSNYNRGTSAV----NVVLSLK .::.: . : ::.. ....... NP_005 WFALYLLSLLWATAGTSTQTQSSCSVPSAQEPLVNGIQVLMENSVTSSAYPNPSILIAMN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 LVGIQIQTLMQKMIQQIKYNVKSRLSDVSSGELALIILAL-GVCRNAEENLIYDYHLIDK :.: .. . :. ..: .:.. :.:.: :.:: . ::. ... : . NP_005 LAGAYNLKAQKLLTYQL---MSSDNNDLTIGQLGLTIMALTSSCRDPGDKVSI---LQRQ 70 80 90 100 110 130 140 150 160 170 180 pF1KE4 LENKFQAEIENMEAHNGTPLTNYYQLSLDVLALCLFNGNYSTAEVVNHFTPENKNYYFGS .:: . : :: . .: :: .:::: :.. . .: : .: NP_005 MEN-WAPSSPNAEA------SAFYGPSLAILALCQKNSEATLPIAVRFAKTLLAN---SS 120 130 140 150 160 190 200 210 220 230 240 pF1KE4 QFSVDTGAMAVLALTCVKKSLINGQIKADEGSLKNISIYTKSLVEKILSEKKENGLIGNT :.:::::::.:::::. ... : ..:: . .. :..:::: . :.::.::. NP_005 PFNVDTGAMATLALTCMYNKIPVG---SEEGYRSLFGQVLKDIVEKISMKIKDNGIIGDI 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE4 FSTGEAMQALFVSSDYYNENDWNCQQTLNTVLTEISQGAFSNPNAAAQVLPALMGKTFLD .::: ::::: :. . ....:::..: . .:.::.:: : :: . ::.::.: :::.:: NP_005 YSTGLAMQALSVTPEP-SKKEWNCKKTTDMILNEIKQGKFHNPMSIAQILPSLKGKTYLD 230 240 250 260 270 280 310 320 330 340 350 pF1KE4 INKDSSCVSASGNFNISADEPITVTP-PDSQSYISVNYSV----RINETYFT---NVTVL . . :. : . ... : . : : : : :.: :.. : : :. ::.: NP_005 VPQ----VTCSPDHEVQPTLPSNPGPGPTSASNITVIYTINNQLRGVELLFNETINVSVK 290 300 310 320 330 360 370 380 390 400 410 pF1KE4 NGSVFLSVMEKAQKMNDTIFGFTMEERSWGPYITCIQGLCANNNDRTYWELLSGGEPLSQ .:::.: :.:.::. : .: : ::: .. :... : : .:::..::: ::.. NP_005 SGSVLLVVLEEAQRKNP-MFKFETTMTSWGLVVSSINNIAENVNHKTYWQFLSGVTPLNE 340 350 360 370 380 390 420 pF1KE4 GAGSYVVRNG :...:. : NP_005 GVADYIPFNHEHITANFTQY 400 410 >>NP_000346 (OMIM: 275350,613441) transcobalamin-2 isofo (427 aa) initn: 342 init1: 134 opt: 432 Z-score: 552.3 bits: 111.2 E(85289): 5e-24 Smith-Waterman score: 464; 29.1% identity (58.2% similar) in 440 aa overlap (10-423:4-417) 10 20 30 40 50 pF1KE4 MRQSHQLPLVGLLLFSF-IPSQLCEICEVSEENYIRLKPLLNTMIQSNYNRGTSAVN--V .: .:: . . . : :.::. : . .. : . .. . .: . NP_000 MRHLGAFLFLLGVLGALTEMCEIPEMDSHLVEKLGQHLLPWMDRLSLEHLNPSI 10 20 30 40 50 60 70 80 90 100 pF1KE4 VLSLKLVGIQIQTLMQKMIQQIKYNVKSRL---------SDV----SSGELALIILALGV ..:.: ..: : . .....: . .. : .: : :.::: .::: NP_000 YVGLRLSSLQAGTKEDLYLHSLKLGYQQCLLGSAFSEDDGDCQGKPSMGQLALYLLAL-- 60 70 80 90 100 110 110 120 130 140 150 pF1KE4 CRNAEENLIYDYHLIDKLENKFQAEIENMEA-----HNGTPLTNYYQLSLDVLALCLFNG :. ... : :.: .... .:. . :.: : :.::: .: .::::: . NP_000 --RANCEFVRG-HKGDRLVSQLKWFLEDEKRAIGHDHKGHPHTSYYQYGLGILALCLHQK 120 130 140 150 160 160 170 180 190 200 210 pF1KE4 NYSTAEVVNHFTPENKNYYFGSQFSVDTGAMAVLALTCVKKSLINGQIKADEGSLKNISI . ::... . .. : . ::::.::: ::.::.:.: .: : . :.. NP_000 RVHDS-VVDKLLYAVEPFHQG-HHSVDTAAMAGLAFTCLKRSNFN------PGRRQRITM 170 180 190 200 210 220 220 230 240 250 260 270 pF1KE4 YTKSLVEKILSEKKENGLIGNTFSTGEAMQALFVSSDYYNENDWNCQQTLNTVLTEISQG ... :.::. . .: .::..:: :.: :..: : : .. ..:. ...: NP_000 AIRTVREEILKAQTPEGHFGNVYSTPLALQFLMTSPMRGAELGTACLKARVALLASLQDG 230 240 250 260 270 280 280 290 300 310 320 330 pF1KE4 AFSNPNAAAQVLPALMGKTFLD-INKDSSCVSASGNFNISADEPITVTPPDSQSYISVNY ::.: .:.::.: ::..: : : :.. . :: . : :..: :::. NP_000 AFQNALMISQLLPVLNHKTYIDLIFPD--CLAPRVML-----EPAAETIPQTQEIISVTL 290 300 310 320 330 340 350 360 370 380 390 pF1KE4 SV-RINETYFTNVTVLNGSVFLSVMEKAQKMNDTIFGFTMEERSW--GPYITCIQGLCAN .: . : ...:: ::. .:..::.... :::.: .. :::.: ..: :. NP_000 QVLSLLPPYRQSISVLAGSTVEDVLKKAHELG----GFTYETQASLSGPYLTSVMGKAAG 340 350 360 370 380 390 400 410 420 pF1KE4 NNDRTYWELLSG-GEPLSQGAGSYVVRNG .: .:.:: . :: :: ..: ..: NP_000 --EREFWQLLRDPNTPLLQGIADYRPKDGETIELRLVSW 400 410 420 >>NP_001171655 (OMIM: 275350,613441) transcobalamin-2 is (400 aa) initn: 346 init1: 134 opt: 406 Z-score: 519.6 bits: 105.1 E(85289): 3.3e-22 Smith-Waterman score: 442; 28.4% identity (57.1% similar) in 422 aa overlap (10-423:4-390) 10 20 30 40 50 pF1KE4 MRQSHQLPLVGLLLFSF-IPSQLCEICEVSEENYIRLKPLLNTMIQSNYNRGTSAVN--V .: .:: . . . : :.::. : . .. : . .. . .: . NP_001 MRHLGAFLFLLGVLGALTEMCEIPEMDSHLVEKLGQHLLPWMDRLSLEHLNPSI 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 VLSLKLVGIQIQTLMQKMIQQIKYNVKSRLSDVSSGELALIILALGVCRNAEENLIYDYH ..:.: ..: : . .....: . .. : . .: : :.. NP_001 YVGLRLSSLQAGTKEDLYLHSLKLGYQQCLLGSAFSEDD------GDCQGKPS------- 60 70 80 90 100 120 130 140 150 160 170 pF1KE4 LIDKLENKFQAEIENMEAHNGTPLTNYYQLSLDVLALCLFNGNYSTAEVVNHFTPENKNY . .: . : : . :.: : :.::: .: .::::: . . ::... . . NP_001 -MGQLALYLLALRANWHDHKGHPHTSYYQYGLGILALCLHQKRVHDS-VVDKLLYAVEPF 110 120 130 140 150 180 190 200 210 220 230 pF1KE4 YFGSQFSVDTGAMAVLALTCVKKSLINGQIKADEGSLKNISIYTKSLVEKILSEKKENGL . : . ::::.::: ::.::.:.: .: : . :.. ... :.::. . .: NP_001 HQG-HHSVDTAAMAGLAFTCLKRSNFN------PGRRQRITMAIRTVREEILKAQTPEGH 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE4 IGNTFSTGEAMQALFVSSDYYNENDWNCQQTLNTVLTEISQGAFSNPNAAAQVLPALMGK .::..:: :.: :..: : : .. ..:. ...:::.: .:.::.: : NP_001 FGNVYSTPLALQFLMTSPMRGAELGTACLKARVALLASLQDGAFQNALMISQLLPVLNHK 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE4 TFLD-INKDSSCVSASGNFNISADEPITVTPPDSQSYISVNYSV-RINETYFTNVTVLNG :..: : : :.. . :: . : :..: :::. .: . : ...:: : NP_001 TYIDLIFPD--CLAPRVML-----EPAAETIPQTQEIISVTLQVLSLLPPYRQSISVLAG 280 290 300 310 320 360 370 380 390 400 410 pF1KE4 SVFLSVMEKAQKMNDTIFGFTMEERSW--GPYITCIQGLCANNNDRTYWELLSG-GEPLS :. .:..::.... :::.: .. :::.: ..: :. .: .:.:: . :: NP_001 STVEDVLKKAHELG----GFTYETQASLSGPYLTSVMGKAAG--EREFWQLLRDPNTPLL 330 340 350 360 370 420 pF1KE4 QGAGSYVVRNG :: ..: ..: NP_001 QGIADYRPKDGETIELRLVSW 380 390 400 >>XP_011543241 (OMIM: 261000,609342) PREDICTED: gastric (403 aa) initn: 527 init1: 141 opt: 349 Z-score: 446.8 bits: 91.6 E(85289): 3.8e-18 Smith-Waterman score: 558; 33.1% identity (58.9% similar) in 399 aa overlap (37-422:33-392) 10 20 30 40 50 60 pF1KE4 LPLVGLLLFSFIPSQLCEICEVSEENYIRLKPLLNTMIQSNYNRGTSAV----NVVLSLK .::.: . : ::.. ....... XP_011 WFALYLLSLLWATAGTSTQTQSSCSVPSAQEPLVNGIQVLMENSVTSSAYPNPSILIAMN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 LVGIQIQTLMQKMIQQIKYNVKSRLSDVSSGELALIILAL-GVCRNAEENLIYDYHLIDK :.: .. . :. ..: .:.. :.:.: :.:: . ::. ... : . XP_011 LAGAYNLKAQKLLTYQL---MSSDNNDLTIGQLGLTIMALTSSCRDPGDKVSI---LQRQ 70 80 90 100 110 130 140 150 160 170 180 pF1KE4 LENKFQAEIENMEAHNGTPLTNYYQLSLDVLALCLFNGNYSTAEVVNHFTPENKNYYFGS .:: . : :: . .: :: .:::: :.. . .: : .: XP_011 MEN-WAPSSPNAEA------SAFYGPSLAILALCQKNSEATLPIAVRFAKTLLAN---SS 120 130 140 150 160 190 200 210 220 230 240 pF1KE4 QFSVDTGAMAVLALTCVKKSLINGQIKADEGSLKNISIYTKSLVEKILSEKKENGLIGNT :.:::::::.:::::. ... : ..:: . .. :..:::: . :.::.::. XP_011 PFNVDTGAMATLALTCMYNKIPVG---SEEGYRSLFGQVLKDIVEKISMKIKDNGIIGDI 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE4 FSTGEAMQALFVSSDYYNENDWNCQQTLNTVLTEISQGAFSNPNAAAQVLPALMGKTFLD .::: ::::: :. . ....:::..: . .:.::.:: : :: . ::.::.: XP_011 YSTGLAMQALSVTPEP-SKKEWNCKKTTDMILNEIKQGKFHNPMSIAQILPSL------- 230 240 250 260 270 310 320 330 340 350 pF1KE4 INKDSSCVSASGNFNISADEPITVTP-PDSQSYISVNYSV----RINETYFT---NVTVL :: ... : . : : : : :.: :.. : : :. ::.: XP_011 --KDH---------EVQPTLPSNPGPGPTSASNITVIYTINNQLRGVELLFNETINVSVK 280 290 300 310 320 360 370 380 390 400 410 pF1KE4 NGSVFLSVMEKAQKMNDTIFGFTMEERSWGPYITCIQGLCANNNDRTYWELLSGGEPLSQ .:::.: :.:.::. : .: : ::: .. :... : : .:::..::: ::.. XP_011 SGSVLLVVLEEAQRKNP-MFKFETTMTSWGLVVSSINNIAENVNHKTYWQFLSGVTPLNE 330 340 350 360 370 380 420 pF1KE4 GAGSYVVRNG :...:. : XP_011 GVADYIPFNHEHITANFTQY 390 400 423 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 01:18:06 2016 done: Sun Nov 6 01:18:07 2016 Total Scan time: 8.250 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]