FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0387, 603 aa
1>>>pF1KE0387 603 - 603 aa - 603 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 4.9500+/-0.000346; mu= 21.3816+/- 0.022
mean_var=68.7034+/-13.904, 0's: 0 Z-trim(115.0): 110 B-trim: 75 in 1/49
Lambda= 0.154734
statistics sampled from 25047 (25168) to 25047 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.661), E-opt: 0.2 (0.295), width: 16
Scan time: 10.720
The best scores are: opt bits E(85289)
NP_938080 (OMIM: 608043) polypeptide N-acetylgalac ( 603) 4226 952.6 0
NP_001030017 (OMIM: 615138) polypeptide N-acetylga ( 601) 3146 711.5 2e-204
XP_016863733 (OMIM: 615138) PREDICTED: polypeptide ( 609) 3033 686.3 8e-197
XP_011530295 (OMIM: 615138) PREDICTED: polypeptide ( 522) 2951 667.9 2.3e-191
XP_011530296 (OMIM: 615138) PREDICTED: polypeptide ( 451) 2420 549.3 9.9e-156
XP_011530297 (OMIM: 615138) PREDICTED: polypeptide ( 451) 2420 549.3 9.9e-156
XP_011530298 (OMIM: 615138) PREDICTED: polypeptide ( 451) 2420 549.3 9.9e-156
XP_011530299 (OMIM: 615138) PREDICTED: polypeptide ( 418) 2419 549.1 1.1e-155
XP_016863732 (OMIM: 615138) PREDICTED: polypeptide ( 387) 1973 449.5 9.6e-126
NP_003765 (OMIM: 603565) polypeptide N-acetylgalac ( 578) 1367 314.4 6.9e-85
XP_005258296 (OMIM: 602273) PREDICTED: polypeptide ( 559) 1323 304.5 6.1e-82
NP_065207 (OMIM: 602273) polypeptide N-acetylgalac ( 559) 1323 304.5 6.1e-82
XP_016881181 (OMIM: 602273) PREDICTED: polypeptide ( 559) 1323 304.5 6.1e-82
NP_443149 (OMIM: 608369) polypeptide N-acetylgalac ( 556) 1311 301.9 3.9e-81
XP_016858750 (OMIM: 608369) PREDICTED: polypeptide ( 556) 1311 301.9 3.9e-81
NP_001288556 (OMIM: 608369) polypeptide N-acetylga ( 561) 1311 301.9 3.9e-81
XP_016858749 (OMIM: 608369) PREDICTED: polypeptide ( 561) 1311 301.9 3.9e-81
XP_016858748 (OMIM: 608369) PREDICTED: polypeptide ( 571) 1311 301.9 4e-81
XP_016858747 (OMIM: 608369) PREDICTED: polypeptide ( 571) 1311 301.9 4e-81
XP_011508839 (OMIM: 608369) PREDICTED: polypeptide ( 571) 1311 301.9 4e-81
NP_078918 (OMIM: 608812,610290) polypeptide N-acet ( 581) 1288 296.7 1.4e-79
XP_016876987 (OMIM: 615132) PREDICTED: polypeptide ( 558) 1278 294.5 6.4e-79
NP_001161840 (OMIM: 615132) polypeptide N-acetylga ( 558) 1278 294.5 6.4e-79
XP_011535308 (OMIM: 615132) PREDICTED: polypeptide ( 558) 1278 294.5 6.4e-79
XP_011535307 (OMIM: 615132) PREDICTED: polypeptide ( 558) 1278 294.5 6.4e-79
NP_065743 (OMIM: 615132) polypeptide N-acetylgalac ( 558) 1278 294.5 6.4e-79
NP_001316024 (OMIM: 608225) polypeptide N-acetylga ( 517) 1257 289.8 1.6e-77
NP_001240756 (OMIM: 608225) polypeptide N-acetylga ( 532) 1257 289.8 1.6e-77
NP_001316025 (OMIM: 608225) polypeptide N-acetylga ( 532) 1257 289.8 1.6e-77
NP_078848 (OMIM: 608225) polypeptide N-acetylgalac ( 552) 1257 289.8 1.6e-77
XP_016860395 (OMIM: 608225) PREDICTED: polypeptide ( 563) 1257 289.8 1.7e-77
NP_055383 (OMIM: 615129) polypeptide N-acetylgalac ( 940) 1253 289.1 4.6e-77
XP_016858726 (OMIM: 615129) PREDICTED: polypeptide ( 956) 1253 289.1 4.7e-77
NP_001291443 (OMIM: 615130) polypeptide N-acetylga ( 527) 1246 287.3 8.7e-77
NP_071370 (OMIM: 615130) polypeptide N-acetylgalac ( 608) 1236 285.1 4.6e-76
XP_006716145 (OMIM: 615130) PREDICTED: polypeptide ( 608) 1236 285.1 4.6e-76
XP_006716147 (OMIM: 615130) PREDICTED: polypeptide ( 608) 1236 285.1 4.6e-76
XP_006716146 (OMIM: 615130) PREDICTED: polypeptide ( 608) 1236 285.1 4.6e-76
XP_011535309 (OMIM: 615132) PREDICTED: polypeptide ( 514) 1222 282.0 3.5e-75
NP_473451 (OMIM: 615131) polypeptide N-acetylgalac ( 639) 1220 281.6 5.6e-75
XP_016870622 (OMIM: 608812,610290) PREDICTED: poly ( 497) 1205 278.1 4.7e-74
XP_011517320 (OMIM: 608812,610290) PREDICTED: poly ( 507) 1205 278.2 4.8e-74
NP_009141 (OMIM: 605148) polypeptide N-acetylgalac ( 622) 1188 274.4 7.8e-73
XP_016874234 (OMIM: 605148) PREDICTED: polypeptide ( 622) 1188 274.4 7.8e-73
XP_016874233 (OMIM: 605148) PREDICTED: polypeptide ( 622) 1188 274.4 7.8e-73
XP_006719277 (OMIM: 605148) PREDICTED: polypeptide ( 622) 1188 274.4 7.8e-73
XP_011536124 (OMIM: 605148) PREDICTED: polypeptide ( 622) 1188 274.4 7.8e-73
XP_005268664 (OMIM: 605148) PREDICTED: polypeptide ( 622) 1188 274.4 7.8e-73
XP_011536121 (OMIM: 605148) PREDICTED: polypeptide ( 622) 1188 274.4 7.8e-73
XP_016856452 (OMIM: 602274) PREDICTED: polypeptide ( 636) 1183 273.3 1.7e-72
>>NP_938080 (OMIM: 608043) polypeptide N-acetylgalactosa (603 aa)
initn: 4226 init1: 4226 opt: 4226 Z-score: 5094.0 bits: 952.6 E(85289): 0
Smith-Waterman score: 4226; 100.0% identity (100.0% similar) in 603 aa overlap (1-603:1-603)
10 20 30 40 50 60
pF1KE0 MRRKEKRLLQAVALVLAALVLLPNVGLWALYRERQPDGTPGGSGAAVAPAAGQGSHSRQK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_938 MRRKEKRLLQAVALVLAALVLLPNVGLWALYRERQPDGTPGGSGAAVAPAAGQGSHSRQK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 KTFFLGDGQKLKDWHDKEAIRRDAQRVGNGEQGRPYPMTDAERVDQAYRENGFNIYVSDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_938 KTFFLGDGQKLKDWHDKEAIRRDAQRVGNGEQGRPYPMTDAERVDQAYRENGFNIYVSDK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 ISLNRSLPDIRHPNCNSKRYLETLPNTSIIIPFHNEGWSSLLRTVHSVLNRSPPELVAEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_938 ISLNRSLPDIRHPNCNSKRYLETLPNTSIIIPFHNEGWSSLLRTVHSVLNRSPPELVAEI
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 VLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLIRTRMLGASVATGDVITFLDSHC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_938 VLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLIRTRMLGASVATGDVITFLDSHC
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 EANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYETQAGDAMRGAFDWEMYYKRIPIP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_938 EANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYETQAGDAMRGAFDWEMYYKRIPIP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 PELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWMCGGRM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_938 PELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWMCGGRM
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 EDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWMDEYAEYIYQRRPEYRHLSAGDV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_938 EDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWMDEYAEYIYQRRPEYRHLSAGDV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE0 AVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAAAWGEIRNVGTGLCADTKHGALG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_938 AVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAAAWGEIRNVGTGLCADTKHGALG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE0 SPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQHTKKFCFDAISHTSPVTLYDCHS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_938 SPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQHTKKFCFDAISHTSPVTLYDCHS
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE0 MKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTCNPSSLTQQWLFEHTNSTVLEKF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_938 MKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTCNPSSLTQQWLFEHTNSTVLEKF
550 560 570 580 590 600
pF1KE0 NRN
:::
NP_938 NRN
>>NP_001030017 (OMIM: 615138) polypeptide N-acetylgalact (601 aa)
initn: 3190 init1: 3033 opt: 3146 Z-score: 3791.0 bits: 711.5 E(85289): 2e-204
Smith-Waterman score: 3146; 71.4% identity (89.4% similar) in 605 aa overlap (1-603:1-598)
10 20 30 40 50
pF1KE0 MRRKEKRLLQAVALVLAALVLLPNVGLWALYRERQ--PDGTPGGSGAAVAPAAGQGSHSR
:.::.::.:: . : .::..:::::::.::.... .. :: . . : : :. .
NP_001 MKRKQKRFLQMTLLFTVALIFLPNVGLWSLYKDKHLVKSAEPGEQ--QTFPL-GLGDGQF
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 QKKTFFLGDGQKLKDWHDKEAIRRDAQRVGNGEQGRPYPMTDAERVDQAYRENGFNIYVS
. : :: . ::::: :.:...:.: :.::.:.:::.:. .. :.:::::::::.::
NP_001 YSWT----DGLRRKDWHDYESIQKEAMRSGKGEHGKPYPLTEEDHDDSAYRENGFNIFVS
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE0 DKISLNRSLPDIRHPNCNSKRYLETLPNTSIIIPFHNEGWSSLLRTVHSVLNRSPPELVA
..:.:.:::::::: ::. : ::: :::::::::::::::.:::::.::..::.: :.:
NP_001 NNIALERSLPDIRHANCKHKMYLERLPNTSIIIPFHNEGWTSLLRTIHSIINRTPGSLIA
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE0 EIVLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLIRTRMLGASVATGDVITFLDS
::.::::::.::::: ::.::: : .:::.::::::::::::.::::.: :.:.:::::
NP_001 EIILVDDFSEREHLKDKLEEYMARFSKVRIVRTKKREGLIRTRLLGASMARGEVLTFLDS
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE0 HCEANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYETQAGDAMRGAFDWEMYYKRIP
:::.:::::::::..:: :.:::::::::::::. : ::.::::::::::::::::::::
NP_001 HCEVNVNWLPPLLNQIALNHKTIVCPMIDVIDHNHFGYEAQAGDAMRGAFDWEMYYKRIP
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE0 IPPELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWMCGG
::::::.:::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 IPPELQRADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWMCGG
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE0 RMEDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWMDEYAEYIYQRRPEYRHLSAG
.: :.::::::::::::::::::.:.:::::::::::.::::.:::::::::::::::.:
NP_001 EMFDVPCSRVGHIYRKYVPYKVPSGTSLARNLKRVAETWMDEFAEYIYQRRPEYRHLSTG
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE0 DVAVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAAAWGEIRNVGTGLCADTKHGA
:...::.::..:.::.:::::. .:::.::.::::::: :::::::::...::.:.::::
NP_001 DISAQKELRKQLKCKDFKWFMAAVAWDVPKYYPPVEPPPAAWGEIRNVAANLCVDSKHGA
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE0 LGSPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQHTKKFCFDAISHTSPVTLYDC
:. :::. ::. .: .:.. :.::: ::::::::.: ::.:::::::::.::::::::
NP_001 TGTELRLDICVKDGSERTWSHEQLFTFGWREDIRPGEPLHTRKFCFDAISHNSPVTLYDC
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE0 HSMKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTCNPSSLTQQWLFEHTNSTVLE
:.::::::: ::::.::.::::.:::::. ....::: :.: : ::::.::: : ::::
NP_001 HGMKGNQLWGYRKDRTLFHPVSNSCMDCNPAEKKIFMARCDPLSETQQWIFEHINMTVLE
540 550 560 570 580 590
600
pF1KE0 KFNRN
:::..
NP_001 KFNHHANS
600
>>XP_016863733 (OMIM: 615138) PREDICTED: polypeptide N-a (609 aa)
initn: 3033 init1: 3033 opt: 3033 Z-score: 3654.6 bits: 686.3 E(85289): 8e-197
Smith-Waterman score: 3046; 72.6% identity (89.0% similar) in 574 aa overlap (42-603:33-606)
20 30 40 50 60
pF1KE0 VALVLAALVLLPNVGLWALYRERQPDGTPGGSGAAVAPA--AGQGSHSRQKKTFFLG---
:.: :. : .: : .:: ::
XP_016 TFTSFIVTTSSRWAVYPNPFTSQMRAKFRAGAGHQRNPSISADHGVHELVYQTFPLGLGD
10 20 30 40 50 60
70 80 90 100 110
pF1KE0 -------DGQKLKDWHDKEAIRRDAQRVGNGEQGRPYPMTDAERVDQAYRENGFNIYVSD
:: . ::::: :.:...:.: :.::.:.:::.:. .. :.:::::::::.::.
XP_016 GQFYSWTDGLRRKDWHDYESIQKEAMRSGKGEHGKPYPLTEEDHDDSAYRENGFNIFVSN
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE0 KISLNRSLPDIRHPNCNSKRYLETLPNTSIIIPFHNEGWSSLLRTVHSVLNRSPPELVAE
.:.:.:::::::: ::. : ::: :::::::::::::::.:::::.::..::.: :.::
XP_016 NIALERSLPDIRHANCKHKMYLERLPNTSIIIPFHNEGWTSLLRTIHSIINRTPGSLIAE
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE0 IVLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLIRTRMLGASVATGDVITFLDSH
:.::::::.::::: ::.::: : .:::.::::::::::::.::::.: :.:.::::::
XP_016 IILVDDFSEREHLKDKLEEYMARFSKVRIVRTKKREGLIRTRLLGASMARGEVLTFLDSH
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE0 CEANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYETQAGDAMRGAFDWEMYYKRIPI
::.:::::::::..:: :.:::::::::::::. : ::.:::::::::::::::::::::
XP_016 CEVNVNWLPPLLNQIALNHKTIVCPMIDVIDHNHFGYEAQAGDAMRGAFDWEMYYKRIPI
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE0 PPELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWMCGGR
:::::.:::::::::::::::::::::::::::::::::::::::::::::::::::::.
XP_016 PPELQRADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWMCGGE
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE0 MEDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWMDEYAEYIYQRRPEYRHLSAGD
: :.::::::::::::::::::.:.:::::::::::.::::.:::::::::::::::.::
XP_016 MFDVPCSRVGHIYRKYVPYKVPSGTSLARNLKRVAETWMDEFAEYIYQRRPEYRHLSTGD
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE0 VAVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAAAWGEIRNVGTGLCADTKHGAL
...::.::..:.::.:::::. .:::.::.::::::: :::::::::...::.:.::::
XP_016 ISAQKELRKQLKCKDFKWFMAAVAWDVPKYYPPVEPPPAAWGEIRNVAANLCVDSKHGAT
430 440 450 460 470 480
480 490 500 510 520 530
pF1KE0 GSPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQHTKKFCFDAISHTSPVTLYDCH
:. :::. ::. .: .:.. :.::: ::::::::.: ::.:::::::::.:::::::::
XP_016 GTELRLDICVKDGSERTWSHEQLFTFGWREDIRPGEPLHTRKFCFDAISHNSPVTLYDCH
490 500 510 520 530 540
540 550 560 570 580 590
pF1KE0 SMKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTCNPSSLTQQWLFEHTNSTVLEK
.::::::: ::::.::.::::.:::::. ....::: :.: : ::::.::: : :::::
XP_016 GMKGNQLWGYRKDRTLFHPVSNSCMDCNPAEKKIFMARCDPLSETQQWIFEHINMTVLEK
550 560 570 580 590 600
600
pF1KE0 FNRN
::..
XP_016 FNHHANS
>>XP_011530295 (OMIM: 615138) PREDICTED: polypeptide N-a (522 aa)
initn: 2962 init1: 2938 opt: 2951 Z-score: 3556.6 bits: 667.9 E(85289): 2.3e-191
Smith-Waterman score: 2951; 76.6% identity (92.9% similar) in 518 aa overlap (86-603:2-519)
60 70 80 90 100 110
pF1KE0 HSRQKKTFFLGDGQKLKDWHDKEAIRRDAQRVGNGEQGRPYPMTDAERVDQAYRENGFNI
: :.::.:.:::.:. .. :.:::::::::
XP_011 MRSGKGEHGKPYPLTEEDHDDSAYRENGFNI
10 20 30
120 130 140 150 160 170
pF1KE0 YVSDKISLNRSLPDIRHPNCNSKRYLETLPNTSIIIPFHNEGWSSLLRTVHSVLNRSPPE
.::..:.:.:::::::: ::. : ::: :::::::::::::::.:::::.::..::.:
XP_011 FVSNNIALERSLPDIRHANCKHKMYLERLPNTSIIIPFHNEGWTSLLRTIHSIINRTPGS
40 50 60 70 80 90
180 190 200 210 220 230
pF1KE0 LVAEIVLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLIRTRMLGASVATGDVITF
:.:::.::::::.::::: ::.::: : .:::.::::::::::::.::::.: :.:.::
XP_011 LIAEIILVDDFSEREHLKDKLEEYMARFSKVRIVRTKKREGLIRTRLLGASMARGEVLTF
100 110 120 130 140 150
240 250 260 270 280 290
pF1KE0 LDSHCEANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYETQAGDAMRGAFDWEMYYK
::::::.:::::::::..:: :.:::::::::::::. : ::.:::::::::::::::::
XP_011 LDSHCEVNVNWLPPLLNQIALNHKTIVCPMIDVIDHNHFGYEAQAGDAMRGAFDWEMYYK
160 170 180 190 200 210
300 310 320 330 340 350
pF1KE0 RIPIPPELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWM
:::::::::.::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 RIPIPPELQRADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWM
220 230 240 250 260 270
360 370 380 390 400 410
pF1KE0 CGGRMEDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWMDEYAEYIYQRRPEYRHL
:::.: :.::::::::::::::::::.:.:::::::::::.::::.::::::::::::::
XP_011 CGGEMFDVPCSRVGHIYRKYVPYKVPSGTSLARNLKRVAETWMDEFAEYIYQRRPEYRHL
280 290 300 310 320 330
420 430 440 450 460 470
pF1KE0 SAGDVAVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAAAWGEIRNVGTGLCADTK
:.::...::.::..:.::.:::::. .:::.::.::::::: :::::::::...::.:.:
XP_011 STGDISAQKELRKQLKCKDFKWFMAAVAWDVPKYYPPVEPPPAAWGEIRNVAANLCVDSK
340 350 360 370 380 390
480 490 500 510 520 530
pF1KE0 HGALGSPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQHTKKFCFDAISHTSPVTL
::: :. :::. ::. .: .:.. :.::: ::::::::.: ::.:::::::::.:::::
XP_011 HGATGTELRLDICVKDGSERTWSHEQLFTFGWREDIRPGEPLHTRKFCFDAISHNSPVTL
400 410 420 430 440 450
540 550 560 570 580 590
pF1KE0 YDCHSMKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTCNPSSLTQQWLFEHTNST
::::.::::::: ::::.::.::::.:::::. ....::: :.: : ::::.::: : :
XP_011 YDCHGMKGNQLWGYRKDRTLFHPVSNSCMDCNPAEKKIFMARCDPLSETQQWIFEHINMT
460 470 480 490 500 510
600
pF1KE0 VLEKFNRN
::::::..
XP_011 VLEKFNHHANS
520
>>XP_011530296 (OMIM: 615138) PREDICTED: polypeptide N-a (451 aa)
initn: 2443 init1: 2419 opt: 2420 Z-score: 2916.8 bits: 549.3 E(85289): 9.9e-156
Smith-Waterman score: 2420; 78.1% identity (93.3% similar) in 415 aa overlap (189-603:34-448)
160 170 180 190 200 210
pF1KE0 SSLLRTVHSVLNRSPPELVAEIVLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLI
.:::: ::.::: : .:::.:::::::::
XP_011 GGRASSECKGLLLRLSTKRRNKAENGIRCLQEHLKDKLEEYMARFSKVRIVRTKKREGLI
10 20 30 40 50 60
220 230 240 250 260 270
pF1KE0 RTRMLGASVATGDVITFLDSHCEANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYET
:::.::::.: :.:.::::::::.:::::::::..:: :.:::::::::::::. : ::.
XP_011 RTRLLGASMARGEVLTFLDSHCEVNVNWLPPLLNQIALNHKTIVCPMIDVIDHNHFGYEA
70 80 90 100 110 120
280 290 300 310 320 330
pF1KE0 QAGDAMRGAFDWEMYYKRIPIPPELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPG
::::::::::::::::::::::::::.:::::::::::::::::::::::::::::::::
XP_011 QAGDAMRGAFDWEMYYKRIPIPPELQRADPSDPFESPVMAGGLFAVDRKWFWELGGYDPG
130 140 150 160 170 180
340 350 360 370 380 390
pF1KE0 LEIWGGEQYEISFKVWMCGGRMEDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWM
::::::::::::::::::::.: :.::::::::::::::::::.:.:::::::::::.::
XP_011 LEIWGGEQYEISFKVWMCGGEMFDVPCSRVGHIYRKYVPYKVPSGTSLARNLKRVAETWM
190 200 210 220 230 240
400 410 420 430 440 450
pF1KE0 DEYAEYIYQRRPEYRHLSAGDVAVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAA
::.:::::::::::::::.::...::.::..:.::.:::::. .:::.::.::::::: :
XP_011 DEFAEYIYQRRPEYRHLSTGDISAQKELRKQLKCKDFKWFMAAVAWDVPKYYPPVEPPPA
250 260 270 280 290 300
460 470 480 490 500 510
pF1KE0 AWGEIRNVGTGLCADTKHGALGSPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQH
::::::::...::.:.:::: :. :::. ::. .: .:.. :.::: ::::::::.: :
XP_011 AWGEIRNVAANLCVDSKHGATGTELRLDICVKDGSERTWSHEQLFTFGWREDIRPGEPLH
310 320 330 340 350 360
520 530 540 550 560 570
pF1KE0 TKKFCFDAISHTSPVTLYDCHSMKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTC
:.:::::::::.:::::::::.::::::: ::::.::.::::.:::::. ....::: :
XP_011 TRKFCFDAISHNSPVTLYDCHGMKGNQLWGYRKDRTLFHPVSNSCMDCNPAEKKIFMARC
370 380 390 400 410 420
580 590 600
pF1KE0 NPSSLTQQWLFEHTNSTVLEKFNRN
.: : ::::.::: : :::::::..
XP_011 DPLSETQQWIFEHINMTVLEKFNHHANS
430 440 450
>>XP_011530297 (OMIM: 615138) PREDICTED: polypeptide N-a (451 aa)
initn: 2443 init1: 2419 opt: 2420 Z-score: 2916.8 bits: 549.3 E(85289): 9.9e-156
Smith-Waterman score: 2420; 78.1% identity (93.3% similar) in 415 aa overlap (189-603:34-448)
160 170 180 190 200 210
pF1KE0 SSLLRTVHSVLNRSPPELVAEIVLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLI
.:::: ::.::: : .:::.:::::::::
XP_011 GGRASSECKGLLLRLSTKRRNKAENGIRCLQEHLKDKLEEYMARFSKVRIVRTKKREGLI
10 20 30 40 50 60
220 230 240 250 260 270
pF1KE0 RTRMLGASVATGDVITFLDSHCEANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYET
:::.::::.: :.:.::::::::.:::::::::..:: :.:::::::::::::. : ::.
XP_011 RTRLLGASMARGEVLTFLDSHCEVNVNWLPPLLNQIALNHKTIVCPMIDVIDHNHFGYEA
70 80 90 100 110 120
280 290 300 310 320 330
pF1KE0 QAGDAMRGAFDWEMYYKRIPIPPELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPG
::::::::::::::::::::::::::.:::::::::::::::::::::::::::::::::
XP_011 QAGDAMRGAFDWEMYYKRIPIPPELQRADPSDPFESPVMAGGLFAVDRKWFWELGGYDPG
130 140 150 160 170 180
340 350 360 370 380 390
pF1KE0 LEIWGGEQYEISFKVWMCGGRMEDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWM
::::::::::::::::::::.: :.::::::::::::::::::.:.:::::::::::.::
XP_011 LEIWGGEQYEISFKVWMCGGEMFDVPCSRVGHIYRKYVPYKVPSGTSLARNLKRVAETWM
190 200 210 220 230 240
400 410 420 430 440 450
pF1KE0 DEYAEYIYQRRPEYRHLSAGDVAVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAA
::.:::::::::::::::.::...::.::..:.::.:::::. .:::.::.::::::: :
XP_011 DEFAEYIYQRRPEYRHLSTGDISAQKELRKQLKCKDFKWFMAAVAWDVPKYYPPVEPPPA
250 260 270 280 290 300
460 470 480 490 500 510
pF1KE0 AWGEIRNVGTGLCADTKHGALGSPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQH
::::::::...::.:.:::: :. :::. ::. .: .:.. :.::: ::::::::.: :
XP_011 AWGEIRNVAANLCVDSKHGATGTELRLDICVKDGSERTWSHEQLFTFGWREDIRPGEPLH
310 320 330 340 350 360
520 530 540 550 560 570
pF1KE0 TKKFCFDAISHTSPVTLYDCHSMKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTC
:.:::::::::.:::::::::.::::::: ::::.::.::::.:::::. ....::: :
XP_011 TRKFCFDAISHNSPVTLYDCHGMKGNQLWGYRKDRTLFHPVSNSCMDCNPAEKKIFMARC
370 380 390 400 410 420
580 590 600
pF1KE0 NPSSLTQQWLFEHTNSTVLEKFNRN
.: : ::::.::: : :::::::..
XP_011 DPLSETQQWIFEHINMTVLEKFNHHANS
430 440 450
>>XP_011530298 (OMIM: 615138) PREDICTED: polypeptide N-a (451 aa)
initn: 2443 init1: 2419 opt: 2420 Z-score: 2916.8 bits: 549.3 E(85289): 9.9e-156
Smith-Waterman score: 2420; 78.1% identity (93.3% similar) in 415 aa overlap (189-603:34-448)
160 170 180 190 200 210
pF1KE0 SSLLRTVHSVLNRSPPELVAEIVLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLI
.:::: ::.::: : .:::.:::::::::
XP_011 GGRASSECKGLLLRLSTKRRNKAENGIRCLQEHLKDKLEEYMARFSKVRIVRTKKREGLI
10 20 30 40 50 60
220 230 240 250 260 270
pF1KE0 RTRMLGASVATGDVITFLDSHCEANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYET
:::.::::.: :.:.::::::::.:::::::::..:: :.:::::::::::::. : ::.
XP_011 RTRLLGASMARGEVLTFLDSHCEVNVNWLPPLLNQIALNHKTIVCPMIDVIDHNHFGYEA
70 80 90 100 110 120
280 290 300 310 320 330
pF1KE0 QAGDAMRGAFDWEMYYKRIPIPPELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPG
::::::::::::::::::::::::::.:::::::::::::::::::::::::::::::::
XP_011 QAGDAMRGAFDWEMYYKRIPIPPELQRADPSDPFESPVMAGGLFAVDRKWFWELGGYDPG
130 140 150 160 170 180
340 350 360 370 380 390
pF1KE0 LEIWGGEQYEISFKVWMCGGRMEDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWM
::::::::::::::::::::.: :.::::::::::::::::::.:.:::::::::::.::
XP_011 LEIWGGEQYEISFKVWMCGGEMFDVPCSRVGHIYRKYVPYKVPSGTSLARNLKRVAETWM
190 200 210 220 230 240
400 410 420 430 440 450
pF1KE0 DEYAEYIYQRRPEYRHLSAGDVAVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAA
::.:::::::::::::::.::...::.::..:.::.:::::. .:::.::.::::::: :
XP_011 DEFAEYIYQRRPEYRHLSTGDISAQKELRKQLKCKDFKWFMAAVAWDVPKYYPPVEPPPA
250 260 270 280 290 300
460 470 480 490 500 510
pF1KE0 AWGEIRNVGTGLCADTKHGALGSPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQH
::::::::...::.:.:::: :. :::. ::. .: .:.. :.::: ::::::::.: :
XP_011 AWGEIRNVAANLCVDSKHGATGTELRLDICVKDGSERTWSHEQLFTFGWREDIRPGEPLH
310 320 330 340 350 360
520 530 540 550 560 570
pF1KE0 TKKFCFDAISHTSPVTLYDCHSMKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTC
:.:::::::::.:::::::::.::::::: ::::.::.::::.:::::. ....::: :
XP_011 TRKFCFDAISHNSPVTLYDCHGMKGNQLWGYRKDRTLFHPVSNSCMDCNPAEKKIFMARC
370 380 390 400 410 420
580 590 600
pF1KE0 NPSSLTQQWLFEHTNSTVLEKFNRN
.: : ::::.::: : :::::::..
XP_011 DPLSETQQWIFEHINMTVLEKFNHHANS
430 440 450
>>XP_011530299 (OMIM: 615138) PREDICTED: polypeptide N-a (418 aa)
initn: 2443 init1: 2419 opt: 2419 Z-score: 2916.1 bits: 549.1 E(85289): 1.1e-155
Smith-Waterman score: 2419; 78.3% identity (93.2% similar) in 414 aa overlap (190-603:2-415)
160 170 180 190 200 210
pF1KE0 SLLRTVHSVLNRSPPELVAEIVLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLIR
:::: ::.::: : .:::.::::::::::
XP_011 MEHLKDKLEEYMARFSKVRIVRTKKREGLIR
10 20 30
220 230 240 250 260 270
pF1KE0 TRMLGASVATGDVITFLDSHCEANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYETQ
::.::::.: :.:.::::::::.:::::::::..:: :.:::::::::::::. : ::.:
XP_011 TRLLGASMARGEVLTFLDSHCEVNVNWLPPLLNQIALNHKTIVCPMIDVIDHNHFGYEAQ
40 50 60 70 80 90
280 290 300 310 320 330
pF1KE0 AGDAMRGAFDWEMYYKRIPIPPELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGL
:::::::::::::::::::::::::.::::::::::::::::::::::::::::::::::
XP_011 AGDAMRGAFDWEMYYKRIPIPPELQRADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGL
100 110 120 130 140 150
340 350 360 370 380 390
pF1KE0 EIWGGEQYEISFKVWMCGGRMEDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWMD
:::::::::::::::::::.: :.::::::::::::::::::.:.:::::::::::.:::
XP_011 EIWGGEQYEISFKVWMCGGEMFDVPCSRVGHIYRKYVPYKVPSGTSLARNLKRVAETWMD
160 170 180 190 200 210
400 410 420 430 440 450
pF1KE0 EYAEYIYQRRPEYRHLSAGDVAVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAAA
:.:::::::::::::::.::...::.::..:.::.:::::. .:::.::.::::::: ::
XP_011 EFAEYIYQRRPEYRHLSTGDISAQKELRKQLKCKDFKWFMAAVAWDVPKYYPPVEPPPAA
220 230 240 250 260 270
460 470 480 490 500 510
pF1KE0 WGEIRNVGTGLCADTKHGALGSPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQHT
:::::::...::.:.:::: :. :::. ::. .: .:.. :.::: ::::::::.: ::
XP_011 WGEIRNVAANLCVDSKHGATGTELRLDICVKDGSERTWSHEQLFTFGWREDIRPGEPLHT
280 290 300 310 320 330
520 530 540 550 560 570
pF1KE0 KKFCFDAISHTSPVTLYDCHSMKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTCN
.:::::::::.:::::::::.::::::: ::::.::.::::.:::::. ....::: :.
XP_011 RKFCFDAISHNSPVTLYDCHGMKGNQLWGYRKDRTLFHPVSNSCMDCNPAEKKIFMARCD
340 350 360 370 380 390
580 590 600
pF1KE0 PSSLTQQWLFEHTNSTVLEKFNRN
: : ::::.::: : :::::::..
XP_011 PLSETQQWIFEHINMTVLEKFNHHANS
400 410
>>XP_016863732 (OMIM: 615138) PREDICTED: polypeptide N-a (387 aa)
initn: 1990 init1: 1860 opt: 1973 Z-score: 2378.5 bits: 449.5 E(85289): 9.6e-126
Smith-Waterman score: 1973; 71.3% identity (88.3% similar) in 394 aa overlap (1-392:1-387)
10 20 30 40 50
pF1KE0 MRRKEKRLLQAVALVLAALVLLPNVGLWALYRERQ--PDGTPGGSGAAVAPAAGQGSHSR
:.::.::.:: . : .::..:::::::.::.... .. :: . . : : :. .
XP_016 MKRKQKRFLQMTLLFTVALIFLPNVGLWSLYKDKHLVKSAEPGEQ--QTFPL-GLGDGQF
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 QKKTFFLGDGQKLKDWHDKEAIRRDAQRVGNGEQGRPYPMTDAERVDQAYRENGFNIYVS
. : :: . ::::: :.:...:.: :.::.:.:::.:. .. :.:::::::::.::
XP_016 YSWT----DGLRRKDWHDYESIQKEAMRSGKGEHGKPYPLTEEDHDDSAYRENGFNIFVS
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE0 DKISLNRSLPDIRHPNCNSKRYLETLPNTSIIIPFHNEGWSSLLRTVHSVLNRSPPELVA
..:.:.:::::::: ::. : ::: :::::::::::::::.:::::.::..::.: :.:
XP_016 NNIALERSLPDIRHANCKHKMYLERLPNTSIIIPFHNEGWTSLLRTIHSIINRTPGSLIA
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE0 EIVLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLIRTRMLGASVATGDVITFLDS
::.::::::.::::: ::.::: : .:::.::::::::::::.::::.: :.:.:::::
XP_016 EIILVDDFSEREHLKDKLEEYMARFSKVRIVRTKKREGLIRTRLLGASMARGEVLTFLDS
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE0 HCEANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYETQAGDAMRGAFDWEMYYKRIP
:::.:::::::::..:: :.:::::::::::::. : ::.::::::::::::::::::::
XP_016 HCEVNVNWLPPLLNQIALNHKTIVCPMIDVIDHNHFGYEAQAGDAMRGAFDWEMYYKRIP
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE0 IPPELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWMCGG
::::::.:::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 IPPELQRADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWMCGG
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE0 RMEDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWMDEYAEYIYQRRPEYRHLSAG
.: :.::::::::::::::::::.:.::::. .:
XP_016 EMFDVPCSRVGHIYRKYVPYKVPSGTSLARKRNR
360 370 380
420 430 440 450 460 470
pF1KE0 DVAVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAAAWGEIRNVGTGLCADTKHGA
>>NP_003765 (OMIM: 603565) polypeptide N-acetylgalactosa (578 aa)
initn: 1261 init1: 619 opt: 1367 Z-score: 1645.0 bits: 314.4 E(85289): 6.9e-85
Smith-Waterman score: 1393; 40.1% identity (68.1% similar) in 561 aa overlap (50-590:35-577)
20 30 40 50 60 70
pF1KE0 VLLPNVGLWALYRERQPDGTPGGSGAAVAPAAGQGSHSRQKKTFFLGDGQKLKDWHDKEA
.:: : ..:. . :.: :: . ..
NP_003 WTWAGKSCLLLAFLTVAYIFVELLVSTFHASAGAG-RARELGSRRLSDLQKNTEDLSRPL
10 20 30 40 50 60
80 90 100 110 120 130
pF1KE0 IRRD-AQRVGNGEQGRPYPMTDAE----RVDQAYRENGFNIYVSDKISLNRSLPDIRHPN
.. :. . :: :. . : . .. .. ..:::.::.:::.: . : : .
NP_003 YKKPPADSRALGEWGKASKLQLNEDELKQQEELIERYAINIYLSDRISLHRHIEDKRMYE
70 80 90 100 110 120
140 150 160 170 180 190
pF1KE0 CNSKRY-LETLPNTSIIIPFHNEGWSSLLRTVHSVLNRSPPELVAEIVLVDDFSDREHLK
:.:... .:::.::.:: :.::.::.::::.::::. :: :. ::.::::.::: .::
NP_003 CKSQKFNYRTLPTTSVIIAFYNEAWSTLLRTIHSVLETSPAVLLKEIILVDDLSDRVYLK
130 140 150 160 170 180
200 210 220 230 240 250
pF1KE0 KPLEDYMALFPSVRILRTKKREGLIRTRMLGASVATGDVITFLDSHCEANVNWLPPLLDR
:: :.. . ::..::.:::::.:.:..::. :::::.:::: ::: : .:: :::.:
NP_003 TQLETYISNLDRVRLIRTNKREGLVRARLIGATFATGDVLTFLDCHCECNSGWLEPLLER
190 200 210 220 230 240
260 270 280 290 300 310
pF1KE0 IARNRKTIVCPMIDVIDHDDFRYETQAGDAMRGAFDWEMYYKRIPIPPELQKADPS--DP
:.:.. ..:::.::.:: . :.. : :. : :.:::.. .. .: . . : ::
NP_003 IGRDETAVVCPVIDTIDWNTFEFYMQIGEPMIGGFDWRLTFQWHSVPKQERDRRISRIDP
250 260 270 280 290 300
320 330 340 350 360 370
pF1KE0 FESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWMCGGRMEDIPCSRVGHI
..::.::::::::..:.: :: :: :.:.::::. :.::.::.:::..: :::.:::.
NP_003 IRSPTMAGGLFAVSKKYFQYLGTYDTGMEVWGGENLELSFRVWQCGGKLEIHPCSHVGHV
310 320 330 340 350 360
380 390 400 410 420 430
pF1KE0 YRKYVPYKVPAGVSLARNLKRVAEVWMDEYAEYIYQRRPEYRHLSAGDVAVQKKLRSSLN
. : .:: : .. .: :.:::::::: :..:.: : :. . ::.. .: :: :
NP_003 FPKRAPYARP---NFLQNTARAAEVWMDEYKEHFYNRNPPARKEAYGDISERKLLRERLR
370 380 390 400 410 420
440 450 460 470 480
pF1KE0 CKSFKWFMTKIAWDLPKFYPPVEPPAAAW-GEIRNVG-TGLCADTK---HGALGSPLRLE
:::: :.. .. .:... : . : .: : ::. : .. : : . .. :. : :
NP_003 CKSFDWYLKNV---FPNLHVPEDRP--GWHGAIRSRGISSECLDYNSPDNNPTGANLSLF
430 440 450 460 470
490 500 510 520 530 540
pF1KE0 GCVRGRGEAAWNNMQVFTFTWREDIRPGDPQHTKKFCFDAISHTSPVTLYDCHS----MK
:: .:.: . : : .: ..:: .. . ..: .. . . : . .: . .
NP_003 GC-HGQG-----GNQFFEYTSNKEIRFNS---VTELCAEVPEQKNYVGMQNCPKDGFPVP
480 490 500 510 520
550 560 570 580 590
pF1KE0 GNQLWKYRKDKTLYHPVSGSCMDC---SESDHRIFMNTCNPSSLTQQWLFEHTNSTVLEK
.: .:....: :..:: :: :.. :. . : ::. . .: : ::
NP_003 ANIIWHFKEDGTIFHPHSGLCLSAYRTPEGRPDVQMRTCDALDKNQIWSFEK
530 540 550 560 570
600
pF1KE0 FNRN
603 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 12:55:47 2016 done: Thu Nov 3 12:55:49 2016
Total Scan time: 10.720 Total Display time: 0.110
Function used was FASTA [36.3.4 Apr, 2011]