FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE1992, 571 aa
1>>>pF1KE1992 571 - 571 aa - 571 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.6516+/-0.000826; mu= 17.2210+/- 0.050
mean_var=76.0933+/-15.108, 0's: 0 Z-trim(107.6): 29 B-trim: 0 in 0/51
Lambda= 0.147028
statistics sampled from 9638 (9664) to 9638 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.654), E-opt: 0.2 (0.297), width: 16
Scan time: 3.430
The best scores are: opt bits E(32554)
CCDS1582.1 GALNT2 gene_id:2590|Hs108|chr1 ( 571) 3957 849.0 0
CCDS32107.1 GALNT16 gene_id:57452|Hs108|chr14 ( 558) 1850 402.0 9.7e-112
CCDS1773.2 GALNT14 gene_id:79623|Hs108|chr2 ( 552) 1830 397.8 1.8e-110
CCDS58705.1 GALNT14 gene_id:79623|Hs108|chr2 ( 532) 1824 396.5 4.3e-110
CCDS58706.1 GALNT14 gene_id:79623|Hs108|chr2 ( 557) 1676 365.1 1.3e-100
CCDS11915.1 GALNT1 gene_id:2589|Hs108|chr18 ( 559) 1554 339.3 7.7e-93
CCDS2199.1 GALNT13 gene_id:114805|Hs108|chr2 ( 556) 1544 337.1 3.4e-92
CCDS77472.1 GALNT13 gene_id:114805|Hs108|chr2 ( 561) 1469 321.2 2.1e-87
CCDS6737.1 GALNT12 gene_id:79695|Hs108|chr9 ( 581) 1340 293.9 3.7e-79
CCDS53817.1 GALNT4 gene_id:8693|Hs108|chr12 ( 578) 1310 287.5 3e-77
CCDS55860.1 GALNT4 gene_id:100528030|Hs108|chr12 ( 575) 1303 286.0 8.4e-77
CCDS5930.1 GALNT11 gene_id:63917|Hs108|chr7 ( 608) 1254 275.6 1.2e-73
CCDS8813.1 GALNT6 gene_id:11226|Hs108|chr12 ( 622) 1204 265.0 1.9e-70
CCDS2203.1 GALNT5 gene_id:11227|Hs108|chr2 ( 940) 1182 260.5 6.8e-69
CCDS4325.1 GALNT10 gene_id:55568|Hs108|chr5 ( 603) 1179 259.7 7.3e-69
CCDS2226.1 GALNT3 gene_id:2591|Hs108|chr2 ( 633) 1168 257.4 3.8e-68
CCDS34104.1 GALNTL6 gene_id:442117|Hs108|chr4 ( 601) 1121 247.4 3.7e-65
CCDS33711.1 GALNT15 gene_id:117248|Hs108|chr3 ( 639) 1089 240.7 4.3e-63
CCDS81755.1 GALNT9 gene_id:50614|Hs108|chr12 ( 603) 1052 232.8 9.3e-61
CCDS5929.1 GALNTL5 gene_id:168391|Hs108|chr7 ( 443) 1037 229.5 6.6e-60
CCDS82742.1 GALNT15 gene_id:117248|Hs108|chr3 ( 617) 1037 229.6 8.6e-60
CCDS5540.1 WBSCR17 gene_id:64409|Hs108|chr7 ( 598) 1018 225.6 1.4e-58
CCDS7807.1 GALNT18 gene_id:374378|Hs108|chr11 ( 607) 1014 224.7 2.5e-58
CCDS3815.1 GALNT7 gene_id:51809|Hs108|chr4 ( 657) 921 205.0 2.3e-52
CCDS8533.1 GALNT8 gene_id:26290|Hs108|chr12 ( 637) 770 173.0 9.9e-43
CCDS41866.1 GALNT9 gene_id:50614|Hs108|chr12 ( 237) 343 82.2 8e-16
>>CCDS1582.1 GALNT2 gene_id:2590|Hs108|chr1 (571 aa)
initn: 3957 init1: 3957 opt: 3957 Z-score: 4534.8 bits: 849.0 E(32554): 0
Smith-Waterman score: 3957; 100.0% identity (100.0% similar) in 571 aa overlap (1-571:1-571)
10 20 30 40 50 60
pF1KE1 MRRRSRMLLCFAFLWVLGIAYYMYSGGGSALAGGAGGGAGRKEDWNEIDPIKKKDLHHSN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS15 MRRRSRMLLCFAFLWVLGIAYYMYSGGGSALAGGAGGGAGRKEDWNEIDPIKKKDLHHSN
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 GEEKAQSMETLPPGKVRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS15 GEEKAQSMETLPPGKVRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPD
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 TRHDQCQRKQWRVDLPATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIILVDDYSND
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS15 TRHDQCQRKQWRVDLPATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIILVDDYSND
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 PEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS15 PEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLER
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE1 VAEDRTRVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS15 VAEDRTRVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVAP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE1 IKTPMIAGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS15 IKTPMIAGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE1 FRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS15 FRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRKK
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE1 LSCKPFKWYLENVYPELRVPDHQDIAFGALQQGTNCLDTLGHFADGVVGVYECHNAGGNQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS15 LSCKPFKWYLENVYPELRVPDHQDIAFGALQQGTNCLDTLGHFADGVVGVYECHNAGGNQ
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE1 EWALTKEKSVKHMDLCLTVVDRAPGSLIKLQGCRENDSRQKWEQIEGNSKLRHVGSNLCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS15 EWALTKEKSVKHMDLCLTVVDRAPGSLIKLQGCRENDSRQKWEQIEGNSKLRHVGSNLCL
490 500 510 520 530 540
550 560 570
pF1KE1 DSRTAKSGGLSVEVCGPALSQQWKFTLNLQQ
:::::::::::::::::::::::::::::::
CCDS15 DSRTAKSGGLSVEVCGPALSQQWKFTLNLQQ
550 560 570
>>CCDS32107.1 GALNT16 gene_id:57452|Hs108|chr14 (558 aa)
initn: 1089 init1: 921 opt: 1850 Z-score: 2119.5 bits: 402.0 E(32554): 9.7e-112
Smith-Waterman score: 1882; 50.2% identity (76.2% similar) in 576 aa overlap (1-565:1-554)
10 20 30 40 50
pF1KE1 MRR-RSRMLLCFAFLWVLGIAYYMYSGGGSALAGGAGGGAGRKEDWNEIDPIKKKDLHHS
::. :. . .. :.:: ::... . . :...: :: : ....:..
CCDS32 MRKIRANAIAILTVAWILGTFYYLWQDNRAHAASSGGRGAQRAGR-------RSEQLRE-
10 20 30 40 50
60 70 80 90 100 110
pF1KE1 NGEEKAQSMETLPPGKVRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIP
.. . : :.: :...::... ....:.::: .. :::.::::: :: :
CCDS32 --DRTIPLIVTGTPSK----GFDEKAYLSAKQLKAGEDPYRQHAFNQLESDKLSPDRPIR
60 70 80 90 100
120 130 140 150 160 170
pF1KE1 DTRHDQCQRKQWRVDLPATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIILVDDYSN
:::: .: .. :::::::.:::::::::.::::: :::...: .::.:::::::.:.
CCDS32 DTRHYSCPSVSYSSDLPATSVIITFHNEARSTLLRTVKSVLNRTPANLIQEIILVDDFSS
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE1 DPEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLE
:::: :: .: ::. :::::::::.::::::::.: : :::::::::: : .:: :.:.
CCDS32 DPEDCLLLTRIPKVKCLRNDRREGLIRSRVRGADVAAATVLTFLDSHCEVNTEWLPPMLQ
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE1 RVAEDRTRVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVA
:: ::.:::::::::::..::: :..:::::.:::::.: :::. . ::. .: .:.
CCDS32 RVKEDHTRVVSPIIDVISLDNFAYLAASADLRGGFDWSLHFKWEQIPLEQKMTRT-DPTR
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE1 PIKTPMIAGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGH
::.::.::::.::.:: .:..::::: .::.:::::.:.:::::.:::::::.:::::::
CCDS32 PIRTPVIAGGIFVIDKSWFNHLGKYDAQMDIWGGENFELSFRVWMCGGSLEIVPCSRVGH
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE1 VFRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRK
::::.:::.:: :.. .. :::.:.:::::::::..:: : ::: . .:.. .:.: ::
CCDS32 VFRKRHPYNFPEGNALTYIRNTKRTAEVWMDEYKQYYYEARPSAIGKAFGSVATRIEQRK
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE1 KLSCKPFKWYLENVYPELRVPDHQDIAFGALQQGTNCLDTLGHFADG--VVGVYECHNAG
:..:: :.:::::::::: :: .. . : ..::.:::.. :. . : ..:. :....
CCDS32 KMNCKSFRWYLENVYPELTVPVKEALP-GIIKQGVNCLESQGQNTAGDFLLGMGICRGSA
410 420 430 440 450 460
480 490 500 510 520 530
pF1KE1 GN----QEWALTKEKSVKHMDLCLTVVDR---APGSLIKLQGCRENDSRQKWEQIEGNSK
: : : : ... .... ::.... .::: . :: : ...:::.. .: :
CCDS32 KNPQPAQAW-LFSDHLIQQQGKCLAATSTLMSSPGSPVILQMCNPREGKQKWRR-KG-SF
470 480 490 500 510 520
540 550 560 570
pF1KE1 LRHVGSNLCLDSRTAKSGGLSVEVC-GPALSQQWKFTLNLQQ
..: :.:::... :. : . : . : .:::..
CCDS32 IQHSVSGLCLETKPAQ---LVTSKCQADAQAQQWQLLPHT
530 540 550
>>CCDS1773.2 GALNT14 gene_id:79623|Hs108|chr2 (552 aa)
initn: 1736 init1: 839 opt: 1830 Z-score: 2096.7 bits: 397.8 E(32554): 1.8e-110
Smith-Waterman score: 1841; 50.5% identity (76.6% similar) in 529 aa overlap (51-563:26-547)
30 40 50 60 70 80
pF1KE1 YYMYSGGGSALAGGAGGGAGRKEDWNEIDPIKKKDLHHSNGEEKAQSMETLPPGKVRWPD
. :. :. .: : ..: :. . : :
CCDS17 MRRLTRRLVLPVFGVLWITVLLFFWVTKRKLEVPTGPE----VQTPKPSDADWDD
10 20 30 40 50
90 100 110 120 130
pF1KE1 ----FNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQWRVDLP
:... :... : :.::: ::: ::... .:::::::: .: . .:::
CCDS17 LWDQFDERRYLNAKKWRVGDDPYKLYAFNQRESERISSNRAIPDTRHLRCTLLVYCTDLP
60 70 80 90 100 110
140 150 160 170 180 190
pF1KE1 ATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIILVDDYSNDPEDGALLGKIEKVRVL
::..:::::::::.::::. :::...: :::.:::::::.::::.: : :. ::. :
CCDS17 PTSIIITFHNEARSTLLRTIRSVLNRTPTHLIREIILVDDFSNDPDDCKQLIKLPKVKCL
120 130 140 150 160 170
200 210 220 230 240 250
pF1KE1 RNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLERVAEDRTRVVSPIIDVI
::..:.::.:::.:::: ::. .::::::::: :. ::.:::.:: :: :::: :.::.:
CCDS17 RNNERQGLVRSRIRGADIAQGTTLTFLDSHCEVNRDWLQPLLHRVKEDYTRVVCPVIDII
180 190 200 210 220 230
260 270 280 290 300 310
pF1KE1 NMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVAPIKTPMIAGGLFVMDKF
:.:.: :. ....:.:::::.: :.:. ..:::. .:. .:. ::.::.:::::::.::
CCDS17 NLDTFTYIESASELRGGFDWSLHFQWEQLSPEQK-ARRLDPTEPIRTPIIAGGLFVIDKA
240 250 260 270 280 290
320 330 340 350 360 370
pF1KE1 YFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHVFRKQHPYTFPGGSGTV
.:. :::::: ::.:::::.:::::::.:::::::.:::::::::::.:::.:: :....
CCDS17 WFDYLGKYDMDMDIWGGENFEISFRVWMCGGSLEIVPCSRVGHVFRKKHPYVFPDGNANT
300 310 320 330 340 350
380 390 400 410 420 430
pF1KE1 FARNTRRAAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRKKLSCKPFKWYLENVYPE
. .::.:.:::::::::..:::: : : . :.::..:::.:::.: :. :::::::.:::
CCDS17 YIKNTKRTAEVWMDEYKQYYYAARPFALERPFGNVESRLDLRKNLRCQSFKWYLENIYPE
360 370 380 390 400 410
440 450 460 470 480 490
pF1KE1 LRVPDHQDIAFGALQQGTNCLDTLGHFADGV--VGVYECHNAGG----NQEWALTKEKSV
: .: ...: : ..: .::.. . . . . . : .. : .: ::.: ...
CCDS17 LSIPKESSIQKGNIRQRQKCLESQRQNNQETPNLKLSPCAKVKGEDAKSQVWAFTYTQQI
420 430 440 450 460 470
500 510 520 530 540
pF1KE1 KHMDLCLTVVDRAPGSLIKLQGCRENDSRQKWEQIEGNSKLRHVGSNLCLDSRTAKSG--
. .:::.:. ::. . : :...:.::.: . .:...:..:.::::. .:
CCDS17 LQEELCLSVITLFPGAPVVLVLCKNGDDRQQWTKT--GSHIEHIASHLCLDTDMFGDGTE
480 490 500 510 520
550 560 570
pF1KE1 -GLSVEV--CGPAL-SQQWKFTLNLQQ
: . : : .: ::.:
CCDS17 NGKEIVVNPCESSLMSQHWDMVSS
530 540 550
>>CCDS58705.1 GALNT14 gene_id:79623|Hs108|chr2 (532 aa)
initn: 1736 init1: 839 opt: 1824 Z-score: 2090.1 bits: 396.5 E(32554): 4.3e-110
Smith-Waterman score: 1835; 52.2% identity (78.5% similar) in 498 aa overlap (78-563:33-527)
50 60 70 80 90 100
pF1KE1 IDPIKKKDLHHSNGEEKAQSMETLPPGKVRWPDFNQEAYVGGTMVRSGQDPYARNKFNQV
: .:... :... : :.::: :::
CCDS58 FPMSLARSSVPFADSGLSSSQPSDADWDDLWDQFDERRYLNAKKWRVGDDPYKLYAFNQR
10 20 30 40 50 60
110 120 130 140 150 160
pF1KE1 ESDKLRMDRAIPDTRHDQCQRKQWRVDLPATSVVITFHNEARSALLRTVVSVLKKSPPHL
::... .:::::::: .: . .::: ::..:::::::::.::::. :::...: ::
CCDS58 ESERISSNRAIPDTRHLRCTLLVYCTDLPPTSIIITFHNEARSTLLRTIRSVLNRTPTHL
70 80 90 100 110 120
170 180 190 200 210 220
pF1KE1 IKEIILVDDYSNDPEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHC
:.:::::::.::::.: : :. ::. :::..:.::.:::.:::: ::. .::::::::
CCDS58 IREIILVDDFSNDPDDCKQLIKLPKVKCLRNNERQGLVRSRIRGADIAQGTTLTFLDSHC
130 140 150 160 170 180
230 240 250 260 270 280
pF1KE1 ECNEHWLEPLLERVAEDRTRVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTP
: :. ::.:::.:: :: :::: :.::.::.:.: :. ....:.:::::.: :.:. ..:
CCDS58 EVNRDWLQPLLHRVKEDYTRVVCPVIDIINLDTFTYIESASELRGGFDWSLHFQWEQLSP
190 200 210 220 230 240
290 300 310 320 330 340
pF1KE1 EQRRSRQGNPVAPIKTPMIAGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGG
::. .:. .:. ::.::.:::::::.:: .:. :::::: ::.:::::.:::::::.:::
CCDS58 EQK-ARRLDPTEPIRTPIIAGGLFVIDKAWFDYLGKYDMDMDIWGGENFEISFRVWMCGG
250 260 270 280 290 300
350 360 370 380 390 400
pF1KE1 SLEIIPCSRVGHVFRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVP
::::.:::::::::::.:::.:: :..... .::.:.:::::::::..:::: : : . :
CCDS58 SLEIVPCSRVGHVFRKKHPYVFPDGNANTYIKNTKRTAEVWMDEYKQYYYAARPFALERP
310 320 330 340 350 360
410 420 430 440 450 460
pF1KE1 YGNIQSRLELRKKLSCKPFKWYLENVYPELRVPDHQDIAFGALQQGTNCLDTLGHFADGV
.::..:::.:::.: :. :::::::.:::: .: ...: : ..: .::.. . . .
CCDS58 FGNVESRLDLRKNLRCQSFKWYLENIYPELSIPKESSIQKGNIRQRQKCLESQRQNNQET
370 380 390 400 410 420
470 480 490 500 510 520
pF1KE1 --VGVYECHNAGG----NQEWALTKEKSVKHMDLCLTVVDRAPGSLIKLQGCRENDSRQK
. . : .. : .: ::.: ... . .:::.:. ::. . : :...:.::.
CCDS58 PNLKLSPCAKVKGEDAKSQVWAFTYTQQILQEELCLSVITLFPGAPVVLVLCKNGDDRQQ
430 440 450 460 470 480
530 540 550 560 570
pF1KE1 WEQIEGNSKLRHVGSNLCLDSRTAKSG---GLSVEV--CGPAL-SQQWKFTLNLQQ
: . .:...:..:.::::. .: : . : : .: ::.:
CCDS58 WTKT--GSHIEHIASHLCLDTDMFGDGTENGKEIVVNPCESSLMSQHWDMVSS
490 500 510 520 530
>>CCDS58706.1 GALNT14 gene_id:79623|Hs108|chr2 (557 aa)
initn: 1626 init1: 801 opt: 1676 Z-score: 1920.1 bits: 365.1 E(32554): 1.3e-100
Smith-Waterman score: 1687; 52.8% identity (79.4% similar) in 451 aa overlap (125-563:105-552)
100 110 120 130 140 150
pF1KE1 GQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQWRVDLPATSVVITFHNEARSALLR
.: . .::: ::..:::::::::.:::
CCDS58 PTGGHLAVCHFPCLLQEAQFHLQTQVFLQVRCTLLVYCTDLPPTSIIITFHNEARSTLLR
80 90 100 110 120 130
160 170 180 190 200 210
pF1KE1 TVVSVLKKSPPHLIKEIILVDDYSNDPEDGALLGKIEKVRVLRNDRREGLMRSRVRGADA
:. :::...: :::.:::::::.::::.: : :. ::. :::..:.::.:::.::::
CCDS58 TIRSVLNRTPTHLIREIILVDDFSNDPDDCKQLIKLPKVKCLRNNERQGLVRSRIRGADI
140 150 160 170 180 190
220 230 240 250 260 270
pF1KE1 AQAKVLTFLDSHCECNEHWLEPLLERVAEDRTRVVSPIIDVINMDNFQYVGASADLKGGF
::. .::::::::: :. ::.:::.:: :: :::: :.::.::.:.: :. ....:.:::
CCDS58 AQGTTLTFLDSHCEVNRDWLQPLLHRVKEDYTRVVCPVIDIINLDTFTYIESASELRGGF
200 210 220 230 240 250
280 290 300 310 320 330
pF1KE1 DWNLVFKWDYMTPEQRRSRQGNPVAPIKTPMIAGGLFVMDKFYFEELGKYDMMMDVWGGE
::.: :.:. ..:::. .:. .:. ::.::.:::::::.:: .:. :::::: ::.::::
CCDS58 DWSLHFQWEQLSPEQK-ARRLDPTEPIRTPIIAGGLFVIDKAWFDYLGKYDMDMDIWGGE
260 270 280 290 300 310
340 350 360 370 380 390
pF1KE1 NLEISFRVWQCGGSLEIIPCSRVGHVFRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKN
:.:::::::.:::::::.:::::::::::.:::.:: :..... .::.:.:::::::::.
CCDS58 NFEISFRVWMCGGSLEIVPCSRVGHVFRKKHPYVFPDGNANTYIKNTKRTAEVWMDEYKQ
320 330 340 350 360 370
400 410 420 430 440 450
pF1KE1 FYYAAVPSARNVPYGNIQSRLELRKKLSCKPFKWYLENVYPELRVPDHQDIAFGALQQGT
.:::: : : . :.::..:::.:::.: :. :::::::.:::: .: ...: : ..:
CCDS58 YYYAARPFALERPFGNVESRLDLRKNLRCQSFKWYLENIYPELSIPKESSIQKGNIRQRQ
380 390 400 410 420 430
460 470 480 490 500
pF1KE1 NCLDTLGHFADGV--VGVYECHNAGG----NQEWALTKEKSVKHMDLCLTVVDRAPGSLI
.::.. . . . . . : .. : .: ::.: ... . .:::.:. ::. .
CCDS58 KCLESQRQNNQETPNLKLSPCAKVKGEDAKSQVWAFTYTQQILQEELCLSVITLFPGAPV
440 450 460 470 480 490
510 520 530 540 550 560
pF1KE1 KLQGCRENDSRQKWEQIEGNSKLRHVGSNLCLDSRTAKSGG-----LSVEVCGPAL-SQQ
: :...:.::.: . .:...:..:.::::. .: . :. : .: ::.
CCDS58 VLVLCKNGDDRQQWTKT--GSHIEHIASHLCLDTDMFGDGTENGKEIVVNPCESSLMSQH
500 510 520 530 540 550
570
pF1KE1 WKFTLNLQQ
:
CCDS58 WDMVSS
>>CCDS11915.1 GALNT1 gene_id:2589|Hs108|chr18 (559 aa)
initn: 1509 init1: 1079 opt: 1554 Z-score: 1780.2 bits: 339.3 E(32554): 7.7e-93
Smith-Waterman score: 1554; 45.1% identity (72.8% similar) in 530 aa overlap (46-563:32-548)
20 30 40 50 60 70
pF1KE1 VLGIAYYMYSGGGSALAGGAGGGAGRKEDWNEIDPIKKKDLHHSNGEEKAQSMETLPP--
:. : :.. : .. : .:. . :
CCDS11 RKFAYCKVVLATSLIWVLLDMFLLLYFSECNKCDEKKERGLPAGDVLEPVQKPHEGPGEM
10 20 30 40 50 60
80 90 100 110 120 130
pF1KE1 GK-VRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQWR
:: : : .:: . .. . :.:: . :. . ..:..::.: . :. : .
CCDS11 GKPVVIPKEDQEKM---------KEMFKINQFNLMASEMIALNRSLPDVRLEGCKTKVYP
70 80 90 100 110
140 150 160 170 180 190
pF1KE1 VDLPATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIILVDDYSN-DPEDGALLGKIE
.::.:::::.::::: :.::::: ::...:: :.:.::.:::: :. : : . ..
CCDS11 DNLPTTSVVIVFHNEAWSTLLRTVHSVINRSPRHMIEEIVLVDDASERDFLKRPLESYVK
120 130 140 150 160 170
200 210 220 230 240
pF1KE1 K----VRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLERVAEDRTR
: :.:.: ..: ::.:.:..:: .....:.::::.::::. :::::: :. .::
CCDS11 KLKVPVHVIRMEQRSGLIRARLKGAAVSKGQVITFLDAHCECTVGWLEPLLARIKHDRRT
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE1 VVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSR-QGNPVAPIKTPMI
:: ::::::. :.:.:...: :::.:.: :.: : .:... .: .:. . :..:: .
CCDS11 VVCPIIDVISDDTFEYMAGSDMTYGGFNWKLNFRW-YPVPQREMDRRKGDRTLPVRTPTM
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE1 AGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHVFRKQHP
::::: .:. ::.:.: :: ::.:::::::::::.:::::.:::. ::.::::::: :
CCDS11 AGGLFSIDRDYFQEIGTYDAGMDIWGGENLEISFRIWQCGGTLEIVTCSHVGHVFRKATP
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE1 YTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRKKLSCKPF
::::::.: .. .:.:: :::::::.:::.: :.. .: ::.:.::. ::.::.::::
CCDS11 YTFPGGTGQIINKNNRRLAEVWMDEFKNFFYIISPGVTKVDYGDISSRVGLRHKLQCKPF
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE1 KWYLENVYPELRVPDHQDIAFGALQ--QGTNCLDTLGHFADGVVGVYECHNAGGNQEWAL
.:::::.::. ..: : ...: .. . ..:::.... . ::...::. :::: ..
CCDS11 SWYLENIYPDSQIPRHY-FSLGEIRNVETNQCLDNMARKENEKVGIFNCHGMGGNQVFSY
420 430 440 450 460 470
490 500 510 520 530 540
pF1KE1 TKEKSVKHMDLCLTVVDRAPGSLIKLQGCRENDSRQKWEQIEGNSKLRHVGSNLCLDSRT
: .: .. :::: : .. : . :. :.. . : :: . :.::.:: :::. :
CCDS11 TANKEIRTDDLCLDV-SKLNGPVTMLK-CHHLKGNQLWEYDPVKLTLQHVNSNQCLDKAT
480 490 500 510 520
550 560 570
pF1KE1 AKSGGL-SVEVCGPALSQQWKFTLNLQQ
... . :.. :. . ::::
CCDS11 EEDSQVPSIRDCNGSRSQQWLLRNVTLPEIF
530 540 550
>>CCDS2199.1 GALNT13 gene_id:114805|Hs108|chr2 (556 aa)
initn: 1515 init1: 1070 opt: 1544 Z-score: 1768.8 bits: 337.1 E(32554): 3.4e-92
Smith-Waterman score: 1544; 48.0% identity (75.6% similar) in 471 aa overlap (102-563:81-547)
80 90 100 110 120 130
pF1KE1 PPGKVRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQW
:.:: . :: . ..:..::.: . :. : .
CCDS21 SRNQEGPGEMGKAVLIPKDDQEKMKELFKINQFNLMASDLIALNRSLPDVRLEGCKTKVY
60 70 80 90 100 110
140 150 160 170 180 190
pF1KE1 RVDLPATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIILVDDYSN-DPEDGALLGKI
.:: :::::.::::: :.::::: ::...:: .:..:.::::: :. : .: . .
CCDS21 PDELPNTSVVIVFHNEAWSTLLRTVYSVINRSPHYLLSEVILVDDASERDFLKLTLENYV
120 130 140 150 160 170
200 210 220 230 240
pF1KE1 EK----VRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLERVAEDRT
.. :...: ..: ::.:.:.::: :....:.::::.::::. :::::: :. :::
CCDS21 KNLEVPVKIIRMEERSGLIRARLRGAAASKGQVITFLDAHCECTLGWLEPLLARIKEDRK
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE1 RVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSR-QGNPVAPIKTPM
:: ::::::. :.:.:...: :::.:.: :.: : .:... .: .:. . :..::
CCDS21 TVVCPIIDVISDDTFEYMAGSDMTYGGFNWKLNFRW-YPVPQREMDRRKGDRTLPVRTPT
240 250 260 270 280
310 320 330 340 350 360
pF1KE1 IAGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHVFRKQH
.::::: .:. ::::.: :: ::.:::::::.:::.:::::::::. ::.:::::::
CCDS21 MAGGLFSIDRNYFEEIGTYDAGMDIWGGENLEMSFRIWQCGGSLEIVTCSHVGHVFRKAT
290 300 310 320 330 340
370 380 390 400 410 420
pF1KE1 PYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRKKLSCKP
:::::::.: :. .:.:: :::::::.:.:.: :.. .: ::... : ::..:.:::
CCDS21 PYTFPGGTGHVINKNNRRLAEVWMDEFKDFFYIISPGVVKVDYGDVSVRKTLRENLKCKP
350 360 370 380 390 400
430 440 450 460 470 480
pF1KE1 FKWYLENVYPELRVPDHQDIAFGALQ--QGTNCLDTLGHFADGVVGVYECHNAGGNQEWA
:.:::::.::. ..: .. ..: .. . ..:::..:. . ::...::. :::: ..
CCDS21 FSWYLENIYPDSQIP-RRYYSLGEIRNVETNQCLDNMGRKENEKVGIFNCHGMGGNQVFS
410 420 430 440 450 460
490 500 510 520 530 540
pF1KE1 LTKEKSVKHMDLCLTVVDRAPGSLIKLQGCRENDSRQKWEQIEGNSKLRHVGSNLCLDSR
: .: .. :::: : .: : .: :. :.. . : :: ::::.:: :::
CCDS21 YTADKEIRTDDLCLDV-SRLNGPVIMLK-CHHMRGNQLWEYDAERLTLRHVNSNQCLDEP
470 480 490 500 510 520
550 560 570
pF1KE1 TAKSGGL-SVEVCGPALSQQWKFTLNLQQ
. .. . ... :. . ::::
CCDS21 SEEDKMVPTMQDCSGSRSQQWLLRNMTLGT
530 540 550
>>CCDS77472.1 GALNT13 gene_id:114805|Hs108|chr2 (561 aa)
initn: 1455 init1: 1070 opt: 1469 Z-score: 1682.7 bits: 321.2 E(32554): 2.1e-87
Smith-Waterman score: 1486; 46.6% identity (74.4% similar) in 472 aa overlap (102-563:81-538)
80 90 100 110 120 130
pF1KE1 PPGKVRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQW
:.:: . :: . ..:..::.: . :. : .
CCDS77 SRNQEGPGEMGKAVLIPKDDQEKMKELFKINQFNLMASDLIALNRSLPDVRLEGCKTKVY
60 70 80 90 100 110
140 150 160 170 180 190
pF1KE1 RVDLPATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIILVDDYSN-DPEDGALLGKI
.:: :::::.::::: :.::::: ::...:: .:..:.::::: :. : .: . .
CCDS77 PDELPNTSVVIVFHNEAWSTLLRTVYSVINRSPHYLLSEVILVDDASERDFLKLTLENYV
120 130 140 150 160 170
200 210 220 230 240
pF1KE1 EK----VRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLERVAEDRT
.. :...: ..: ::.:.:.::: :....:.::::.::::. :::::: :. :::
CCDS77 KNLEVPVKIIRMEERSGLIRARLRGAAASKGQVITFLDAHCECTLGWLEPLLARIKEDRK
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE1 RVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSR-QGNPVAPIKTPM
:: ::::::. :.:.:...: :::.:.: :.: : .:... .: .:. . :..::
CCDS77 TVVCPIIDVISDDTFEYMAGSDMTYGGFNWKLNFRW-YPVPQREMDRRKGDRTLPVRTPT
240 250 260 270 280
310 320 330 340 350 360
pF1KE1 IAGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHVFRKQH
.::::: .:. ::::.: :: ::.:::::::.:::.:::::::::. ::.:::::::
CCDS77 MAGGLFSIDRNYFEEIGTYDAGMDIWGGENLEMSFRIWQCGGSLEIVTCSHVGHVFRKAT
290 300 310 320 330 340
370 380 390 400 410 420
pF1KE1 PYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRKKLSCKP
:::::::.: :. .:.:: :::::::.:.:.: :.. .: ::... : ::..:.:::
CCDS77 PYTFPGGTGHVINKNNRRLAEVWMDEFKDFFYIISPGVVKVDYGDVSVRKTLRENLKCKP
350 360 370 380 390 400
430 440 450 460 470 480
pF1KE1 FKWYLENVYPELRVPDHQDIAFGALQ--QGTNCLDTLGHFADGVVGVYECHNAGGNQEWA
:.:::::.::. ..: .. ..: .. . ..:::..:. . ::...::. :::: ..
CCDS77 FSWYLENIYPDSQIP-RRYYSLGEIRNVETNQCLDNMGRKENEKVGIFNCHGMGGNQVFS
410 420 430 440 450 460
490 500 510 520 530 540
pF1KE1 LTKEKSVKHMDLCLTVVDRAPGSLIKLQGCRENDSRQKWEQIEGNSKLRHVGSNLCLDSR
: .: .. :::: : .: : .: :. :.. . : :: .. ::.
CCDS77 YTADKEIRTDDLCLDV-SRLNGPVIMLK-CHHMRGNQLWEY----------DAESCLSVN
470 480 490 500 510
550 560 570
pF1KE1 TAKSGGL--SVEVCGPALSQQWKFTLNLQQ
. .:. .::.:. . :.:
CCDS77 KVADGSQHPTVETCNDSTLQKWLLRNYTRMEIFRNIFGNSTDYIL
520 530 540 550 560
>>CCDS6737.1 GALNT12 gene_id:79695|Hs108|chr9 (581 aa)
initn: 1207 init1: 678 opt: 1340 Z-score: 1534.6 bits: 293.9 E(32554): 3.7e-79
Smith-Waterman score: 1340; 40.8% identity (65.5% similar) in 583 aa overlap (3-565:15-576)
10 20 30 40
pF1KE1 MRRRSRMLLCFAFLWVLGIAYYMYSGGGSALAGGAGGGAGRKEDWNEI
::.: : ...: .:..: : ::.: . :.::: :
CCDS67 MWGRTARRRCPRELRRGREAL-LVLLALLALA-----GLGSVLRAQRGAGAGAAEPGPPR
10 20 30 40 50
50 60 70 80 90 100
pF1KE1 DPIKKKDLHHSNGEEKAQSMETLPPGKVRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVE
: . .: .. .: . . . . : .: .. ...:
CCDS67 TPRPGR-------REPVMPRPPVPANALGARGEAVRLQLQGEELRLQEESVRLHQINIYL
60 70 80 90 100
110 120 130 140 150 160
pF1KE1 SDKLRMDRAIPDTRHDQCQRKQWRVD-LPATSVVITFHNEARSALLRTVVSVLKKSPPHL
::.. . : .:. . :..:.. : :: :::.:.:.::: :.::::: :::. :: :
CCDS67 SDRISLHRRLPERWNPLCKEKKYDYDNLPRTSVIIAFYNEAWSTLLRTVYSVLETSPDIL
110 120 130 140 150 160
170 180 190 200 210 220
pF1KE1 IKEIILVDDYSNDPED-----GALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTF
..:.::::::: : : . :. . :::..: ..::::.:.:. ::.::.. ::::
CCDS67 LEEVILVDDYS-DREHLKERLANELSGLPKVRLIRANKREGLVRARLLGASAARGDVLTF
170 180 190 200 210 220
230 240 250 260 270 280
pF1KE1 LDSHCECNEHWLEPLLERVAEDRTRVVSPIIDVINMDNFQYVGASADLK-GGFDWNLVFK
:: ::::.: ::::::.:. :... :: :.::::. ..:.:.: :.. . ::::: :::
CCDS67 LDCHCECHEGWLEPLLQRIHEEESAVVCPVIDVIDWNTFEYLGNSGEPQIGGFDWRLVFT
230 240 250 260 270 280
290 300 310 320 330 340
pF1KE1 WDYMTPEQRRSRQGNPVAPIKTPMIAGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFR
: . .::..: :. .:: :..: .:::::...: ::: ::.:: :.::::::::.:::
CCDS67 W-HTVPERERIRMQSPVDVIRSPTMAGGLFAVSKKYFEYLGSYDTGMEVWGGENLEFSFR
290 300 310 320 330 340
350 360 370 380 390 400
pF1KE1 VWQCGGSLEIIPCSRVGHVFRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVP
.::::: :: :::.::::: :: ::. . ..: :. :::::::::.:..:: :
CCDS67 IWQCGGVLETHPCSHVGHVFPKQAPYS----RNKALA-NSVRAAEVWMDEFKELYYHRNP
350 360 370 380 390 400
410 420 430 440 450
pF1KE1 SARNVPYGNIQSRLELRKKLSCKPFKWYLENVYPELRVPDHQDIAFGALQ-QGTN--CLD
:: :.:.. : .:: ::.:: :::.::.:::::.::. . :: :: .: . :.:
CCDS67 RARLEPFGDVTERKQLRDKLQCKDFKWFLETVYPELHVPEDRPGFFGMLQNKGLTDYCFD
410 420 430 440 450 460
460 470 480 490 500 510
pF1KE1 TLGHFADGVVG----VYECHNAGGNQEWALTKEKSVK---HMDLCLTVVDRAPGSLIKLQ
. .:: .: ::. : :: . :..: .. :. .:. . .:: ..
CCDS67 YNPPDENQIVGHQVILYLCHGMGQNQFFEYTSQKEIRYNTHQPEGCIAVEAGMDTLI-MH
470 480 490 500 510
520 530 540 550 560
pF1KE1 GCRENDSRQKWEQIEGNSKLRHVGSNLCLDSRTAKSGGLSVEV---CGPALSQQWKFTLN
:.:. ... .. ...: : :. :... .:. : . : . :.: :
CCDS67 LCEETAPENQKFILQEDGSLFHEQSKKCVQAARKESSDSFVPLLRDCTNSDHQKWFFKER
520 530 540 550 560 570
570
pF1KE1 LQQ
CCDS67 ML
580
>>CCDS53817.1 GALNT4 gene_id:8693|Hs108|chr12 (578 aa)
initn: 1116 init1: 647 opt: 1310 Z-score: 1500.3 bits: 287.5 E(32554): 3e-77
Smith-Waterman score: 1310; 39.3% identity (66.6% similar) in 583 aa overlap (10-565:12-576)
10 20 30 40 50
pF1KE1 MRRRSRMLLCFAFLWVLGIAYYMYSGGGSALAGGAGGGAGRKEDWNEIDPIKKKDLHH
:. .: : .:: . :.. ..::.: .: :. . .::..
CCDS53 MAVRWTWAGKSCL-LLAFLTVAYIFVELLVSTFHASAGAGRAR-----ELGSRRLSDLQK
10 20 30 40 50
60 70 80 90 100 110
pF1KE1 SNGEEKAQSMETLPPGKVR----WPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRM
: :. .. . ::. : : .. .. ... .. : .: ::.. .
CCDS53 -NTEDLSRPLYKKPPADSRALGEWGK-ASKLQLNEDELKQQEELIERYAINIYLSDRISL
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE1 DRAIPDTRHDQCQRKQWRV-DLPATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIIL
: : : : .:. ... ::.:::.:.:.::: :.::::. :::. :: :.:::::
CCDS53 HRHIEDKRMYECKSQKFNYRTLPTTSVIIAFYNEAWSTLLRTIHSVLETSPAVLLKEIIL
120 130 140 150 160 170
180 190 200 210 220
pF1KE1 VDDYSN----DPEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCEC
::: :. . . ......::..:...::::.:.:. :: : . :::::: ::::
CCDS53 VDDLSDRVYLKTQLETYISNLDRVRLIRTNKREGLVRARLIGATFATGDVLTFLDCHCEC
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE1 NEHWLEPLLERVAEDRTRVVSPIIDVINMDNFQ-YVGASADLKGGFDWNLVFKWDYMTPE
: ::::::::...:.: :: :.::.:. ..:. :. . . ::::: :.:.: . .:.
CCDS53 NSGWLEPLLERIGRDETAVVCPVIDTIDWNTFEFYMQIGEPMIGGFDWRLTFQW-HSVPK
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE1 QRRSRQGNPVAPIKTPMIAGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGS
:.:.:. . . ::..: .:::::...: ::. :: :: :.::::::::.:::::::::.
CCDS53 QERDRRISRIDPIRSPTMAGGLFAVSKKYFQYLGTYDTGMEVWGGENLELSFRVWQCGGK
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE1 LEIIPCSRVGHVFRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVPY
::: :::.::::: :. ::. :. : .:: :::::::::::. .: : ::. :
CCDS53 LEIHPCSHVGHVFPKRAPYARPN-----FLQNTARAAEVWMDEYKEHFYNRNPPARKEAY
360 370 380 390 400
410 420 430 440 450 460
pF1KE1 GNIQSRLELRKKLSCKPFKWYLENVYPELRVPDHQDIAFGALQQ---GTNCLD--TLGHF
:.:. : ::..: :: : :::.::.:.:.::. . ::... ...::: . .
CCDS53 GDISERKLLRERLRCKSFDWYLKNVFPNLHVPEDRPGWHGAIRSRGISSECLDYNSPDNN
410 420 430 440 450 460
470 480 490 500 510
pF1KE1 ADGV-VGVYECHNAGGNQEWALTKEKSVKH---MDLCLTVVDRAPGSLIKLQGCREND--
:. .... ::. :::: . :..: .. .:: : .. . . .:.: ..
CCDS53 PTGANLSLFGCHGQGGNQFFEYTSNKEIRFNSVTELCAEVPEQK--NYVGMQNCPKDGFP
470 480 490 500 510 520
520 530 540 550 560 570
pF1KE1 --SRQKWEQIEGNSKLRHVGSNLCLDSRTAKSGGLSVEV--CGPAL--SQQWKFTLNLQQ
. : ... .. . : :.:::.. . : .:.. : :: .: :.:
CCDS53 VPANIIW-HFKEDGTIFHPHSGLCLSAYRTPEGRPDVQMRTCD-ALDKNQIWSFEK
530 540 550 560 570
571 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 10:24:10 2016 done: Sun Nov 6 10:24:11 2016
Total Scan time: 3.430 Total Display time: 0.100
Function used was FASTA [36.3.4 Apr, 2011]