FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1992, 571 aa 1>>>pF1KE1992 571 - 571 aa - 571 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6516+/-0.000826; mu= 17.2210+/- 0.050 mean_var=76.0933+/-15.108, 0's: 0 Z-trim(107.6): 29 B-trim: 0 in 0/51 Lambda= 0.147028 statistics sampled from 9638 (9664) to 9638 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.654), E-opt: 0.2 (0.297), width: 16 Scan time: 3.430 The best scores are: opt bits E(32554) CCDS1582.1 GALNT2 gene_id:2590|Hs108|chr1 ( 571) 3957 849.0 0 CCDS32107.1 GALNT16 gene_id:57452|Hs108|chr14 ( 558) 1850 402.0 9.7e-112 CCDS1773.2 GALNT14 gene_id:79623|Hs108|chr2 ( 552) 1830 397.8 1.8e-110 CCDS58705.1 GALNT14 gene_id:79623|Hs108|chr2 ( 532) 1824 396.5 4.3e-110 CCDS58706.1 GALNT14 gene_id:79623|Hs108|chr2 ( 557) 1676 365.1 1.3e-100 CCDS11915.1 GALNT1 gene_id:2589|Hs108|chr18 ( 559) 1554 339.3 7.7e-93 CCDS2199.1 GALNT13 gene_id:114805|Hs108|chr2 ( 556) 1544 337.1 3.4e-92 CCDS77472.1 GALNT13 gene_id:114805|Hs108|chr2 ( 561) 1469 321.2 2.1e-87 CCDS6737.1 GALNT12 gene_id:79695|Hs108|chr9 ( 581) 1340 293.9 3.7e-79 CCDS53817.1 GALNT4 gene_id:8693|Hs108|chr12 ( 578) 1310 287.5 3e-77 CCDS55860.1 GALNT4 gene_id:100528030|Hs108|chr12 ( 575) 1303 286.0 8.4e-77 CCDS5930.1 GALNT11 gene_id:63917|Hs108|chr7 ( 608) 1254 275.6 1.2e-73 CCDS8813.1 GALNT6 gene_id:11226|Hs108|chr12 ( 622) 1204 265.0 1.9e-70 CCDS2203.1 GALNT5 gene_id:11227|Hs108|chr2 ( 940) 1182 260.5 6.8e-69 CCDS4325.1 GALNT10 gene_id:55568|Hs108|chr5 ( 603) 1179 259.7 7.3e-69 CCDS2226.1 GALNT3 gene_id:2591|Hs108|chr2 ( 633) 1168 257.4 3.8e-68 CCDS34104.1 GALNTL6 gene_id:442117|Hs108|chr4 ( 601) 1121 247.4 3.7e-65 CCDS33711.1 GALNT15 gene_id:117248|Hs108|chr3 ( 639) 1089 240.7 4.3e-63 CCDS81755.1 GALNT9 gene_id:50614|Hs108|chr12 ( 603) 1052 232.8 9.3e-61 CCDS5929.1 GALNTL5 gene_id:168391|Hs108|chr7 ( 443) 1037 229.5 6.6e-60 CCDS82742.1 GALNT15 gene_id:117248|Hs108|chr3 ( 617) 1037 229.6 8.6e-60 CCDS5540.1 WBSCR17 gene_id:64409|Hs108|chr7 ( 598) 1018 225.6 1.4e-58 CCDS7807.1 GALNT18 gene_id:374378|Hs108|chr11 ( 607) 1014 224.7 2.5e-58 CCDS3815.1 GALNT7 gene_id:51809|Hs108|chr4 ( 657) 921 205.0 2.3e-52 CCDS8533.1 GALNT8 gene_id:26290|Hs108|chr12 ( 637) 770 173.0 9.9e-43 CCDS41866.1 GALNT9 gene_id:50614|Hs108|chr12 ( 237) 343 82.2 8e-16 >>CCDS1582.1 GALNT2 gene_id:2590|Hs108|chr1 (571 aa) initn: 3957 init1: 3957 opt: 3957 Z-score: 4534.8 bits: 849.0 E(32554): 0 Smith-Waterman score: 3957; 100.0% identity (100.0% similar) in 571 aa overlap (1-571:1-571) 10 20 30 40 50 60 pF1KE1 MRRRSRMLLCFAFLWVLGIAYYMYSGGGSALAGGAGGGAGRKEDWNEIDPIKKKDLHHSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS15 MRRRSRMLLCFAFLWVLGIAYYMYSGGGSALAGGAGGGAGRKEDWNEIDPIKKKDLHHSN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 GEEKAQSMETLPPGKVRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS15 GEEKAQSMETLPPGKVRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPD 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 TRHDQCQRKQWRVDLPATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIILVDDYSND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS15 TRHDQCQRKQWRVDLPATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIILVDDYSND 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 PEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS15 PEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLER 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 VAEDRTRVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS15 VAEDRTRVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVAP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 IKTPMIAGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS15 IKTPMIAGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 FRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS15 FRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRKK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE1 LSCKPFKWYLENVYPELRVPDHQDIAFGALQQGTNCLDTLGHFADGVVGVYECHNAGGNQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS15 LSCKPFKWYLENVYPELRVPDHQDIAFGALQQGTNCLDTLGHFADGVVGVYECHNAGGNQ 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE1 EWALTKEKSVKHMDLCLTVVDRAPGSLIKLQGCRENDSRQKWEQIEGNSKLRHVGSNLCL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS15 EWALTKEKSVKHMDLCLTVVDRAPGSLIKLQGCRENDSRQKWEQIEGNSKLRHVGSNLCL 490 500 510 520 530 540 550 560 570 pF1KE1 DSRTAKSGGLSVEVCGPALSQQWKFTLNLQQ ::::::::::::::::::::::::::::::: CCDS15 DSRTAKSGGLSVEVCGPALSQQWKFTLNLQQ 550 560 570 >>CCDS32107.1 GALNT16 gene_id:57452|Hs108|chr14 (558 aa) initn: 1089 init1: 921 opt: 1850 Z-score: 2119.5 bits: 402.0 E(32554): 9.7e-112 Smith-Waterman score: 1882; 50.2% identity (76.2% similar) in 576 aa overlap (1-565:1-554) 10 20 30 40 50 pF1KE1 MRR-RSRMLLCFAFLWVLGIAYYMYSGGGSALAGGAGGGAGRKEDWNEIDPIKKKDLHHS ::. :. . .. :.:: ::... . . :...: :: : ....:.. CCDS32 MRKIRANAIAILTVAWILGTFYYLWQDNRAHAASSGGRGAQRAGR-------RSEQLRE- 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 NGEEKAQSMETLPPGKVRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIP .. . : :.: :...::... ....:.::: .. :::.::::: :: : CCDS32 --DRTIPLIVTGTPSK----GFDEKAYLSAKQLKAGEDPYRQHAFNQLESDKLSPDRPIR 60 70 80 90 100 120 130 140 150 160 170 pF1KE1 DTRHDQCQRKQWRVDLPATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIILVDDYSN :::: .: .. :::::::.:::::::::.::::: :::...: .::.:::::::.:. CCDS32 DTRHYSCPSVSYSSDLPATSVIITFHNEARSTLLRTVKSVLNRTPANLIQEIILVDDFSS 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE1 DPEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLE :::: :: .: ::. :::::::::.::::::::.: : :::::::::: : .:: :.:. CCDS32 DPEDCLLLTRIPKVKCLRNDRREGLIRSRVRGADVAAATVLTFLDSHCEVNTEWLPPMLQ 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE1 RVAEDRTRVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVA :: ::.:::::::::::..::: :..:::::.:::::.: :::. . ::. .: .:. CCDS32 RVKEDHTRVVSPIIDVISLDNFAYLAASADLRGGFDWSLHFKWEQIPLEQKMTRT-DPTR 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE1 PIKTPMIAGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGH ::.::.::::.::.:: .:..::::: .::.:::::.:.:::::.:::::::.::::::: CCDS32 PIRTPVIAGGIFVIDKSWFNHLGKYDAQMDIWGGENFELSFRVWMCGGSLEIVPCSRVGH 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE1 VFRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRK ::::.:::.:: :.. .. :::.:.:::::::::..:: : ::: . .:.. .:.: :: CCDS32 VFRKRHPYNFPEGNALTYIRNTKRTAEVWMDEYKQYYYEARPSAIGKAFGSVATRIEQRK 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE1 KLSCKPFKWYLENVYPELRVPDHQDIAFGALQQGTNCLDTLGHFADG--VVGVYECHNAG :..:: :.:::::::::: :: .. . : ..::.:::.. :. . : ..:. :.... CCDS32 KMNCKSFRWYLENVYPELTVPVKEALP-GIIKQGVNCLESQGQNTAGDFLLGMGICRGSA 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE1 GN----QEWALTKEKSVKHMDLCLTVVDR---APGSLIKLQGCRENDSRQKWEQIEGNSK : : : : ... .... ::.... .::: . :: : ...:::.. .: : CCDS32 KNPQPAQAW-LFSDHLIQQQGKCLAATSTLMSSPGSPVILQMCNPREGKQKWRR-KG-SF 470 480 490 500 510 520 540 550 560 570 pF1KE1 LRHVGSNLCLDSRTAKSGGLSVEVC-GPALSQQWKFTLNLQQ ..: :.:::... :. : . : . : .:::.. CCDS32 IQHSVSGLCLETKPAQ---LVTSKCQADAQAQQWQLLPHT 530 540 550 >>CCDS1773.2 GALNT14 gene_id:79623|Hs108|chr2 (552 aa) initn: 1736 init1: 839 opt: 1830 Z-score: 2096.7 bits: 397.8 E(32554): 1.8e-110 Smith-Waterman score: 1841; 50.5% identity (76.6% similar) in 529 aa overlap (51-563:26-547) 30 40 50 60 70 80 pF1KE1 YYMYSGGGSALAGGAGGGAGRKEDWNEIDPIKKKDLHHSNGEEKAQSMETLPPGKVRWPD . :. :. .: : ..: :. . : : CCDS17 MRRLTRRLVLPVFGVLWITVLLFFWVTKRKLEVPTGPE----VQTPKPSDADWDD 10 20 30 40 50 90 100 110 120 130 pF1KE1 ----FNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQWRVDLP :... :... : :.::: ::: ::... .:::::::: .: . .::: CCDS17 LWDQFDERRYLNAKKWRVGDDPYKLYAFNQRESERISSNRAIPDTRHLRCTLLVYCTDLP 60 70 80 90 100 110 140 150 160 170 180 190 pF1KE1 ATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIILVDDYSNDPEDGALLGKIEKVRVL ::..:::::::::.::::. :::...: :::.:::::::.::::.: : :. ::. : CCDS17 PTSIIITFHNEARSTLLRTIRSVLNRTPTHLIREIILVDDFSNDPDDCKQLIKLPKVKCL 120 130 140 150 160 170 200 210 220 230 240 250 pF1KE1 RNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLERVAEDRTRVVSPIIDVI ::..:.::.:::.:::: ::. .::::::::: :. ::.:::.:: :: :::: :.::.: CCDS17 RNNERQGLVRSRIRGADIAQGTTLTFLDSHCEVNRDWLQPLLHRVKEDYTRVVCPVIDII 180 190 200 210 220 230 260 270 280 290 300 310 pF1KE1 NMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVAPIKTPMIAGGLFVMDKF :.:.: :. ....:.:::::.: :.:. ..:::. .:. .:. ::.::.:::::::.:: CCDS17 NLDTFTYIESASELRGGFDWSLHFQWEQLSPEQK-ARRLDPTEPIRTPIIAGGLFVIDKA 240 250 260 270 280 290 320 330 340 350 360 370 pF1KE1 YFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHVFRKQHPYTFPGGSGTV .:. :::::: ::.:::::.:::::::.:::::::.:::::::::::.:::.:: :.... CCDS17 WFDYLGKYDMDMDIWGGENFEISFRVWMCGGSLEIVPCSRVGHVFRKKHPYVFPDGNANT 300 310 320 330 340 350 380 390 400 410 420 430 pF1KE1 FARNTRRAAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRKKLSCKPFKWYLENVYPE . .::.:.:::::::::..:::: : : . :.::..:::.:::.: :. :::::::.::: CCDS17 YIKNTKRTAEVWMDEYKQYYYAARPFALERPFGNVESRLDLRKNLRCQSFKWYLENIYPE 360 370 380 390 400 410 440 450 460 470 480 490 pF1KE1 LRVPDHQDIAFGALQQGTNCLDTLGHFADGV--VGVYECHNAGG----NQEWALTKEKSV : .: ...: : ..: .::.. . . . . . : .. : .: ::.: ... CCDS17 LSIPKESSIQKGNIRQRQKCLESQRQNNQETPNLKLSPCAKVKGEDAKSQVWAFTYTQQI 420 430 440 450 460 470 500 510 520 530 540 pF1KE1 KHMDLCLTVVDRAPGSLIKLQGCRENDSRQKWEQIEGNSKLRHVGSNLCLDSRTAKSG-- . .:::.:. ::. . : :...:.::.: . .:...:..:.::::. .: CCDS17 LQEELCLSVITLFPGAPVVLVLCKNGDDRQQWTKT--GSHIEHIASHLCLDTDMFGDGTE 480 490 500 510 520 550 560 570 pF1KE1 -GLSVEV--CGPAL-SQQWKFTLNLQQ : . : : .: ::.: CCDS17 NGKEIVVNPCESSLMSQHWDMVSS 530 540 550 >>CCDS58705.1 GALNT14 gene_id:79623|Hs108|chr2 (532 aa) initn: 1736 init1: 839 opt: 1824 Z-score: 2090.1 bits: 396.5 E(32554): 4.3e-110 Smith-Waterman score: 1835; 52.2% identity (78.5% similar) in 498 aa overlap (78-563:33-527) 50 60 70 80 90 100 pF1KE1 IDPIKKKDLHHSNGEEKAQSMETLPPGKVRWPDFNQEAYVGGTMVRSGQDPYARNKFNQV : .:... :... : :.::: ::: CCDS58 FPMSLARSSVPFADSGLSSSQPSDADWDDLWDQFDERRYLNAKKWRVGDDPYKLYAFNQR 10 20 30 40 50 60 110 120 130 140 150 160 pF1KE1 ESDKLRMDRAIPDTRHDQCQRKQWRVDLPATSVVITFHNEARSALLRTVVSVLKKSPPHL ::... .:::::::: .: . .::: ::..:::::::::.::::. :::...: :: CCDS58 ESERISSNRAIPDTRHLRCTLLVYCTDLPPTSIIITFHNEARSTLLRTIRSVLNRTPTHL 70 80 90 100 110 120 170 180 190 200 210 220 pF1KE1 IKEIILVDDYSNDPEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHC :.:::::::.::::.: : :. ::. :::..:.::.:::.:::: ::. .:::::::: CCDS58 IREIILVDDFSNDPDDCKQLIKLPKVKCLRNNERQGLVRSRIRGADIAQGTTLTFLDSHC 130 140 150 160 170 180 230 240 250 260 270 280 pF1KE1 ECNEHWLEPLLERVAEDRTRVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTP : :. ::.:::.:: :: :::: :.::.::.:.: :. ....:.:::::.: :.:. ..: CCDS58 EVNRDWLQPLLHRVKEDYTRVVCPVIDIINLDTFTYIESASELRGGFDWSLHFQWEQLSP 190 200 210 220 230 240 290 300 310 320 330 340 pF1KE1 EQRRSRQGNPVAPIKTPMIAGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGG ::. .:. .:. ::.::.:::::::.:: .:. :::::: ::.:::::.:::::::.::: CCDS58 EQK-ARRLDPTEPIRTPIIAGGLFVIDKAWFDYLGKYDMDMDIWGGENFEISFRVWMCGG 250 260 270 280 290 300 350 360 370 380 390 400 pF1KE1 SLEIIPCSRVGHVFRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVP ::::.:::::::::::.:::.:: :..... .::.:.:::::::::..:::: : : . : CCDS58 SLEIVPCSRVGHVFRKKHPYVFPDGNANTYIKNTKRTAEVWMDEYKQYYYAARPFALERP 310 320 330 340 350 360 410 420 430 440 450 460 pF1KE1 YGNIQSRLELRKKLSCKPFKWYLENVYPELRVPDHQDIAFGALQQGTNCLDTLGHFADGV .::..:::.:::.: :. :::::::.:::: .: ...: : ..: .::.. . . . CCDS58 FGNVESRLDLRKNLRCQSFKWYLENIYPELSIPKESSIQKGNIRQRQKCLESQRQNNQET 370 380 390 400 410 420 470 480 490 500 510 520 pF1KE1 --VGVYECHNAGG----NQEWALTKEKSVKHMDLCLTVVDRAPGSLIKLQGCRENDSRQK . . : .. : .: ::.: ... . .:::.:. ::. . : :...:.::. CCDS58 PNLKLSPCAKVKGEDAKSQVWAFTYTQQILQEELCLSVITLFPGAPVVLVLCKNGDDRQQ 430 440 450 460 470 480 530 540 550 560 570 pF1KE1 WEQIEGNSKLRHVGSNLCLDSRTAKSG---GLSVEV--CGPAL-SQQWKFTLNLQQ : . .:...:..:.::::. .: : . : : .: ::.: CCDS58 WTKT--GSHIEHIASHLCLDTDMFGDGTENGKEIVVNPCESSLMSQHWDMVSS 490 500 510 520 530 >>CCDS58706.1 GALNT14 gene_id:79623|Hs108|chr2 (557 aa) initn: 1626 init1: 801 opt: 1676 Z-score: 1920.1 bits: 365.1 E(32554): 1.3e-100 Smith-Waterman score: 1687; 52.8% identity (79.4% similar) in 451 aa overlap (125-563:105-552) 100 110 120 130 140 150 pF1KE1 GQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQWRVDLPATSVVITFHNEARSALLR .: . .::: ::..:::::::::.::: CCDS58 PTGGHLAVCHFPCLLQEAQFHLQTQVFLQVRCTLLVYCTDLPPTSIIITFHNEARSTLLR 80 90 100 110 120 130 160 170 180 190 200 210 pF1KE1 TVVSVLKKSPPHLIKEIILVDDYSNDPEDGALLGKIEKVRVLRNDRREGLMRSRVRGADA :. :::...: :::.:::::::.::::.: : :. ::. :::..:.::.:::.:::: CCDS58 TIRSVLNRTPTHLIREIILVDDFSNDPDDCKQLIKLPKVKCLRNNERQGLVRSRIRGADI 140 150 160 170 180 190 220 230 240 250 260 270 pF1KE1 AQAKVLTFLDSHCECNEHWLEPLLERVAEDRTRVVSPIIDVINMDNFQYVGASADLKGGF ::. .::::::::: :. ::.:::.:: :: :::: :.::.::.:.: :. ....:.::: CCDS58 AQGTTLTFLDSHCEVNRDWLQPLLHRVKEDYTRVVCPVIDIINLDTFTYIESASELRGGF 200 210 220 230 240 250 280 290 300 310 320 330 pF1KE1 DWNLVFKWDYMTPEQRRSRQGNPVAPIKTPMIAGGLFVMDKFYFEELGKYDMMMDVWGGE ::.: :.:. ..:::. .:. .:. ::.::.:::::::.:: .:. :::::: ::.:::: CCDS58 DWSLHFQWEQLSPEQK-ARRLDPTEPIRTPIIAGGLFVIDKAWFDYLGKYDMDMDIWGGE 260 270 280 290 300 310 340 350 360 370 380 390 pF1KE1 NLEISFRVWQCGGSLEIIPCSRVGHVFRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKN :.:::::::.:::::::.:::::::::::.:::.:: :..... .::.:.:::::::::. CCDS58 NFEISFRVWMCGGSLEIVPCSRVGHVFRKKHPYVFPDGNANTYIKNTKRTAEVWMDEYKQ 320 330 340 350 360 370 400 410 420 430 440 450 pF1KE1 FYYAAVPSARNVPYGNIQSRLELRKKLSCKPFKWYLENVYPELRVPDHQDIAFGALQQGT .:::: : : . :.::..:::.:::.: :. :::::::.:::: .: ...: : ..: CCDS58 YYYAARPFALERPFGNVESRLDLRKNLRCQSFKWYLENIYPELSIPKESSIQKGNIRQRQ 380 390 400 410 420 430 460 470 480 490 500 pF1KE1 NCLDTLGHFADGV--VGVYECHNAGG----NQEWALTKEKSVKHMDLCLTVVDRAPGSLI .::.. . . . . . : .. : .: ::.: ... . .:::.:. ::. . CCDS58 KCLESQRQNNQETPNLKLSPCAKVKGEDAKSQVWAFTYTQQILQEELCLSVITLFPGAPV 440 450 460 470 480 490 510 520 530 540 550 560 pF1KE1 KLQGCRENDSRQKWEQIEGNSKLRHVGSNLCLDSRTAKSGG-----LSVEVCGPAL-SQQ : :...:.::.: . .:...:..:.::::. .: . :. : .: ::. CCDS58 VLVLCKNGDDRQQWTKT--GSHIEHIASHLCLDTDMFGDGTENGKEIVVNPCESSLMSQH 500 510 520 530 540 550 570 pF1KE1 WKFTLNLQQ : CCDS58 WDMVSS >>CCDS11915.1 GALNT1 gene_id:2589|Hs108|chr18 (559 aa) initn: 1509 init1: 1079 opt: 1554 Z-score: 1780.2 bits: 339.3 E(32554): 7.7e-93 Smith-Waterman score: 1554; 45.1% identity (72.8% similar) in 530 aa overlap (46-563:32-548) 20 30 40 50 60 70 pF1KE1 VLGIAYYMYSGGGSALAGGAGGGAGRKEDWNEIDPIKKKDLHHSNGEEKAQSMETLPP-- :. : :.. : .. : .:. . : CCDS11 RKFAYCKVVLATSLIWVLLDMFLLLYFSECNKCDEKKERGLPAGDVLEPVQKPHEGPGEM 10 20 30 40 50 60 80 90 100 110 120 130 pF1KE1 GK-VRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQWR :: : : .:: . .. . :.:: . :. . ..:..::.: . :. : . CCDS11 GKPVVIPKEDQEKM---------KEMFKINQFNLMASEMIALNRSLPDVRLEGCKTKVYP 70 80 90 100 110 140 150 160 170 180 190 pF1KE1 VDLPATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIILVDDYSN-DPEDGALLGKIE .::.:::::.::::: :.::::: ::...:: :.:.::.:::: :. : : . .. CCDS11 DNLPTTSVVIVFHNEAWSTLLRTVHSVINRSPRHMIEEIVLVDDASERDFLKRPLESYVK 120 130 140 150 160 170 200 210 220 230 240 pF1KE1 K----VRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLERVAEDRTR : :.:.: ..: ::.:.:..:: .....:.::::.::::. :::::: :. .:: CCDS11 KLKVPVHVIRMEQRSGLIRARLKGAAVSKGQVITFLDAHCECTVGWLEPLLARIKHDRRT 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE1 VVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSR-QGNPVAPIKTPMI :: ::::::. :.:.:...: :::.:.: :.: : .:... .: .:. . :..:: . CCDS11 VVCPIIDVISDDTFEYMAGSDMTYGGFNWKLNFRW-YPVPQREMDRRKGDRTLPVRTPTM 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE1 AGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHVFRKQHP ::::: .:. ::.:.: :: ::.:::::::::::.:::::.:::. ::.::::::: : CCDS11 AGGLFSIDRDYFQEIGTYDAGMDIWGGENLEISFRIWQCGGTLEIVTCSHVGHVFRKATP 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE1 YTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRKKLSCKPF ::::::.: .. .:.:: :::::::.:::.: :.. .: ::.:.::. ::.::.:::: CCDS11 YTFPGGTGQIINKNNRRLAEVWMDEFKNFFYIISPGVTKVDYGDISSRVGLRHKLQCKPF 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE1 KWYLENVYPELRVPDHQDIAFGALQ--QGTNCLDTLGHFADGVVGVYECHNAGGNQEWAL .:::::.::. ..: : ...: .. . ..:::.... . ::...::. :::: .. CCDS11 SWYLENIYPDSQIPRHY-FSLGEIRNVETNQCLDNMARKENEKVGIFNCHGMGGNQVFSY 420 430 440 450 460 470 490 500 510 520 530 540 pF1KE1 TKEKSVKHMDLCLTVVDRAPGSLIKLQGCRENDSRQKWEQIEGNSKLRHVGSNLCLDSRT : .: .. :::: : .. : . :. :.. . : :: . :.::.:: :::. : CCDS11 TANKEIRTDDLCLDV-SKLNGPVTMLK-CHHLKGNQLWEYDPVKLTLQHVNSNQCLDKAT 480 490 500 510 520 550 560 570 pF1KE1 AKSGGL-SVEVCGPALSQQWKFTLNLQQ ... . :.. :. . :::: CCDS11 EEDSQVPSIRDCNGSRSQQWLLRNVTLPEIF 530 540 550 >>CCDS2199.1 GALNT13 gene_id:114805|Hs108|chr2 (556 aa) initn: 1515 init1: 1070 opt: 1544 Z-score: 1768.8 bits: 337.1 E(32554): 3.4e-92 Smith-Waterman score: 1544; 48.0% identity (75.6% similar) in 471 aa overlap (102-563:81-547) 80 90 100 110 120 130 pF1KE1 PPGKVRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQW :.:: . :: . ..:..::.: . :. : . CCDS21 SRNQEGPGEMGKAVLIPKDDQEKMKELFKINQFNLMASDLIALNRSLPDVRLEGCKTKVY 60 70 80 90 100 110 140 150 160 170 180 190 pF1KE1 RVDLPATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIILVDDYSN-DPEDGALLGKI .:: :::::.::::: :.::::: ::...:: .:..:.::::: :. : .: . . CCDS21 PDELPNTSVVIVFHNEAWSTLLRTVYSVINRSPHYLLSEVILVDDASERDFLKLTLENYV 120 130 140 150 160 170 200 210 220 230 240 pF1KE1 EK----VRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLERVAEDRT .. :...: ..: ::.:.:.::: :....:.::::.::::. :::::: :. ::: CCDS21 KNLEVPVKIIRMEERSGLIRARLRGAAASKGQVITFLDAHCECTLGWLEPLLARIKEDRK 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE1 RVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSR-QGNPVAPIKTPM :: ::::::. :.:.:...: :::.:.: :.: : .:... .: .:. . :..:: CCDS21 TVVCPIIDVISDDTFEYMAGSDMTYGGFNWKLNFRW-YPVPQREMDRRKGDRTLPVRTPT 240 250 260 270 280 310 320 330 340 350 360 pF1KE1 IAGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHVFRKQH .::::: .:. ::::.: :: ::.:::::::.:::.:::::::::. ::.::::::: CCDS21 MAGGLFSIDRNYFEEIGTYDAGMDIWGGENLEMSFRIWQCGGSLEIVTCSHVGHVFRKAT 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE1 PYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRKKLSCKP :::::::.: :. .:.:: :::::::.:.:.: :.. .: ::... : ::..:.::: CCDS21 PYTFPGGTGHVINKNNRRLAEVWMDEFKDFFYIISPGVVKVDYGDVSVRKTLRENLKCKP 350 360 370 380 390 400 430 440 450 460 470 480 pF1KE1 FKWYLENVYPELRVPDHQDIAFGALQ--QGTNCLDTLGHFADGVVGVYECHNAGGNQEWA :.:::::.::. ..: .. ..: .. . ..:::..:. . ::...::. :::: .. CCDS21 FSWYLENIYPDSQIP-RRYYSLGEIRNVETNQCLDNMGRKENEKVGIFNCHGMGGNQVFS 410 420 430 440 450 460 490 500 510 520 530 540 pF1KE1 LTKEKSVKHMDLCLTVVDRAPGSLIKLQGCRENDSRQKWEQIEGNSKLRHVGSNLCLDSR : .: .. :::: : .: : .: :. :.. . : :: ::::.:: ::: CCDS21 YTADKEIRTDDLCLDV-SRLNGPVIMLK-CHHMRGNQLWEYDAERLTLRHVNSNQCLDEP 470 480 490 500 510 520 550 560 570 pF1KE1 TAKSGGL-SVEVCGPALSQQWKFTLNLQQ . .. . ... :. . :::: CCDS21 SEEDKMVPTMQDCSGSRSQQWLLRNMTLGT 530 540 550 >>CCDS77472.1 GALNT13 gene_id:114805|Hs108|chr2 (561 aa) initn: 1455 init1: 1070 opt: 1469 Z-score: 1682.7 bits: 321.2 E(32554): 2.1e-87 Smith-Waterman score: 1486; 46.6% identity (74.4% similar) in 472 aa overlap (102-563:81-538) 80 90 100 110 120 130 pF1KE1 PPGKVRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQW :.:: . :: . ..:..::.: . :. : . CCDS77 SRNQEGPGEMGKAVLIPKDDQEKMKELFKINQFNLMASDLIALNRSLPDVRLEGCKTKVY 60 70 80 90 100 110 140 150 160 170 180 190 pF1KE1 RVDLPATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIILVDDYSN-DPEDGALLGKI .:: :::::.::::: :.::::: ::...:: .:..:.::::: :. : .: . . CCDS77 PDELPNTSVVIVFHNEAWSTLLRTVYSVINRSPHYLLSEVILVDDASERDFLKLTLENYV 120 130 140 150 160 170 200 210 220 230 240 pF1KE1 EK----VRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLERVAEDRT .. :...: ..: ::.:.:.::: :....:.::::.::::. :::::: :. ::: CCDS77 KNLEVPVKIIRMEERSGLIRARLRGAAASKGQVITFLDAHCECTLGWLEPLLARIKEDRK 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE1 RVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSR-QGNPVAPIKTPM :: ::::::. :.:.:...: :::.:.: :.: : .:... .: .:. . :..:: CCDS77 TVVCPIIDVISDDTFEYMAGSDMTYGGFNWKLNFRW-YPVPQREMDRRKGDRTLPVRTPT 240 250 260 270 280 310 320 330 340 350 360 pF1KE1 IAGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHVFRKQH .::::: .:. ::::.: :: ::.:::::::.:::.:::::::::. ::.::::::: CCDS77 MAGGLFSIDRNYFEEIGTYDAGMDIWGGENLEMSFRIWQCGGSLEIVTCSHVGHVFRKAT 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE1 PYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRKKLSCKP :::::::.: :. .:.:: :::::::.:.:.: :.. .: ::... : ::..:.::: CCDS77 PYTFPGGTGHVINKNNRRLAEVWMDEFKDFFYIISPGVVKVDYGDVSVRKTLRENLKCKP 350 360 370 380 390 400 430 440 450 460 470 480 pF1KE1 FKWYLENVYPELRVPDHQDIAFGALQ--QGTNCLDTLGHFADGVVGVYECHNAGGNQEWA :.:::::.::. ..: .. ..: .. . ..:::..:. . ::...::. :::: .. CCDS77 FSWYLENIYPDSQIP-RRYYSLGEIRNVETNQCLDNMGRKENEKVGIFNCHGMGGNQVFS 410 420 430 440 450 460 490 500 510 520 530 540 pF1KE1 LTKEKSVKHMDLCLTVVDRAPGSLIKLQGCRENDSRQKWEQIEGNSKLRHVGSNLCLDSR : .: .. :::: : .: : .: :. :.. . : :: .. ::. CCDS77 YTADKEIRTDDLCLDV-SRLNGPVIMLK-CHHMRGNQLWEY----------DAESCLSVN 470 480 490 500 510 550 560 570 pF1KE1 TAKSGGL--SVEVCGPALSQQWKFTLNLQQ . .:. .::.:. . :.: CCDS77 KVADGSQHPTVETCNDSTLQKWLLRNYTRMEIFRNIFGNSTDYIL 520 530 540 550 560 >>CCDS6737.1 GALNT12 gene_id:79695|Hs108|chr9 (581 aa) initn: 1207 init1: 678 opt: 1340 Z-score: 1534.6 bits: 293.9 E(32554): 3.7e-79 Smith-Waterman score: 1340; 40.8% identity (65.5% similar) in 583 aa overlap (3-565:15-576) 10 20 30 40 pF1KE1 MRRRSRMLLCFAFLWVLGIAYYMYSGGGSALAGGAGGGAGRKEDWNEI ::.: : ...: .:..: : ::.: . :.::: : CCDS67 MWGRTARRRCPRELRRGREAL-LVLLALLALA-----GLGSVLRAQRGAGAGAAEPGPPR 10 20 30 40 50 50 60 70 80 90 100 pF1KE1 DPIKKKDLHHSNGEEKAQSMETLPPGKVRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVE : . .: .. .: . . . . : .: .. ...: CCDS67 TPRPGR-------REPVMPRPPVPANALGARGEAVRLQLQGEELRLQEESVRLHQINIYL 60 70 80 90 100 110 120 130 140 150 160 pF1KE1 SDKLRMDRAIPDTRHDQCQRKQWRVD-LPATSVVITFHNEARSALLRTVVSVLKKSPPHL ::.. . : .:. . :..:.. : :: :::.:.:.::: :.::::: :::. :: : CCDS67 SDRISLHRRLPERWNPLCKEKKYDYDNLPRTSVIIAFYNEAWSTLLRTVYSVLETSPDIL 110 120 130 140 150 160 170 180 190 200 210 220 pF1KE1 IKEIILVDDYSNDPED-----GALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTF ..:.::::::: : : . :. . :::..: ..::::.:.:. ::.::.. :::: CCDS67 LEEVILVDDYS-DREHLKERLANELSGLPKVRLIRANKREGLVRARLLGASAARGDVLTF 170 180 190 200 210 220 230 240 250 260 270 280 pF1KE1 LDSHCECNEHWLEPLLERVAEDRTRVVSPIIDVINMDNFQYVGASADLK-GGFDWNLVFK :: ::::.: ::::::.:. :... :: :.::::. ..:.:.: :.. . ::::: ::: CCDS67 LDCHCECHEGWLEPLLQRIHEEESAVVCPVIDVIDWNTFEYLGNSGEPQIGGFDWRLVFT 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE1 WDYMTPEQRRSRQGNPVAPIKTPMIAGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFR : . .::..: :. .:: :..: .:::::...: ::: ::.:: :.::::::::.::: CCDS67 W-HTVPERERIRMQSPVDVIRSPTMAGGLFAVSKKYFEYLGSYDTGMEVWGGENLEFSFR 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE1 VWQCGGSLEIIPCSRVGHVFRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVP .::::: :: :::.::::: :: ::. . ..: :. :::::::::.:..:: : CCDS67 IWQCGGVLETHPCSHVGHVFPKQAPYS----RNKALA-NSVRAAEVWMDEFKELYYHRNP 350 360 370 380 390 400 410 420 430 440 450 pF1KE1 SARNVPYGNIQSRLELRKKLSCKPFKWYLENVYPELRVPDHQDIAFGALQ-QGTN--CLD :: :.:.. : .:: ::.:: :::.::.:::::.::. . :: :: .: . :.: CCDS67 RARLEPFGDVTERKQLRDKLQCKDFKWFLETVYPELHVPEDRPGFFGMLQNKGLTDYCFD 410 420 430 440 450 460 460 470 480 490 500 510 pF1KE1 TLGHFADGVVG----VYECHNAGGNQEWALTKEKSVK---HMDLCLTVVDRAPGSLIKLQ . .:: .: ::. : :: . :..: .. :. .:. . .:: .. CCDS67 YNPPDENQIVGHQVILYLCHGMGQNQFFEYTSQKEIRYNTHQPEGCIAVEAGMDTLI-MH 470 480 490 500 510 520 530 540 550 560 pF1KE1 GCRENDSRQKWEQIEGNSKLRHVGSNLCLDSRTAKSGGLSVEV---CGPALSQQWKFTLN :.:. ... .. ...: : :. :... .:. : . : . :.: : CCDS67 LCEETAPENQKFILQEDGSLFHEQSKKCVQAARKESSDSFVPLLRDCTNSDHQKWFFKER 520 530 540 550 560 570 570 pF1KE1 LQQ CCDS67 ML 580 >>CCDS53817.1 GALNT4 gene_id:8693|Hs108|chr12 (578 aa) initn: 1116 init1: 647 opt: 1310 Z-score: 1500.3 bits: 287.5 E(32554): 3e-77 Smith-Waterman score: 1310; 39.3% identity (66.6% similar) in 583 aa overlap (10-565:12-576) 10 20 30 40 50 pF1KE1 MRRRSRMLLCFAFLWVLGIAYYMYSGGGSALAGGAGGGAGRKEDWNEIDPIKKKDLHH :. .: : .:: . :.. ..::.: .: :. . .::.. CCDS53 MAVRWTWAGKSCL-LLAFLTVAYIFVELLVSTFHASAGAGRAR-----ELGSRRLSDLQK 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 SNGEEKAQSMETLPPGKVR----WPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRM : :. .. . ::. : : .. .. ... .. : .: ::.. . CCDS53 -NTEDLSRPLYKKPPADSRALGEWGK-ASKLQLNEDELKQQEELIERYAINIYLSDRISL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 DRAIPDTRHDQCQRKQWRV-DLPATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIIL : : : : .:. ... ::.:::.:.:.::: :.::::. :::. :: :.::::: CCDS53 HRHIEDKRMYECKSQKFNYRTLPTTSVIIAFYNEAWSTLLRTIHSVLETSPAVLLKEIIL 120 130 140 150 160 170 180 190 200 210 220 pF1KE1 VDDYSN----DPEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCEC ::: :. . . ......::..:...::::.:.:. :: : . :::::: :::: CCDS53 VDDLSDRVYLKTQLETYISNLDRVRLIRTNKREGLVRARLIGATFATGDVLTFLDCHCEC 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE1 NEHWLEPLLERVAEDRTRVVSPIIDVINMDNFQ-YVGASADLKGGFDWNLVFKWDYMTPE : ::::::::...:.: :: :.::.:. ..:. :. . . ::::: :.:.: . .:. CCDS53 NSGWLEPLLERIGRDETAVVCPVIDTIDWNTFEFYMQIGEPMIGGFDWRLTFQW-HSVPK 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE1 QRRSRQGNPVAPIKTPMIAGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGS :.:.:. . . ::..: .:::::...: ::. :: :: :.::::::::.:::::::::. CCDS53 QERDRRISRIDPIRSPTMAGGLFAVSKKYFQYLGTYDTGMEVWGGENLELSFRVWQCGGK 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE1 LEIIPCSRVGHVFRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVPY ::: :::.::::: :. ::. :. : .:: :::::::::::. .: : ::. : CCDS53 LEIHPCSHVGHVFPKRAPYARPN-----FLQNTARAAEVWMDEYKEHFYNRNPPARKEAY 360 370 380 390 400 410 420 430 440 450 460 pF1KE1 GNIQSRLELRKKLSCKPFKWYLENVYPELRVPDHQDIAFGALQQ---GTNCLD--TLGHF :.:. : ::..: :: : :::.::.:.:.::. . ::... ...::: . . CCDS53 GDISERKLLRERLRCKSFDWYLKNVFPNLHVPEDRPGWHGAIRSRGISSECLDYNSPDNN 410 420 430 440 450 460 470 480 490 500 510 pF1KE1 ADGV-VGVYECHNAGGNQEWALTKEKSVKH---MDLCLTVVDRAPGSLIKLQGCREND-- :. .... ::. :::: . :..: .. .:: : .. . . .:.: .. CCDS53 PTGANLSLFGCHGQGGNQFFEYTSNKEIRFNSVTELCAEVPEQK--NYVGMQNCPKDGFP 470 480 490 500 510 520 520 530 540 550 560 570 pF1KE1 --SRQKWEQIEGNSKLRHVGSNLCLDSRTAKSGGLSVEV--CGPAL--SQQWKFTLNLQQ . : ... .. . : :.:::.. . : .:.. : :: .: :.: CCDS53 VPANIIW-HFKEDGTIFHPHSGLCLSAYRTPEGRPDVQMRTCD-ALDKNQIWSFEK 530 540 550 560 570 571 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 10:24:10 2016 done: Sun Nov 6 10:24:11 2016 Total Scan time: 3.430 Total Display time: 0.100 Function used was FASTA [36.3.4 Apr, 2011]