FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2163, 882 aa 1>>>pF1KE2163 882 - 882 aa - 882 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0689+/-0.000956; mu= 17.5625+/- 0.058 mean_var=82.0576+/-16.641, 0's: 0 Z-trim(106.6): 18 B-trim: 56 in 1/50 Lambda= 0.141584 statistics sampled from 9036 (9049) to 9036 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.632), E-opt: 0.2 (0.278), width: 16 Scan time: 2.950 The best scores are: opt bits E(32554) CCDS34277.1 NDST1 gene_id:3340|Hs108|chr5 ( 882) 6045 1245.0 0 CCDS75358.1 NDST1 gene_id:3340|Hs108|chr5 ( 825) 4901 1011.3 0 CCDS3706.1 NDST4 gene_id:64579|Hs108|chr4 ( 872) 4413 911.7 0 CCDS3708.1 NDST3 gene_id:9348|Hs108|chr4 ( 873) 4409 910.8 0 CCDS7335.1 NDST2 gene_id:8509|Hs108|chr10 ( 883) 4392 907.4 0 CCDS81476.1 NDST2 gene_id:8509|Hs108|chr10 ( 815) 3990 825.2 0 CCDS53995.1 HS3ST4 gene_id:9951|Hs108|chr16 ( 456) 375 86.7 1e-16 CCDS11167.1 HS3ST3B1 gene_id:9953|Hs108|chr17 ( 390) 370 85.7 1.8e-16 CCDS11165.1 HS3ST3A1 gene_id:9955|Hs108|chr17 ( 406) 370 85.7 1.9e-16 CCDS10606.1 HS3ST2 gene_id:9956|Hs108|chr16 ( 367) 359 83.4 8.2e-16 CCDS34517.1 HS3ST5 gene_id:222537|Hs108|chr6 ( 346) 355 82.6 1.4e-15 CCDS45381.2 HS3ST6 gene_id:64711|Hs108|chr16 ( 342) 337 78.9 1.7e-14 >>CCDS34277.1 NDST1 gene_id:3340|Hs108|chr5 (882 aa) initn: 6045 init1: 6045 opt: 6045 Z-score: 6668.4 bits: 1245.0 E(32554): 0 Smith-Waterman score: 6045; 100.0% identity (100.0% similar) in 882 aa overlap (1-882:1-882) 10 20 30 40 50 60 pF1KE2 MPALACLRRLCRHVSPQAVLFLLFIFCLFSVFISAYYLYGWKRGLEPSADAPEPDCGDPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MPALACLRRLCRHVSPQAVLFLLFIFCLFSVFISAYYLYGWKRGLEPSADAPEPDCGDPP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 PVAPSRLLPLKPVQAATPSRTDPLVLVFVESLYSQLGQEVVAILESSRFKYRTEIAPGKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PVAPSRLLPLKPVQAATPSRTDPLVLVFVESLYSQLGQEVVAILESSRFKYRTEIAPGKG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 DMPTLTDKGRGRFALIIYENILKYVNLDAWNRELLDKYCVAYGVGIIGFFKANENSLLSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 DMPTLTDKGRGRFALIIYENILKYVNLDAWNRELLDKYCVAYGVGIIGFFKANENSLLSA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 QLKGFPLFLHSNLGLKDCSINPKSPLLYVTRPSEVEKGVLPGEDWTVFQSNHSTYEPVLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 QLKGFPLFLHSNLGLKDCSINPKSPLLYVTRPSEVEKGVLPGEDWTVFQSNHSTYEPVLL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 AKTRSSESIPHLGADAGLHAALHATVVQDLGLHDGIQRVLFGNNLNFWLHKLVFVDAVAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 AKTRSSESIPHLGADAGLHAALHATVVQDLGLHDGIQRVLFGNNLNFWLHKLVFVDAVAF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 LTGKRLSLPLDRYILVDIDDIFVGKEGTRMKVEDVKALFDTQNELRAHIPNFTFNLGYSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LTGKRLSLPLDRYILVDIDDIFVGKEGTRMKVEDVKALFDTQNELRAHIPNFTFNLGYSG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 KFFHTGTNAEDAGDDLLLSYVKEFWWFPHMWSHMQPHLFHNQSVLAEQMALNKKFAVEHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 KFFHTGTNAEDAGDDLLLSYVKEFWWFPHMWSHMQPHLFHNQSVLAEQMALNKKFAVEHG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 IPTDMGYAVAPHHSGVYPVHVQLYEAWKQVWSIRVTSTEEYPHLKPARYRRGFIHNGIMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 IPTDMGYAVAPHHSGVYPVHVQLYEAWKQVWSIRVTSTEEYPHLKPARYRRGFIHNGIMV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 LPRQTCGLFTHTIFYNEYPGGSSELDKIINGGELFLTVLLNPISIFMTHLSNYGNDRLGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LPRQTCGLFTHTIFYNEYPGGSSELDKIINGGELFLTVLLNPISIFMTHLSNYGNDRLGL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 YTFKHLVRFLHSWTNLRLQTLPPVQLAQKYFQIFSEEKDPLWQDPCEDKRHKDIWSKEKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 YTFKHLVRFLHSWTNLRLQTLPPVQLAQKYFQIFSEEKDPLWQDPCEDKRHKDIWSKEKT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 CDRFPKLLIIGPQKTGTTALYLFLGMHPDLSSNYPSSETFEEIQFFNGHNYHKGIDWYME :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 CDRFPKLLIIGPQKTGTTALYLFLGMHPDLSSNYPSSETFEEIQFFNGHNYHKGIDWYME 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 FFPIPSNTTSDFYFEKSANYFDSEVAPRRAAALLPKAKVLTILINPADRAYSWYQHQRAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 FFPIPSNTTSDFYFEKSANYFDSEVAPRRAAALLPKAKVLTILINPADRAYSWYQHQRAH 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 DDPVALKYTFHEVITAGSDASSKLRALQNRCLVPGWYATHIERWLSAYHANQILVLDGKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 DDPVALKYTFHEVITAGSDASSKLRALQNRCLVPGWYATHIERWLSAYHANQILVLDGKL 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE2 LRTEPAKVMDMVQKFLGVTNTIDYHKTLAFDPKKGFWCQLLEGGKTKCLGKSKGRKYPEM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LRTEPAKVMDMVQKFLGVTNTIDYHKTLAFDPKKGFWCQLLEGGKTKCLGKSKGRKYPEM 790 800 810 820 830 840 850 860 870 880 pF1KE2 DLDSRAFLKDYYRDHNIELSKLLYKMGQTLPTWLREDLQNTR :::::::::::::::::::::::::::::::::::::::::: CCDS34 DLDSRAFLKDYYRDHNIELSKLLYKMGQTLPTWLREDLQNTR 850 860 870 880 >>CCDS75358.1 NDST1 gene_id:3340|Hs108|chr5 (825 aa) initn: 4901 init1: 4901 opt: 4901 Z-score: 5406.0 bits: 1011.3 E(32554): 0 Smith-Waterman score: 5524; 93.5% identity (93.5% similar) in 882 aa overlap (1-882:1-825) 10 20 30 40 50 60 pF1KE2 MPALACLRRLCRHVSPQAVLFLLFIFCLFSVFISAYYLYGWKRGLEPSADAPEPDCGDPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 MPALACLRRLCRHVSPQAVLFLLFIFCLFSVFISAYYLYGWKRGLEPSADAPEPDCGDPP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 PVAPSRLLPLKPVQAATPSRTDPLVLVFVESLYSQLGQEVVAILESSRFKYRTEIAPGKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 PVAPSRLLPLKPVQAATPSRTDPLVLVFVESLYSQLGQEVVAILESSRFKYRTEIAPGKG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 DMPTLTDKGRGRFALIIYENILKYVNLDAWNRELLDKYCVAYGVGIIGFFKANENSLLSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 DMPTLTDKGRGRFALIIYENILKYVNLDAWNRELLDKYCVAYGVGIIGFFKANENSLLSA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 QLKGFPLFLHSNLGLKDCSINPKSPLLYVTRPSEVEKGVLPGEDWTVFQSNHSTYEPVLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 QLKGFPLFLHSNLGLKDCSINPKSPLLYVTRPSEVEKGVLPGEDWTVFQSNHSTYEPVLL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 AKTRSSESIPHLGADAGLHAALHATVVQDLGLHDGIQRVLFGNNLNFWLHKLVFVDAVAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 AKTRSSESIPHLGADAGLHAALHATVVQDLGLHDGIQRVLFGNNLNFWLHKLVFVDAVAF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 LTGKRLSLPLDRYILVDIDDIFVGKEGTRMKVEDVKALFDTQNELRAHIPNFTFNLGYSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 LTGKRLSLPLDRYILVDIDDIFVGKEGTRMKVEDVKALFDTQNELRAHIPNFTFNLGYSG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 KFFHTGTNAEDAGDDLLLSYVKEFWWFPHMWSHMQPHLFHNQSVLAEQMALNKKFAVEHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 KFFHTGTNAEDAGDDLLLSYVKEFWWFPHMWSHMQPHLFHNQSVLAEQMALNKKFAVEHG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 IPTDMGYAVAPHHSGVYPVHVQLYEAWKQVWSIRVTSTEEYPHLKPARYRRGFIHNGIMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 IPTDMGYAVAPHHSGVYPVHVQLYEAWKQVWSIRVTSTEEYPHLKPARYRRGFIHNGIMV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 LPRQTCGLFTHTIFYNEYPGGSSELDKIINGGELFLTVLLNPISIFMTHLSNYGNDRLGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 LPRQTCGLFTHTIFYNEYPGGSSELDKIINGGELFLTVLLNPISIFMTHLSNYGNDRLGL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 YTFKHLVRFLHSWTNLRLQTLPPVQLAQKYFQIFSEEKDPLWQDPCEDKRHKDIWSKEKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 YTFKHLVRFLHSWTNLRLQTLPPVQLAQKYFQIFSEEKDPLWQDPCEDKRHKDIWSKEKT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 CDRFPKLLIIGPQKTGTTALYLFLGMHPDLSSNYPSSETFEEIQFFNGHNYHKGIDWYME :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 CDRFPKLLIIGPQKTGTTALYLFLGMHPDLSSNYPSSETFEEIQFFNGHNYHKGIDWYME 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 FFPIPSNTTSDFYFEKSANYFDSEVAPRRAAALLPKAKVLTILINPADRAYSWYQHQRAH :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 FFPIPSNTTSDFYFEKSANYFDSEVAPRRAAALLPKAKVLTILINPADRAYSWY------ 670 680 690 700 710 730 740 750 760 770 780 pF1KE2 DDPVALKYTFHEVITAGSDASSKLRALQNRCLVPGWYATHIERWLSAYHANQILVLDGKL ::::::::: CCDS75 ---------------------------------------------------QILVLDGKL 720 790 800 810 820 830 840 pF1KE2 LRTEPAKVMDMVQKFLGVTNTIDYHKTLAFDPKKGFWCQLLEGGKTKCLGKSKGRKYPEM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 LRTEPAKVMDMVQKFLGVTNTIDYHKTLAFDPKKGFWCQLLEGGKTKCLGKSKGRKYPEM 730 740 750 760 770 780 850 860 870 880 pF1KE2 DLDSRAFLKDYYRDHNIELSKLLYKMGQTLPTWLREDLQNTR :::::::::::::::::::::::::::::::::::::::::: CCDS75 DLDSRAFLKDYYRDHNIELSKLLYKMGQTLPTWLREDLQNTR 790 800 810 820 >>CCDS3706.1 NDST4 gene_id:64579|Hs108|chr4 (872 aa) initn: 4383 init1: 3485 opt: 4413 Z-score: 4866.9 bits: 911.7 E(32554): 0 Smith-Waterman score: 4414; 70.6% identity (88.0% similar) in 883 aa overlap (1-882:1-872) 10 20 30 40 50 pF1KE2 MPALACLRRLCRHVSPQAVLFLLFIFCLFSVFISAYYLY-GWKRGLEPSADAPEPDCGDP : .. ::: : ... :: ::: :. ::::.:: :.:. . . : .: : CCDS37 MNLIVKLRRSFR-----TLIVLLATFCLVSIVISAYFLYSGYKQEMTLIETTAEAECTDI 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 PPVAPSRLLPLKPVQAATPSRTDPLVLVFVESLYSQLGQEVVAILESSRFKYRTEIAPGK . : : . :: :. :.::: ::.:::: ::::::...::::::::.:. ::::: CCDS37 K-ILPYRSMELKTVKPIDTSKTDPTVLLFVESQYSQLGQDIIAILESSRFQYHMVIAPGK 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 GDMPTLTDKGRGRFALIIYENILKYVNLDAWNRELLDKYCVAYGVGIIGFFKANENSLLS ::.: :::.:.:...:.:::::::::..:.::::::.:::: :.:.:::: ::::::: : CCDS37 GDIPPLTDNGKGKYTLVIYENILKYVSMDSWNRELLEKYCVEYSVSIIGFHKANENSLPS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 AQLKGFPLFLHSNLGLKDCSINPKSPLLYVTRPSEVEKGVLPGEDWTVFQSNHSTYEPVL .::::::: : .::.:::: .::.::::..:. .:::: :::::::.:: :::::.::: CCDS37 TQLKGFPLNLFNNLALKDCFVNPQSPLLHITKAPKVEKGPLPGEDWTIFQYNHSTYQPVL 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 LAKTRSSESIPHLGADAGLHAALHATVVQDLGLHDGIQRVLFGNNLNFWLHKLVFVDAVA :.. .. .:. :.. . : :::.:::::::::::::::::::::::::.:.::.. CCDS37 LTELQTEKSLSSLSSKT-----LFATVIQDLGLHDGIQRVLFGNNLNFWLHKLIFIDAIS 240 250 260 270 280 300 310 320 330 340 350 pF1KE2 FLTGKRLSLPLDRYILVDIDDIFVGKEGTRMKVEDVKALFDTQNELRAHIPNFTFNLGYS ::.::::.: :::::::::::::::::::::.:.:::::..::: ::... :::::::.: CCDS37 FLSGKRLTLSLDRYILVDIDDIFVGKEGTRMNVKDVKALLETQNLLRTQVANFTFNLGFS 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE2 GKFFHTGTNAEDAGDDLLLSYVKEFWWFPHMWSHMQPHLFHNQSVLAEQMALNKKFAVEH :::.::::. :: :::::: : :::::::::::::::::::.: :.::: :::.::.:: CCDS37 GKFYHTGTEEEDEGDDLLLRSVDEFWWFPHMWSHMQPHLFHNESSLVEQMILNKEFALEH 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE2 GIPTDMGYAVAPHHSGVYPVHVQLYEAWKQVWSIRVTSTEEYPHLKPARYRRGFIHNGIM ::: .::::::::::::::::.::: :::.::.:.::::::::::::::::.:::::.:: CCDS37 GIPINMGYAVAPHHSGVYPVHIQLYAAWKKVWGIQVTSTEEYPHLKPARYRKGFIHNSIM 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE2 VLPRQTCGLFTHTIFYNEYPGGSSELDKIINGGELFLTVLLNPISIFMTHLSNYGNDRLG ::::::::::::::::.::::: .:::: : :::::::.::::::::::::::::::::: CCDS37 VLPRQTCGLFTHTIFYKEYPGGPQELDKSIRGGELFLTILLNPISIFMTHLSNYGNDRLG 470 480 490 500 510 520 540 550 560 570 580 590 pF1KE2 LYTFKHLVRFLHSWTNLRLQTLPPVQLAQKYFQIFSEEKDPLWQDPCEDKRHKDIWSKEK :::: .:: :..:::::.::::::::::..::..: :.::::::.::.:::::::::.:: CCDS37 LYTFVNLVNFVQSWTNLKLQTLPPVQLAHQYFELFPEQKDPLWQNPCDDKRHKDIWSREK 530 540 550 560 570 580 600 610 620 630 640 650 pF1KE2 TCDRFPKLLIIGPQKTGTTALYLFLGMHPDLSSNYPSSETFEEIQFFNGHNYHKGIDWYM :::..::.:.::::::::::::::: :::.. :: :: .::::.:::::.:::::::::: CCDS37 TCDHLPKFLVIGPQKTGTTALYLFLLMHPSIISNLPSPKTFEEVQFFNGNNYHKGIDWYM 590 600 610 620 630 640 660 670 680 690 700 710 pF1KE2 EFFPIPSNTTSDFYFEKSANYFDSEVAPRRAAALLPKAKVLTILINPADRAYSWYQHQRA .::: :::::::: :::::::: :: ::::::.:.::::..::::.:.:::::::::::. CCDS37 DFFPTPSNTTSDFLFEKSANYFHSEEAPRRAASLVPKAKIITILIDPSDRAYSWYQHQRS 650 660 670 680 690 700 720 730 740 750 760 770 pF1KE2 HDDPVALKYTFHEVITAGSDASSKLRALQNRCLVPGWYATHIERWLSAYHANQILVLDGK :.::.::...:.:::..: : : :..:: :::::::::.::::::. . ..:.:..::. CCDS37 HEDPAALRFNFYEVISTGHWAPSDLKTLQRRCLVPGWYAVHIERWLTYFATSQLLIIDGQ 710 720 730 740 750 760 780 790 800 810 820 830 pF1KE2 LLRTEPAKVMDMVQKFLGVTNTIDYHKTLAFDPKKGFWCQLLEGGKTKCLGKSKGRKYPE ::..:: ::: :::::::: .: ..:.:::.::::::::::::::::::::::::: CCDS37 QLRSDPATVMDEVQKFLGVTPRYNYSEALTFDPQKGFWCQLLEGGKTKCLGKSKGRKYPP 770 780 790 800 810 820 840 850 860 870 880 pF1KE2 MDLDSRAFLKDYYRDHNIELSKLLYKMGQTLPTWLREDLQNTR :: .::.::..::::::.::::::...:: ::.:::..::..: CCDS37 MDPESRTFLSNYYRDHNVELSKLLHRLGQPLPSWLRQELQKVR 830 840 850 860 870 >>CCDS3708.1 NDST3 gene_id:9348|Hs108|chr4 (873 aa) initn: 4335 init1: 3476 opt: 4409 Z-score: 4862.4 bits: 910.8 E(32554): 0 Smith-Waterman score: 4409; 70.6% identity (88.6% similar) in 881 aa overlap (4-882:1-873) 10 20 30 40 50 pF1KE2 MPALACLRRLCRHVSPQAVLFLLFIFCLFSVFISAYYLY-GWKRGLEPSADAPEPDCGDP .. . .: :: : ...:: ::. :..::::::: :.:. : : : : :::: CCDS37 MSFIMKLHRHF--QRTVILLATFCMVSIIISAYYLYSGYKQENELSETASEVDCGDL 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 PPVAPSRLLPLKPVQAATPSRTDPLVLVFVESLYSQLGQEVVAILESSRFKYRTEIAPGK . : .:. .: .. ::::: ::::::: ::.:::... :::::::.:. :::::: CCDS37 QHL-PYQLMEVKAMKLFDASRTDPTVLVFVESQYSSLGQDIIMILESSRFQYHIEIAPGK 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 GDMPTLTDKGRGRFALIIYENILKYVNLDAWNRELLDKYCVAYGVGIIGFFKANENSLLS ::.:.: :: .:.. ::::::::::.:.:.::: ::::::: ::::.::: :..:.:. : CCDS37 GDLPVLIDKMKGKYILIIYENILKYINMDSWNRSLLDKYCVEYGVGVIGFHKTSEKSVQS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 AQLKGFPLFLHSNLGLKDCSINPKSPLLYVTRPSEVEKGVLPGEDWTVFQSNHSTYEPVL ::::::. ...::..::: :::.:::. ::. :..::: ::: :::::: :::.:.::. CCDS37 FQLKGFPFSIYGNLAVKDCCINPHSPLIRVTKSSKLEKGSLPGTDWTVFQINHSAYQPVI 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 LAKTRSSESI-PHLGADAGLHAALHATVVQDLGLHDGIQRVLFGNNLNFWLHKLVFVDAV .::... :.. : .. ..:..::...::::::::::::::::::::::::.:.::. CCDS37 FAKVKTPENLSPSIS-----KGAFYATIIHDLGLHDGIQRVLFGNNLNFWLHKLIFIDAI 240 250 260 270 280 300 310 320 330 340 350 pF1KE2 AFLTGKRLSLPLDRYILVDIDDIFVGKEGTRMKVEDVKALFDTQNELRAHIPNFTFNLGY .::.::::.: :::::::::::::::::::::...:::::.:::: :::.: :::::::. CCDS37 SFLSGKRLTLSLDRYILVDIDDIFVGKEGTRMNTNDVKALLDTQNLLRAQITNFTFNLGF 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE2 SGKFFHTGTNAEDAGDDLLLSYVKEFWWFPHMWSHMQPHLFHNQSVLAEQMALNKKFAVE ::::.::::. :: ::: ::. : :::::::::::::::::::.: :.::: ::::::.: CCDS37 SGKFYHTGTEEEDEGDDCLLGSVDEFWWFPHMWSHMQPHLFHNESSLVEQMILNKKFALE 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE2 HGIPTDMGYAVAPHHSGVYPVHVQLYEAWKQVWSIRVTSTEEYPHLKPARYRRGFIHNGI ::::::::::::::::::::::::::::::.::.:..::::::::::::::::::::..: CCDS37 HGIPTDMGYAVAPHHSGVYPVHVQLYEAWKKVWNIKITSTEEYPHLKPARYRRGFIHKNI 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE2 MVLPRQTCGLFTHTIFYNEYPGGSSELDKIINGGELFLTVLLNPISIFMTHLSNYGNDRL :::::::::::::::::.::::: .:::: :.:::::.::.::::::::::::::::::: CCDS37 MVLPRQTCGLFTHTIFYKEYPGGPKELDKSIQGGELFFTVVLNPISIFMTHLSNYGNDRL 470 480 490 500 510 520 540 550 560 570 580 590 pF1KE2 GLYTFKHLVRFLHSWTNLRLQTLPPVQLAQKYFQIFSEEKDPLWQDPCEDKRHKDIWSKE ::::: .:. :..::::::::::::::::.:::..: ..::::::.::.::::.:::::: CCDS37 GLYTFVNLANFVKSWTNLRLQTLPPVQLAHKYFELFPDQKDPLWQNPCDDKRHRDIWSKE 530 540 550 560 570 580 600 610 620 630 640 650 pF1KE2 KTCDRFPKLLIIGPQKTGTTALYLFLGMHPDLSSNYPSSETFEEIQFFNGHNYHKGIDWY :::::.::.:.::::::::::::::: :::.. :: :: .::::.:::: .:::.::::: CCDS37 KTCDRLPKFLVIGPQKTGTTALYLFLVMHPSILSNSPSPKTFEEVQFFNRNNYHRGIDWY 590 600 610 620 630 640 660 670 680 690 700 710 pF1KE2 MEFFPIPSNTTSDFYFEKSANYFDSEVAPRRAAALLPKAKVLTILINPADRAYSWYQHQR :.:::.:::.:.:: :::::::: :: ::.:::.:.::::..::::.:.::::::::::: CCDS37 MDFFPVPSNVTTDFLFEKSANYFHSEEAPKRAASLVPKAKIITILIDPSDRAYSWYQHQR 650 660 670 680 690 700 720 730 740 750 760 770 pF1KE2 AHDDPVALKYTFHEVITAGSDASSKLRALQNRCLVPGWYATHIERWLSAYHANQILVLDG .:.::.:::..:.:::.:: : :.:::::.:::::::::.:::::: . :.:..:: CCDS37 SHEDPAALKFSFYEVISAGPRAPSELRALQKRCLVPGWYASHIERWLVYFPPFQLLIIDG 710 720 730 740 750 760 780 790 800 810 820 830 pF1KE2 KLLRTEPAKVMDMVQKFLGVTNTIDYHKTLAFDPKKGFWCQLLEGGKTKCLGKSKGRKYP . :::.:: ::: ::::::: .: ..:.:: .::::::::: ::::::::::::::: CCDS37 QQLRTDPATVMDEVQKFLGVLPHYNYSEALTFDSHKGFWCQLLEEGKTKCLGKSKGRKYP 770 780 790 800 810 820 840 850 860 870 880 pF1KE2 EMDLDSRAFLKDYYRDHNIELSKLLYKMGQTLPTWLREDLQNTR :: :::.::..::::::.::::::.:.:: ::.:::..::..: CCDS37 PMDSDSRTFLSSYYRDHNVELSKLLHKLGQPLPSWLRQELQKVR 830 840 850 860 870 >>CCDS7335.1 NDST2 gene_id:8509|Hs108|chr10 (883 aa) initn: 4364 init1: 3439 opt: 4392 Z-score: 4843.6 bits: 907.4 E(32554): 0 Smith-Waterman score: 4392; 70.7% identity (88.6% similar) in 878 aa overlap (9-881:9-880) 10 20 30 40 50 pF1KE2 MPALACLRRLCRHVSPQAVLFLLFIFCLFSVFISAYYLYGWKRGLEPSADAPEPDCGD-- : :.. . ...::. : : :. . :::. .. :: : ::.. CCDS73 MLQLWKVVRPARQLELHRLILLLIAFSLGSMGFLAYYVSTSPKAKEP-LPLPLGDCSSGG 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 ---PPPVAPSRLLPLKPVQAATPSRTDPLVLVFVESLYSQLGQEVVAILESSRFKYRTEI : :. : .: .: . .::.:.::::::: :::::::.:::::::::.: ::. CCDS73 AAGPGPARPP--VPPRPPRPPETARTEPVVLVFVESAYSQLGQEIVAILESSRFRYSTEL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 APGKGDMPTLTDKGRGRFALIIYENILKYVNLDAWNRELLDKYCVAYGVGIIGFFKANEN :::.::::::::. .::..:.::::.:::::::::.:::::.::: :::::::::.:.:. CCDS73 APGRGDMPTLTDNTHGRYVLVIYENLLKYVNLDAWSRELLDRYCVEYGVGIIGFFRAHEH 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 SLLSAQLKGFPLFLHSNLGLKDCSINPKSPLLYVTRPSEVEKGVLPGEDWTVFQSNHSTY ::::::::::::::::::::.: ..::..:::..::::..: : :::.:::.:::::::: CCDS73 SLLSAQLKGFPLFLHSNLGLRDYQVNPSAPLLHLTRPSRLEPGPLPGDDWTIFQSNHSTY 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 EPVLLAKTRSSESIPHLGADAGLHAALHATVVQDLGLHDGIQRVLFGNNLNFWLHKLVFV ::::::. : .: : . . . :. : ::::::::::::::::::..:.::::::.:: CCDS73 EPVLLASLRPAE--PAVPGPV-LRRARLPTVVQDLGLHDGIQRVLFGHGLSFWLHKLIFV 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 DAVAFLTGKRLSLPLDRYILVDIDDIFVGKEGTRMKVEDVKALFDTQNELRAHIPNFTFN ::::.:::::: : ::::::::::::::::::::::: ::.::. :::.::. .:::::: CCDS73 DAVAYLTGKRLCLDLDRYILVDIDDIFVGKEGTRMKVADVEALLTTQNKLRTLVPNFTFN 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 LGYSGKFFHTGTNAEDAGDDLLLSYVKEFWWFPHMWSHMQPHLFHNQSVLAEQMALNKKF ::.::::.::::. ::::::.::.. ::::::::::::::::::::.::::.:: :::.: CCDS73 LGFSGKFYHTGTEEEDAGDDMLLKHRKEFWWFPHMWSHMQPHLFHNRSVLADQMRLNKQF 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE2 AVEHGIPTDMGYAVAPHHSGVYPVHVQLYEAWKQVWSIRVTSTEEYPHLKPARYRRGFIH :.:::::::.:::::::::::::.:.:::::::.::.:.::::::::::.:::::::::: CCDS73 ALEHGIPTDLGYAVAPHHSGVYPIHTQLYEAWKSVWGIQVTSTEEYPHLRPARYRRGFIH 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE2 NGIMVLPRQTCGLFTHTIFYNEYPGGSSELDKIINGGELFLTVLLNPISIFMTHLSNYGN ::::::::::::::::::::::::::: :::. : ::::::::::::::::::::::::: CCDS73 NGIMVLPRQTCGLFTHTIFYNEYPGGSRELDRSIRGGELFLTVLLNPISIFMTHLSNYGN 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE2 DRLGLYTFKHLVRFLHSWTNLRLQTLPPVQLAQKYFQIFSEEKDPLWQDPCEDKRHKDIW ::::::::. :::::. :: ::::::::: ::::::..: .:..::::.::.:::::::: CCDS73 DRLGLYTFESLVRFLQCWTRLRLQTLPPVPLAQKYFELFPQERSPLWQNPCDDKRHKDIW 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE2 SKEKTCDRFPKLLIIGPQKTGTTALYLFLGMHPDLSSNYPSSETFEEIQFFNGHNYHKGI ::::::::.::.::.:::::::::...::..:: ..:..:: :::::::::. :::::: CCDS73 SKEKTCDRLPKFLIVGPQKTGTTAIHFFLSLHPAVTSSFPSPSTFEEIQFFNSPNYHKGI 600 610 620 630 640 650 660 670 680 690 700 710 pF1KE2 DWYMEFFPIPSNTTSDFYFEKSANYFDSEVAPRRAAALLPKAKVLTILINPADRAYSWYQ ::::.:::.:::...:: :::::.::::::.:::.:::::.::..:.: ::::::::::: CCDS73 DWYMDFFPVPSNASTDFLFEKSATYFDSEVVPRRGAALLPRAKIITVLTNPADRAYSWYQ 660 670 680 690 700 710 720 730 740 750 760 770 pF1KE2 HQRAHDDPVALKYTFHEVITAGSDASSKLRALQNRCLVPGWYATHIERWLSAYHANQILV ::::: :::::.:::..::.:.:.. ::.:::::::::.:.::..:::. : ..:.:. CCDS73 HQRAHGDPVALNYTFYQVISASSQTPLALRSLQNRCLVPGYYSTHLQRWLTYYPSGQLLI 720 730 740 750 760 770 780 790 800 810 820 830 pF1KE2 LDGKLLRTEPAKVMDMVQKFLGVTNTIDYHKTLAFDPKKGFWCQLLEGGKTKCLGKSKGR .::. :::.:: :. .:::::.: ..: .:: :: :::::: ::::::.:::.:::: CCDS73 VDGQELRTNPAASMESIQKFLGITPFLNYTRTLRFDDDKGFWCQGLEGGKTRCLGRSKGR 780 790 800 810 820 830 840 850 860 870 880 pF1KE2 KYPEMDLDSRAFLKDYYRDHNIELSKLLYKMGQTLPTWLREDLQNTR .::.:: .:: :: :..:.::.:::::: ..:: .:.::::.::.. CCDS73 RYPDMDTESRLFLTDFFRNHNLELSKLLSRLGQPVPSWLREELQHSSLG 840 850 860 870 880 >>CCDS81476.1 NDST2 gene_id:8509|Hs108|chr10 (815 aa) initn: 3958 init1: 3033 opt: 3990 Z-score: 4400.4 bits: 825.2 E(32554): 0 Smith-Waterman score: 3990; 71.2% identity (88.5% similar) in 801 aa overlap (9-804:9-803) 10 20 30 40 50 pF1KE2 MPALACLRRLCRHVSPQAVLFLLFIFCLFSVFISAYYLYGWKRGLEPSADAPEPDCGD-- : :.. . ...::. : : :. . :::. .. :: : ::.. CCDS81 MLQLWKVVRPARQLELHRLILLLIAFSLGSMGFLAYYVSTSPKAKEP-LPLPLGDCSSGG 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 ---PPPVAPSRLLPLKPVQAATPSRTDPLVLVFVESLYSQLGQEVVAILESSRFKYRTEI : :. : .: .: . .::.:.::::::: :::::::.:::::::::.: ::. CCDS81 AAGPGPARPP--VPPRPPRPPETARTEPVVLVFVESAYSQLGQEIVAILESSRFRYSTEL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 APGKGDMPTLTDKGRGRFALIIYENILKYVNLDAWNRELLDKYCVAYGVGIIGFFKANEN :::.::::::::. .::..:.::::.:::::::::.:::::.::: :::::::::.:.:. CCDS81 APGRGDMPTLTDNTHGRYVLVIYENLLKYVNLDAWSRELLDRYCVEYGVGIIGFFRAHEH 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 SLLSAQLKGFPLFLHSNLGLKDCSINPKSPLLYVTRPSEVEKGVLPGEDWTVFQSNHSTY ::::::::::::::::::::.: ..::..:::..::::..: : :::.:::.:::::::: CCDS81 SLLSAQLKGFPLFLHSNLGLRDYQVNPSAPLLHLTRPSRLEPGPLPGDDWTIFQSNHSTY 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 EPVLLAKTRSSESIPHLGADAGLHAALHATVVQDLGLHDGIQRVLFGNNLNFWLHKLVFV ::::::. : .: : . . . :. : ::::::::::::::::::..:.::::::.:: CCDS81 EPVLLASLRPAE--PAVPGPV-LRRARLPTVVQDLGLHDGIQRVLFGHGLSFWLHKLIFV 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 DAVAFLTGKRLSLPLDRYILVDIDDIFVGKEGTRMKVEDVKALFDTQNELRAHIPNFTFN ::::.:::::: : ::::::::::::::::::::::: ::.::. :::.::. .:::::: CCDS81 DAVAYLTGKRLCLDLDRYILVDIDDIFVGKEGTRMKVADVEALLTTQNKLRTLVPNFTFN 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 LGYSGKFFHTGTNAEDAGDDLLLSYVKEFWWFPHMWSHMQPHLFHNQSVLAEQMALNKKF ::.::::.::::. ::::::.::.. ::::::::::::::::::::.::::.:: :::.: CCDS81 LGFSGKFYHTGTEEEDAGDDMLLKHRKEFWWFPHMWSHMQPHLFHNRSVLADQMRLNKQF 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE2 AVEHGIPTDMGYAVAPHHSGVYPVHVQLYEAWKQVWSIRVTSTEEYPHLKPARYRRGFIH :.:::::::.:::::::::::::.:.:::::::.::.:.::::::::::.:::::::::: CCDS81 ALEHGIPTDLGYAVAPHHSGVYPIHTQLYEAWKSVWGIQVTSTEEYPHLRPARYRRGFIH 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE2 NGIMVLPRQTCGLFTHTIFYNEYPGGSSELDKIINGGELFLTVLLNPISIFMTHLSNYGN ::::::::::::::::::::::::::: :::. : ::::::::::::::::::::::::: CCDS81 NGIMVLPRQTCGLFTHTIFYNEYPGGSRELDRSIRGGELFLTVLLNPISIFMTHLSNYGN 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE2 DRLGLYTFKHLVRFLHSWTNLRLQTLPPVQLAQKYFQIFSEEKDPLWQDPCEDKRHKDIW ::::::::. :::::. :: ::::::::: ::::::..: .:..::::.::.:::::::: CCDS81 DRLGLYTFESLVRFLQCWTRLRLQTLPPVPLAQKYFELFPQERSPLWQNPCDDKRHKDIW 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE2 SKEKTCDRFPKLLIIGPQKTGTTALYLFLGMHPDLSSNYPSSETFEEIQFFNGHNYHKGI ::::::::.::.::.:::::::::...::..:: ..:..:: :::::::::. :::::: CCDS81 SKEKTCDRLPKFLIVGPQKTGTTAIHFFLSLHPAVTSSFPSPSTFEEIQFFNSPNYHKGI 600 610 620 630 640 650 660 670 680 690 700 710 pF1KE2 DWYMEFFPIPSNTTSDFYFEKSANYFDSEVAPRRAAALLPKAKVLTILINPADRAYSWYQ ::::.:::.:::...:: :::::.::::::.:::.:::::.::..:.: ::::::::::: CCDS81 DWYMDFFPVPSNASTDFLFEKSATYFDSEVVPRRGAALLPRAKIITVLTNPADRAYSWYQ 660 670 680 690 700 710 720 730 740 750 760 770 pF1KE2 HQRAHDDPVALKYTFHEVITAGSDASSKLRALQNRCLVPGWYATHIERWLSAYHANQILV ::::: :::::.:::..::.:.:.. ::.:::::::::.:.::..:::. : ..:.:. CCDS81 HQRAHGDPVALNYTFYQVISASSQTPLALRSLQNRCLVPGYYSTHLQRWLTYYPSGQLLI 720 730 740 750 760 770 780 790 800 810 820 830 pF1KE2 LDGKLLRTEPAKVMDMVQKFLGVTNTIDYHKTLAFDPKKGFWCQLLEGGKTKCLGKSKGR .::. :::.:: :. .:::::. :. CCDS81 VDGQELRTNPAASMESIQKFLGLMMIRDFGARDLKVVRLAV 780 790 800 810 >>CCDS53995.1 HS3ST4 gene_id:9951|Hs108|chr16 (456 aa) initn: 412 init1: 122 opt: 375 Z-score: 413.5 bits: 86.7 E(32554): 1e-16 Smith-Waterman score: 430; 32.0% identity (60.1% similar) in 281 aa overlap (603-877:196-453) 580 590 600 610 620 630 pF1KE2 IFSEEKDPLWQDPCEDKRHKDIWSKEKTCDRFPKLLIIGPQKTGTTALYLFLGMHPDLSS ..:. :::: .: :: :: . .:::. . CCDS53 TTDEDLAGRRAANGSSERGGAVSTPDYGEKKLPQALIIGVKKGGTRALLEAIRVHPDVRA 170 180 190 200 210 220 640 650 660 670 680 690 pF1KE2 NYPSSETFEEIQFFNGHNYHKGIDWYMEFFPIPSNTTSDFYFEKSANYFDSEVAPRRAAA . : .::. .::.::..:: . .:.. ... .::. .:: .. ::.: . CCDS53 ------VGVEPHFFD-RNYEKGLEWYRNV--MPKTLDGQITMEKTPSYFVTNEAPKRIHS 230 240 250 260 270 700 710 720 730 740 pF1KE2 LLPKAKVLTILINPADRAYSWYQH--QRAHDDPVALKYTFHEVITAGSDAS-SKLRALQN . :..... ::. :: : : . .. . :. .:.. . ::: : .: CCDS53 MAKDIKLIVVVRNPVTRAISDYTQTLSKKPEIPTFEVLAFKNRTLGLIDASWSAIRI--- 280 290 300 310 320 330 750 760 770 780 790 800 pF1KE2 RCLVPGWYATHIERWLSAYHANQILVLDGKLLRTEPAKVMDMVQKFLGVTNTIDYHKTLA : :: :.: ::. . .::: ..:. : ..:: : :: :::. .. .: . CCDS53 -----GIYALHLENWLQYFPLSQILFVSGERLIVDPAGEMAKVQDFLGLKRVVT-EKHFY 340 350 360 370 380 810 820 830 840 850 860 pF1KE2 FDPKKGFWC--QLLEGGKTKCLGKSKGRKYPEMDLDSRAFLKDYYRDHNIELSKLLYKM- :. ::: : . ... .:::::::: .:..: : :. .:. :. ..:.: CCDS53 FNKTKGFPCLKKPEDSSAPRCLGKSKGRTHPRIDPDVIHRLRKFYKPFNL----MFYQMT 390 400 410 420 430 440 870 880 pF1KE2 GQTLPTWLREDLQNTR :: . : .:. CCDS53 GQDFQ-WEQEEGDK 450 >>CCDS11167.1 HS3ST3B1 gene_id:9953|Hs108|chr17 (390 aa) initn: 390 init1: 122 opt: 370 Z-score: 409.1 bits: 85.7 E(32554): 1.8e-16 Smith-Waterman score: 436; 33.2% identity (61.9% similar) in 265 aa overlap (603-862:136-382) 580 590 600 610 620 630 pF1KE2 IFSEEKDPLWQDPCEDKRHKDIWSKEKTCDRFPKLLIIGPQKTGTTALYLFLGMHPDLSS ..:. .::: .: :: :: :: .:::. . CCDS11 EGAASPEEQSPEVPDSPSPISSFFSGSGSKQLPQAIIIGVKKGGTRALLEFLRVHPDVRA 110 120 130 140 150 160 640 650 660 670 680 690 pF1KE2 NYPSSETFEEIQFFNGHNYHKGIDWYMEFFPIPSNTTSDFYFEKSANYFDSEVAPRRAAA . : .::. ..: ::. :: .. .: . ... .::. .:: .. :: : .: CCDS11 ------VGAEPHFFD-RSYDKGLAWYRDL--MPRTLDGQITMEKTPSYFVTREAPARISA 170 180 190 200 210 700 710 720 730 740 750 pF1KE2 LLPKAKVLTILINPADRAYSWYQH--QRAHDDPVALKYTFHEVITAGSDASSKLRALQNR . .:..... .:. :: : : . .. : :. . ::.. ::: ... :.: CCDS11 MSKDTKLIVVVRDPVTRAISDYTQTLSKRPDIPTFESLTFKNR-TAGL-IDTSWSAIQI- 220 230 240 250 260 270 760 770 780 790 800 pF1KE2 CLVPGWYATHIERWLSAYHANQILVLDGKLLRTEPAKVMDMVQKFLGVTNTI-DYHKTLA : :: :.:.:: . :.: ..:. : ..:: . :: :::. : : : . CCDS11 ----GIYAKHLEHWLRHFPIRQMLFVSGERLISDPAGELGRVQDFLGLKRIITDKH--FY 280 290 300 310 320 810 820 830 840 850 860 pF1KE2 FDPKKGFWC-QLLEGG-KTKCLGKSKGRKYPEMDLDSRAFLKDYYRDHNIELSKLLYKMG :. ::: : . ::. . .::::.::: .::.: . :...:: :... .. CCDS11 FNKTKGFPCLKKAEGSSRPHCLGKTKGRTHPEIDREVVRRLREFYRPFNLKFYQMTGHDF 330 340 350 360 370 380 870 880 pF1KE2 QTLPTWLREDLQNTR CCDS11 GWD 390 >>CCDS11165.1 HS3ST3A1 gene_id:9955|Hs108|chr17 (406 aa) initn: 390 init1: 122 opt: 370 Z-score: 408.8 bits: 85.7 E(32554): 1.9e-16 Smith-Waterman score: 436; 33.2% identity (61.9% similar) in 265 aa overlap (603-862:151-397) 580 590 600 610 620 630 pF1KE2 IFSEEKDPLWQDPCEDKRHKDIWSKEKTCDRFPKLLIIGPQKTGTTALYLFLGMHPDLSS ..:. .::: .: :: :: :: .:::. . CCDS11 SGGPGGSGAGSTVAEAPPGTLALLLDEGSKQLPQAIIIGVKKGGTRALLEFLRVHPDVRA 130 140 150 160 170 180 640 650 660 670 680 690 pF1KE2 NYPSSETFEEIQFFNGHNYHKGIDWYMEFFPIPSNTTSDFYFEKSANYFDSEVAPRRAAA . : .::. ..: ::. :: .. .: . ... .::. .:: .. :: : .: CCDS11 ------VGAEPHFFD-RSYDKGLAWYRDL--MPRTLDGQITMEKTPSYFVTREAPARISA 190 200 210 220 230 700 710 720 730 740 750 pF1KE2 LLPKAKVLTILINPADRAYSWYQH--QRAHDDPVALKYTFHEVITAGSDASSKLRALQNR . .:..... .:. :: : : . .. : :. . ::.. ::: ... :.: CCDS11 MSKDTKLIVVVRDPVTRAISDYTQTLSKRPDIPTFESLTFKNR-TAGL-IDTSWSAIQI- 240 250 260 270 280 760 770 780 790 800 pF1KE2 CLVPGWYATHIERWLSAYHANQILVLDGKLLRTEPAKVMDMVQKFLGVTNTI-DYHKTLA : :: :.:.:: . :.: ..:. : ..:: . :: :::. : : : . CCDS11 ----GIYAKHLEHWLRHFPIRQMLFVSGERLISDPAGELGRVQDFLGLKRIITDKH--FY 290 300 310 320 330 340 810 820 830 840 850 860 pF1KE2 FDPKKGFWC-QLLEGG-KTKCLGKSKGRKYPEMDLDSRAFLKDYYRDHNIELSKLLYKMG :. ::: : . ::. . .::::.::: .::.: . :...:: :... .. CCDS11 FNKTKGFPCLKKAEGSSRPHCLGKTKGRTHPEIDREVVRRLREFYRPFNLKFYQMTGHDF 350 360 370 380 390 400 870 880 pF1KE2 QTLPTWLREDLQNTR CCDS11 GWDG >>CCDS10606.1 HS3ST2 gene_id:9956|Hs108|chr16 (367 aa) initn: 328 init1: 105 opt: 359 Z-score: 397.3 bits: 83.4 E(32554): 8.2e-16 Smith-Waterman score: 425; 32.9% identity (57.8% similar) in 277 aa overlap (603-873:113-366) 580 590 600 610 620 630 pF1KE2 IFSEEKDPLWQDPCEDKRHKDIWSKEKTCDRFPKLLIIGPQKTGTTALYLFLGMHPDLSS :.:. ::.: .: :: :. :. .:::. . CCDS10 PSAPSAPAAAVPAPRLSGSNHSGSPKLGTKRLPQALIVGVKKGGTRAVLEFIRVHPDVRA 90 100 110 120 130 140 640 650 660 670 680 690 pF1KE2 NYPSSETFEEIQFFNGHNYHKGIDWYMEFFPIPSNTTSDFYFEKSANYFDSEVAPRRAAA : .::. .:: .:.::: . .: . :.. .::. .:: .. :::: CCDS10 ------LGTEPHFFD-RNYGRGLDWYRSL--MPRTLESQITLEKTPSYFVTQEAPRRIFN 150 160 170 180 190 700 710 720 730 740 pF1KE2 LLPKAKVLTILINPADRAYSWYQH--QRAHDDPVALKYTFHEVITAGSDAS-SKLRALQN . .:..... ::. :: : : . .. : :. .:.. . :.: . .: CCDS10 MSRDTKLIVVVRNPVTRAISDYTQTLSKKPDIPTFEGLSFRNRTLGLVDVSWNAIRI--- 200 210 220 230 240 250 750 760 770 780 790 800 pF1KE2 RCLVPGWYATHIERWLSAYHANQILVLDGKLLRTEPAKVMDMVQKFLGVTNTI-DYHKTL : :. :.: ::. . :: ..:. : :.:: : :: :::. : : : . CCDS10 -----GMYVLHLESWLQYFPLAQIHFVSGERLITDPAGEMGRVQDFLGIKRFITDKH--F 260 270 280 290 300 810 820 830 840 850 860 pF1KE2 AFDPKKGFWC-QLLEGGKT-KCLGKSKGRKYPEMDLDSRAFLKDYYRDHNIELSKLLYKM :. ::: : . :.. .:::::::: . ..: . :...:: .:: :. . CCDS10 YFNKTKGFPCLKKTESSLLPRCLGKSKGRTHVQIDPEVIDQLREFYRPYNI---KFYETV 310 320 330 340 350 360 870 880 pF1KE2 GQTLPTWLREDLQNTR :: . : CCDS10 GQDF-RWE 882 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 21:45:44 2016 done: Sun Nov 6 21:45:44 2016 Total Scan time: 2.950 Total Display time: 0.180 Function used was FASTA [36.3.4 Apr, 2011]