FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2163, 882 aa
1>>>pF1KE2163 882 - 882 aa - 882 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.0689+/-0.000956; mu= 17.5625+/- 0.058
mean_var=82.0576+/-16.641, 0's: 0 Z-trim(106.6): 18 B-trim: 56 in 1/50
Lambda= 0.141584
statistics sampled from 9036 (9049) to 9036 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.632), E-opt: 0.2 (0.278), width: 16
Scan time: 2.950
The best scores are: opt bits E(32554)
CCDS34277.1 NDST1 gene_id:3340|Hs108|chr5 ( 882) 6045 1245.0 0
CCDS75358.1 NDST1 gene_id:3340|Hs108|chr5 ( 825) 4901 1011.3 0
CCDS3706.1 NDST4 gene_id:64579|Hs108|chr4 ( 872) 4413 911.7 0
CCDS3708.1 NDST3 gene_id:9348|Hs108|chr4 ( 873) 4409 910.8 0
CCDS7335.1 NDST2 gene_id:8509|Hs108|chr10 ( 883) 4392 907.4 0
CCDS81476.1 NDST2 gene_id:8509|Hs108|chr10 ( 815) 3990 825.2 0
CCDS53995.1 HS3ST4 gene_id:9951|Hs108|chr16 ( 456) 375 86.7 1e-16
CCDS11167.1 HS3ST3B1 gene_id:9953|Hs108|chr17 ( 390) 370 85.7 1.8e-16
CCDS11165.1 HS3ST3A1 gene_id:9955|Hs108|chr17 ( 406) 370 85.7 1.9e-16
CCDS10606.1 HS3ST2 gene_id:9956|Hs108|chr16 ( 367) 359 83.4 8.2e-16
CCDS34517.1 HS3ST5 gene_id:222537|Hs108|chr6 ( 346) 355 82.6 1.4e-15
CCDS45381.2 HS3ST6 gene_id:64711|Hs108|chr16 ( 342) 337 78.9 1.7e-14
>>CCDS34277.1 NDST1 gene_id:3340|Hs108|chr5 (882 aa)
initn: 6045 init1: 6045 opt: 6045 Z-score: 6668.4 bits: 1245.0 E(32554): 0
Smith-Waterman score: 6045; 100.0% identity (100.0% similar) in 882 aa overlap (1-882:1-882)
10 20 30 40 50 60
pF1KE2 MPALACLRRLCRHVSPQAVLFLLFIFCLFSVFISAYYLYGWKRGLEPSADAPEPDCGDPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MPALACLRRLCRHVSPQAVLFLLFIFCLFSVFISAYYLYGWKRGLEPSADAPEPDCGDPP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 PVAPSRLLPLKPVQAATPSRTDPLVLVFVESLYSQLGQEVVAILESSRFKYRTEIAPGKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PVAPSRLLPLKPVQAATPSRTDPLVLVFVESLYSQLGQEVVAILESSRFKYRTEIAPGKG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 DMPTLTDKGRGRFALIIYENILKYVNLDAWNRELLDKYCVAYGVGIIGFFKANENSLLSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 DMPTLTDKGRGRFALIIYENILKYVNLDAWNRELLDKYCVAYGVGIIGFFKANENSLLSA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 QLKGFPLFLHSNLGLKDCSINPKSPLLYVTRPSEVEKGVLPGEDWTVFQSNHSTYEPVLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 QLKGFPLFLHSNLGLKDCSINPKSPLLYVTRPSEVEKGVLPGEDWTVFQSNHSTYEPVLL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 AKTRSSESIPHLGADAGLHAALHATVVQDLGLHDGIQRVLFGNNLNFWLHKLVFVDAVAF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 AKTRSSESIPHLGADAGLHAALHATVVQDLGLHDGIQRVLFGNNLNFWLHKLVFVDAVAF
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 LTGKRLSLPLDRYILVDIDDIFVGKEGTRMKVEDVKALFDTQNELRAHIPNFTFNLGYSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LTGKRLSLPLDRYILVDIDDIFVGKEGTRMKVEDVKALFDTQNELRAHIPNFTFNLGYSG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 KFFHTGTNAEDAGDDLLLSYVKEFWWFPHMWSHMQPHLFHNQSVLAEQMALNKKFAVEHG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 KFFHTGTNAEDAGDDLLLSYVKEFWWFPHMWSHMQPHLFHNQSVLAEQMALNKKFAVEHG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 IPTDMGYAVAPHHSGVYPVHVQLYEAWKQVWSIRVTSTEEYPHLKPARYRRGFIHNGIMV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 IPTDMGYAVAPHHSGVYPVHVQLYEAWKQVWSIRVTSTEEYPHLKPARYRRGFIHNGIMV
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 LPRQTCGLFTHTIFYNEYPGGSSELDKIINGGELFLTVLLNPISIFMTHLSNYGNDRLGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LPRQTCGLFTHTIFYNEYPGGSSELDKIINGGELFLTVLLNPISIFMTHLSNYGNDRLGL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 YTFKHLVRFLHSWTNLRLQTLPPVQLAQKYFQIFSEEKDPLWQDPCEDKRHKDIWSKEKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 YTFKHLVRFLHSWTNLRLQTLPPVQLAQKYFQIFSEEKDPLWQDPCEDKRHKDIWSKEKT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE2 CDRFPKLLIIGPQKTGTTALYLFLGMHPDLSSNYPSSETFEEIQFFNGHNYHKGIDWYME
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 CDRFPKLLIIGPQKTGTTALYLFLGMHPDLSSNYPSSETFEEIQFFNGHNYHKGIDWYME
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE2 FFPIPSNTTSDFYFEKSANYFDSEVAPRRAAALLPKAKVLTILINPADRAYSWYQHQRAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 FFPIPSNTTSDFYFEKSANYFDSEVAPRRAAALLPKAKVLTILINPADRAYSWYQHQRAH
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE2 DDPVALKYTFHEVITAGSDASSKLRALQNRCLVPGWYATHIERWLSAYHANQILVLDGKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 DDPVALKYTFHEVITAGSDASSKLRALQNRCLVPGWYATHIERWLSAYHANQILVLDGKL
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE2 LRTEPAKVMDMVQKFLGVTNTIDYHKTLAFDPKKGFWCQLLEGGKTKCLGKSKGRKYPEM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LRTEPAKVMDMVQKFLGVTNTIDYHKTLAFDPKKGFWCQLLEGGKTKCLGKSKGRKYPEM
790 800 810 820 830 840
850 860 870 880
pF1KE2 DLDSRAFLKDYYRDHNIELSKLLYKMGQTLPTWLREDLQNTR
::::::::::::::::::::::::::::::::::::::::::
CCDS34 DLDSRAFLKDYYRDHNIELSKLLYKMGQTLPTWLREDLQNTR
850 860 870 880
>>CCDS75358.1 NDST1 gene_id:3340|Hs108|chr5 (825 aa)
initn: 4901 init1: 4901 opt: 4901 Z-score: 5406.0 bits: 1011.3 E(32554): 0
Smith-Waterman score: 5524; 93.5% identity (93.5% similar) in 882 aa overlap (1-882:1-825)
10 20 30 40 50 60
pF1KE2 MPALACLRRLCRHVSPQAVLFLLFIFCLFSVFISAYYLYGWKRGLEPSADAPEPDCGDPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 MPALACLRRLCRHVSPQAVLFLLFIFCLFSVFISAYYLYGWKRGLEPSADAPEPDCGDPP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 PVAPSRLLPLKPVQAATPSRTDPLVLVFVESLYSQLGQEVVAILESSRFKYRTEIAPGKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 PVAPSRLLPLKPVQAATPSRTDPLVLVFVESLYSQLGQEVVAILESSRFKYRTEIAPGKG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 DMPTLTDKGRGRFALIIYENILKYVNLDAWNRELLDKYCVAYGVGIIGFFKANENSLLSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 DMPTLTDKGRGRFALIIYENILKYVNLDAWNRELLDKYCVAYGVGIIGFFKANENSLLSA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 QLKGFPLFLHSNLGLKDCSINPKSPLLYVTRPSEVEKGVLPGEDWTVFQSNHSTYEPVLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 QLKGFPLFLHSNLGLKDCSINPKSPLLYVTRPSEVEKGVLPGEDWTVFQSNHSTYEPVLL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 AKTRSSESIPHLGADAGLHAALHATVVQDLGLHDGIQRVLFGNNLNFWLHKLVFVDAVAF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 AKTRSSESIPHLGADAGLHAALHATVVQDLGLHDGIQRVLFGNNLNFWLHKLVFVDAVAF
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 LTGKRLSLPLDRYILVDIDDIFVGKEGTRMKVEDVKALFDTQNELRAHIPNFTFNLGYSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 LTGKRLSLPLDRYILVDIDDIFVGKEGTRMKVEDVKALFDTQNELRAHIPNFTFNLGYSG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 KFFHTGTNAEDAGDDLLLSYVKEFWWFPHMWSHMQPHLFHNQSVLAEQMALNKKFAVEHG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 KFFHTGTNAEDAGDDLLLSYVKEFWWFPHMWSHMQPHLFHNQSVLAEQMALNKKFAVEHG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 IPTDMGYAVAPHHSGVYPVHVQLYEAWKQVWSIRVTSTEEYPHLKPARYRRGFIHNGIMV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 IPTDMGYAVAPHHSGVYPVHVQLYEAWKQVWSIRVTSTEEYPHLKPARYRRGFIHNGIMV
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 LPRQTCGLFTHTIFYNEYPGGSSELDKIINGGELFLTVLLNPISIFMTHLSNYGNDRLGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 LPRQTCGLFTHTIFYNEYPGGSSELDKIINGGELFLTVLLNPISIFMTHLSNYGNDRLGL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 YTFKHLVRFLHSWTNLRLQTLPPVQLAQKYFQIFSEEKDPLWQDPCEDKRHKDIWSKEKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 YTFKHLVRFLHSWTNLRLQTLPPVQLAQKYFQIFSEEKDPLWQDPCEDKRHKDIWSKEKT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE2 CDRFPKLLIIGPQKTGTTALYLFLGMHPDLSSNYPSSETFEEIQFFNGHNYHKGIDWYME
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 CDRFPKLLIIGPQKTGTTALYLFLGMHPDLSSNYPSSETFEEIQFFNGHNYHKGIDWYME
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE2 FFPIPSNTTSDFYFEKSANYFDSEVAPRRAAALLPKAKVLTILINPADRAYSWYQHQRAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 FFPIPSNTTSDFYFEKSANYFDSEVAPRRAAALLPKAKVLTILINPADRAYSWY------
670 680 690 700 710
730 740 750 760 770 780
pF1KE2 DDPVALKYTFHEVITAGSDASSKLRALQNRCLVPGWYATHIERWLSAYHANQILVLDGKL
:::::::::
CCDS75 ---------------------------------------------------QILVLDGKL
720
790 800 810 820 830 840
pF1KE2 LRTEPAKVMDMVQKFLGVTNTIDYHKTLAFDPKKGFWCQLLEGGKTKCLGKSKGRKYPEM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 LRTEPAKVMDMVQKFLGVTNTIDYHKTLAFDPKKGFWCQLLEGGKTKCLGKSKGRKYPEM
730 740 750 760 770 780
850 860 870 880
pF1KE2 DLDSRAFLKDYYRDHNIELSKLLYKMGQTLPTWLREDLQNTR
::::::::::::::::::::::::::::::::::::::::::
CCDS75 DLDSRAFLKDYYRDHNIELSKLLYKMGQTLPTWLREDLQNTR
790 800 810 820
>>CCDS3706.1 NDST4 gene_id:64579|Hs108|chr4 (872 aa)
initn: 4383 init1: 3485 opt: 4413 Z-score: 4866.9 bits: 911.7 E(32554): 0
Smith-Waterman score: 4414; 70.6% identity (88.0% similar) in 883 aa overlap (1-882:1-872)
10 20 30 40 50
pF1KE2 MPALACLRRLCRHVSPQAVLFLLFIFCLFSVFISAYYLY-GWKRGLEPSADAPEPDCGDP
: .. ::: : ... :: ::: :. ::::.:: :.:. . . : .: :
CCDS37 MNLIVKLRRSFR-----TLIVLLATFCLVSIVISAYFLYSGYKQEMTLIETTAEAECTDI
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 PPVAPSRLLPLKPVQAATPSRTDPLVLVFVESLYSQLGQEVVAILESSRFKYRTEIAPGK
. : : . :: :. :.::: ::.:::: ::::::...::::::::.:. :::::
CCDS37 K-ILPYRSMELKTVKPIDTSKTDPTVLLFVESQYSQLGQDIIAILESSRFQYHMVIAPGK
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 GDMPTLTDKGRGRFALIIYENILKYVNLDAWNRELLDKYCVAYGVGIIGFFKANENSLLS
::.: :::.:.:...:.:::::::::..:.::::::.:::: :.:.:::: ::::::: :
CCDS37 GDIPPLTDNGKGKYTLVIYENILKYVSMDSWNRELLEKYCVEYSVSIIGFHKANENSLPS
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 AQLKGFPLFLHSNLGLKDCSINPKSPLLYVTRPSEVEKGVLPGEDWTVFQSNHSTYEPVL
.::::::: : .::.:::: .::.::::..:. .:::: :::::::.:: :::::.:::
CCDS37 TQLKGFPLNLFNNLALKDCFVNPQSPLLHITKAPKVEKGPLPGEDWTIFQYNHSTYQPVL
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 LAKTRSSESIPHLGADAGLHAALHATVVQDLGLHDGIQRVLFGNNLNFWLHKLVFVDAVA
:.. .. .:. :.. . : :::.:::::::::::::::::::::::::.:.::..
CCDS37 LTELQTEKSLSSLSSKT-----LFATVIQDLGLHDGIQRVLFGNNLNFWLHKLIFIDAIS
240 250 260 270 280
300 310 320 330 340 350
pF1KE2 FLTGKRLSLPLDRYILVDIDDIFVGKEGTRMKVEDVKALFDTQNELRAHIPNFTFNLGYS
::.::::.: :::::::::::::::::::::.:.:::::..::: ::... :::::::.:
CCDS37 FLSGKRLTLSLDRYILVDIDDIFVGKEGTRMNVKDVKALLETQNLLRTQVANFTFNLGFS
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE2 GKFFHTGTNAEDAGDDLLLSYVKEFWWFPHMWSHMQPHLFHNQSVLAEQMALNKKFAVEH
:::.::::. :: :::::: : :::::::::::::::::::.: :.::: :::.::.::
CCDS37 GKFYHTGTEEEDEGDDLLLRSVDEFWWFPHMWSHMQPHLFHNESSLVEQMILNKEFALEH
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE2 GIPTDMGYAVAPHHSGVYPVHVQLYEAWKQVWSIRVTSTEEYPHLKPARYRRGFIHNGIM
::: .::::::::::::::::.::: :::.::.:.::::::::::::::::.:::::.::
CCDS37 GIPINMGYAVAPHHSGVYPVHIQLYAAWKKVWGIQVTSTEEYPHLKPARYRKGFIHNSIM
410 420 430 440 450 460
480 490 500 510 520 530
pF1KE2 VLPRQTCGLFTHTIFYNEYPGGSSELDKIINGGELFLTVLLNPISIFMTHLSNYGNDRLG
::::::::::::::::.::::: .:::: : :::::::.:::::::::::::::::::::
CCDS37 VLPRQTCGLFTHTIFYKEYPGGPQELDKSIRGGELFLTILLNPISIFMTHLSNYGNDRLG
470 480 490 500 510 520
540 550 560 570 580 590
pF1KE2 LYTFKHLVRFLHSWTNLRLQTLPPVQLAQKYFQIFSEEKDPLWQDPCEDKRHKDIWSKEK
:::: .:: :..:::::.::::::::::..::..: :.::::::.::.:::::::::.::
CCDS37 LYTFVNLVNFVQSWTNLKLQTLPPVQLAHQYFELFPEQKDPLWQNPCDDKRHKDIWSREK
530 540 550 560 570 580
600 610 620 630 640 650
pF1KE2 TCDRFPKLLIIGPQKTGTTALYLFLGMHPDLSSNYPSSETFEEIQFFNGHNYHKGIDWYM
:::..::.:.::::::::::::::: :::.. :: :: .::::.:::::.::::::::::
CCDS37 TCDHLPKFLVIGPQKTGTTALYLFLLMHPSIISNLPSPKTFEEVQFFNGNNYHKGIDWYM
590 600 610 620 630 640
660 670 680 690 700 710
pF1KE2 EFFPIPSNTTSDFYFEKSANYFDSEVAPRRAAALLPKAKVLTILINPADRAYSWYQHQRA
.::: :::::::: :::::::: :: ::::::.:.::::..::::.:.:::::::::::.
CCDS37 DFFPTPSNTTSDFLFEKSANYFHSEEAPRRAASLVPKAKIITILIDPSDRAYSWYQHQRS
650 660 670 680 690 700
720 730 740 750 760 770
pF1KE2 HDDPVALKYTFHEVITAGSDASSKLRALQNRCLVPGWYATHIERWLSAYHANQILVLDGK
:.::.::...:.:::..: : : :..:: :::::::::.::::::. . ..:.:..::.
CCDS37 HEDPAALRFNFYEVISTGHWAPSDLKTLQRRCLVPGWYAVHIERWLTYFATSQLLIIDGQ
710 720 730 740 750 760
780 790 800 810 820 830
pF1KE2 LLRTEPAKVMDMVQKFLGVTNTIDYHKTLAFDPKKGFWCQLLEGGKTKCLGKSKGRKYPE
::..:: ::: :::::::: .: ..:.:::.:::::::::::::::::::::::::
CCDS37 QLRSDPATVMDEVQKFLGVTPRYNYSEALTFDPQKGFWCQLLEGGKTKCLGKSKGRKYPP
770 780 790 800 810 820
840 850 860 870 880
pF1KE2 MDLDSRAFLKDYYRDHNIELSKLLYKMGQTLPTWLREDLQNTR
:: .::.::..::::::.::::::...:: ::.:::..::..:
CCDS37 MDPESRTFLSNYYRDHNVELSKLLHRLGQPLPSWLRQELQKVR
830 840 850 860 870
>>CCDS3708.1 NDST3 gene_id:9348|Hs108|chr4 (873 aa)
initn: 4335 init1: 3476 opt: 4409 Z-score: 4862.4 bits: 910.8 E(32554): 0
Smith-Waterman score: 4409; 70.6% identity (88.6% similar) in 881 aa overlap (4-882:1-873)
10 20 30 40 50
pF1KE2 MPALACLRRLCRHVSPQAVLFLLFIFCLFSVFISAYYLY-GWKRGLEPSADAPEPDCGDP
.. . .: :: : ...:: ::. :..::::::: :.:. : : : : ::::
CCDS37 MSFIMKLHRHF--QRTVILLATFCMVSIIISAYYLYSGYKQENELSETASEVDCGDL
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 PPVAPSRLLPLKPVQAATPSRTDPLVLVFVESLYSQLGQEVVAILESSRFKYRTEIAPGK
. : .:. .: .. ::::: ::::::: ::.:::... :::::::.:. ::::::
CCDS37 QHL-PYQLMEVKAMKLFDASRTDPTVLVFVESQYSSLGQDIIMILESSRFQYHIEIAPGK
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 GDMPTLTDKGRGRFALIIYENILKYVNLDAWNRELLDKYCVAYGVGIIGFFKANENSLLS
::.:.: :: .:.. ::::::::::.:.:.::: ::::::: ::::.::: :..:.:. :
CCDS37 GDLPVLIDKMKGKYILIIYENILKYINMDSWNRSLLDKYCVEYGVGVIGFHKTSEKSVQS
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 AQLKGFPLFLHSNLGLKDCSINPKSPLLYVTRPSEVEKGVLPGEDWTVFQSNHSTYEPVL
::::::. ...::..::: :::.:::. ::. :..::: ::: :::::: :::.:.::.
CCDS37 FQLKGFPFSIYGNLAVKDCCINPHSPLIRVTKSSKLEKGSLPGTDWTVFQINHSAYQPVI
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 LAKTRSSESI-PHLGADAGLHAALHATVVQDLGLHDGIQRVLFGNNLNFWLHKLVFVDAV
.::... :.. : .. ..:..::...::::::::::::::::::::::::.:.::.
CCDS37 FAKVKTPENLSPSIS-----KGAFYATIIHDLGLHDGIQRVLFGNNLNFWLHKLIFIDAI
240 250 260 270 280
300 310 320 330 340 350
pF1KE2 AFLTGKRLSLPLDRYILVDIDDIFVGKEGTRMKVEDVKALFDTQNELRAHIPNFTFNLGY
.::.::::.: :::::::::::::::::::::...:::::.:::: :::.: :::::::.
CCDS37 SFLSGKRLTLSLDRYILVDIDDIFVGKEGTRMNTNDVKALLDTQNLLRAQITNFTFNLGF
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE2 SGKFFHTGTNAEDAGDDLLLSYVKEFWWFPHMWSHMQPHLFHNQSVLAEQMALNKKFAVE
::::.::::. :: ::: ::. : :::::::::::::::::::.: :.::: ::::::.:
CCDS37 SGKFYHTGTEEEDEGDDCLLGSVDEFWWFPHMWSHMQPHLFHNESSLVEQMILNKKFALE
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE2 HGIPTDMGYAVAPHHSGVYPVHVQLYEAWKQVWSIRVTSTEEYPHLKPARYRRGFIHNGI
::::::::::::::::::::::::::::::.::.:..::::::::::::::::::::..:
CCDS37 HGIPTDMGYAVAPHHSGVYPVHVQLYEAWKKVWNIKITSTEEYPHLKPARYRRGFIHKNI
410 420 430 440 450 460
480 490 500 510 520 530
pF1KE2 MVLPRQTCGLFTHTIFYNEYPGGSSELDKIINGGELFLTVLLNPISIFMTHLSNYGNDRL
:::::::::::::::::.::::: .:::: :.:::::.::.:::::::::::::::::::
CCDS37 MVLPRQTCGLFTHTIFYKEYPGGPKELDKSIQGGELFFTVVLNPISIFMTHLSNYGNDRL
470 480 490 500 510 520
540 550 560 570 580 590
pF1KE2 GLYTFKHLVRFLHSWTNLRLQTLPPVQLAQKYFQIFSEEKDPLWQDPCEDKRHKDIWSKE
::::: .:. :..::::::::::::::::.:::..: ..::::::.::.::::.::::::
CCDS37 GLYTFVNLANFVKSWTNLRLQTLPPVQLAHKYFELFPDQKDPLWQNPCDDKRHRDIWSKE
530 540 550 560 570 580
600 610 620 630 640 650
pF1KE2 KTCDRFPKLLIIGPQKTGTTALYLFLGMHPDLSSNYPSSETFEEIQFFNGHNYHKGIDWY
:::::.::.:.::::::::::::::: :::.. :: :: .::::.:::: .:::.:::::
CCDS37 KTCDRLPKFLVIGPQKTGTTALYLFLVMHPSILSNSPSPKTFEEVQFFNRNNYHRGIDWY
590 600 610 620 630 640
660 670 680 690 700 710
pF1KE2 MEFFPIPSNTTSDFYFEKSANYFDSEVAPRRAAALLPKAKVLTILINPADRAYSWYQHQR
:.:::.:::.:.:: :::::::: :: ::.:::.:.::::..::::.:.:::::::::::
CCDS37 MDFFPVPSNVTTDFLFEKSANYFHSEEAPKRAASLVPKAKIITILIDPSDRAYSWYQHQR
650 660 670 680 690 700
720 730 740 750 760 770
pF1KE2 AHDDPVALKYTFHEVITAGSDASSKLRALQNRCLVPGWYATHIERWLSAYHANQILVLDG
.:.::.:::..:.:::.:: : :.:::::.:::::::::.:::::: . :.:..::
CCDS37 SHEDPAALKFSFYEVISAGPRAPSELRALQKRCLVPGWYASHIERWLVYFPPFQLLIIDG
710 720 730 740 750 760
780 790 800 810 820 830
pF1KE2 KLLRTEPAKVMDMVQKFLGVTNTIDYHKTLAFDPKKGFWCQLLEGGKTKCLGKSKGRKYP
. :::.:: ::: ::::::: .: ..:.:: .::::::::: :::::::::::::::
CCDS37 QQLRTDPATVMDEVQKFLGVLPHYNYSEALTFDSHKGFWCQLLEEGKTKCLGKSKGRKYP
770 780 790 800 810 820
840 850 860 870 880
pF1KE2 EMDLDSRAFLKDYYRDHNIELSKLLYKMGQTLPTWLREDLQNTR
:: :::.::..::::::.::::::.:.:: ::.:::..::..:
CCDS37 PMDSDSRTFLSSYYRDHNVELSKLLHKLGQPLPSWLRQELQKVR
830 840 850 860 870
>>CCDS7335.1 NDST2 gene_id:8509|Hs108|chr10 (883 aa)
initn: 4364 init1: 3439 opt: 4392 Z-score: 4843.6 bits: 907.4 E(32554): 0
Smith-Waterman score: 4392; 70.7% identity (88.6% similar) in 878 aa overlap (9-881:9-880)
10 20 30 40 50
pF1KE2 MPALACLRRLCRHVSPQAVLFLLFIFCLFSVFISAYYLYGWKRGLEPSADAPEPDCGD--
: :.. . ...::. : : :. . :::. .. :: : ::..
CCDS73 MLQLWKVVRPARQLELHRLILLLIAFSLGSMGFLAYYVSTSPKAKEP-LPLPLGDCSSGG
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 ---PPPVAPSRLLPLKPVQAATPSRTDPLVLVFVESLYSQLGQEVVAILESSRFKYRTEI
: :. : .: .: . .::.:.::::::: :::::::.:::::::::.: ::.
CCDS73 AAGPGPARPP--VPPRPPRPPETARTEPVVLVFVESAYSQLGQEIVAILESSRFRYSTEL
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 APGKGDMPTLTDKGRGRFALIIYENILKYVNLDAWNRELLDKYCVAYGVGIIGFFKANEN
:::.::::::::. .::..:.::::.:::::::::.:::::.::: :::::::::.:.:.
CCDS73 APGRGDMPTLTDNTHGRYVLVIYENLLKYVNLDAWSRELLDRYCVEYGVGIIGFFRAHEH
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 SLLSAQLKGFPLFLHSNLGLKDCSINPKSPLLYVTRPSEVEKGVLPGEDWTVFQSNHSTY
::::::::::::::::::::.: ..::..:::..::::..: : :::.:::.::::::::
CCDS73 SLLSAQLKGFPLFLHSNLGLRDYQVNPSAPLLHLTRPSRLEPGPLPGDDWTIFQSNHSTY
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 EPVLLAKTRSSESIPHLGADAGLHAALHATVVQDLGLHDGIQRVLFGNNLNFWLHKLVFV
::::::. : .: : . . . :. : ::::::::::::::::::..:.::::::.::
CCDS73 EPVLLASLRPAE--PAVPGPV-LRRARLPTVVQDLGLHDGIQRVLFGHGLSFWLHKLIFV
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 DAVAFLTGKRLSLPLDRYILVDIDDIFVGKEGTRMKVEDVKALFDTQNELRAHIPNFTFN
::::.:::::: : ::::::::::::::::::::::: ::.::. :::.::. .::::::
CCDS73 DAVAYLTGKRLCLDLDRYILVDIDDIFVGKEGTRMKVADVEALLTTQNKLRTLVPNFTFN
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 LGYSGKFFHTGTNAEDAGDDLLLSYVKEFWWFPHMWSHMQPHLFHNQSVLAEQMALNKKF
::.::::.::::. ::::::.::.. ::::::::::::::::::::.::::.:: :::.:
CCDS73 LGFSGKFYHTGTEEEDAGDDMLLKHRKEFWWFPHMWSHMQPHLFHNRSVLADQMRLNKQF
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE2 AVEHGIPTDMGYAVAPHHSGVYPVHVQLYEAWKQVWSIRVTSTEEYPHLKPARYRRGFIH
:.:::::::.:::::::::::::.:.:::::::.::.:.::::::::::.::::::::::
CCDS73 ALEHGIPTDLGYAVAPHHSGVYPIHTQLYEAWKSVWGIQVTSTEEYPHLRPARYRRGFIH
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE2 NGIMVLPRQTCGLFTHTIFYNEYPGGSSELDKIINGGELFLTVLLNPISIFMTHLSNYGN
::::::::::::::::::::::::::: :::. : :::::::::::::::::::::::::
CCDS73 NGIMVLPRQTCGLFTHTIFYNEYPGGSRELDRSIRGGELFLTVLLNPISIFMTHLSNYGN
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE2 DRLGLYTFKHLVRFLHSWTNLRLQTLPPVQLAQKYFQIFSEEKDPLWQDPCEDKRHKDIW
::::::::. :::::. :: ::::::::: ::::::..: .:..::::.::.::::::::
CCDS73 DRLGLYTFESLVRFLQCWTRLRLQTLPPVPLAQKYFELFPQERSPLWQNPCDDKRHKDIW
540 550 560 570 580 590
600 610 620 630 640 650
pF1KE2 SKEKTCDRFPKLLIIGPQKTGTTALYLFLGMHPDLSSNYPSSETFEEIQFFNGHNYHKGI
::::::::.::.::.:::::::::...::..:: ..:..:: :::::::::. ::::::
CCDS73 SKEKTCDRLPKFLIVGPQKTGTTAIHFFLSLHPAVTSSFPSPSTFEEIQFFNSPNYHKGI
600 610 620 630 640 650
660 670 680 690 700 710
pF1KE2 DWYMEFFPIPSNTTSDFYFEKSANYFDSEVAPRRAAALLPKAKVLTILINPADRAYSWYQ
::::.:::.:::...:: :::::.::::::.:::.:::::.::..:.: :::::::::::
CCDS73 DWYMDFFPVPSNASTDFLFEKSATYFDSEVVPRRGAALLPRAKIITVLTNPADRAYSWYQ
660 670 680 690 700 710
720 730 740 750 760 770
pF1KE2 HQRAHDDPVALKYTFHEVITAGSDASSKLRALQNRCLVPGWYATHIERWLSAYHANQILV
::::: :::::.:::..::.:.:.. ::.:::::::::.:.::..:::. : ..:.:.
CCDS73 HQRAHGDPVALNYTFYQVISASSQTPLALRSLQNRCLVPGYYSTHLQRWLTYYPSGQLLI
720 730 740 750 760 770
780 790 800 810 820 830
pF1KE2 LDGKLLRTEPAKVMDMVQKFLGVTNTIDYHKTLAFDPKKGFWCQLLEGGKTKCLGKSKGR
.::. :::.:: :. .:::::.: ..: .:: :: :::::: ::::::.:::.::::
CCDS73 VDGQELRTNPAASMESIQKFLGITPFLNYTRTLRFDDDKGFWCQGLEGGKTRCLGRSKGR
780 790 800 810 820 830
840 850 860 870 880
pF1KE2 KYPEMDLDSRAFLKDYYRDHNIELSKLLYKMGQTLPTWLREDLQNTR
.::.:: .:: :: :..:.::.:::::: ..:: .:.::::.::..
CCDS73 RYPDMDTESRLFLTDFFRNHNLELSKLLSRLGQPVPSWLREELQHSSLG
840 850 860 870 880
>>CCDS81476.1 NDST2 gene_id:8509|Hs108|chr10 (815 aa)
initn: 3958 init1: 3033 opt: 3990 Z-score: 4400.4 bits: 825.2 E(32554): 0
Smith-Waterman score: 3990; 71.2% identity (88.5% similar) in 801 aa overlap (9-804:9-803)
10 20 30 40 50
pF1KE2 MPALACLRRLCRHVSPQAVLFLLFIFCLFSVFISAYYLYGWKRGLEPSADAPEPDCGD--
: :.. . ...::. : : :. . :::. .. :: : ::..
CCDS81 MLQLWKVVRPARQLELHRLILLLIAFSLGSMGFLAYYVSTSPKAKEP-LPLPLGDCSSGG
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 ---PPPVAPSRLLPLKPVQAATPSRTDPLVLVFVESLYSQLGQEVVAILESSRFKYRTEI
: :. : .: .: . .::.:.::::::: :::::::.:::::::::.: ::.
CCDS81 AAGPGPARPP--VPPRPPRPPETARTEPVVLVFVESAYSQLGQEIVAILESSRFRYSTEL
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 APGKGDMPTLTDKGRGRFALIIYENILKYVNLDAWNRELLDKYCVAYGVGIIGFFKANEN
:::.::::::::. .::..:.::::.:::::::::.:::::.::: :::::::::.:.:.
CCDS81 APGRGDMPTLTDNTHGRYVLVIYENLLKYVNLDAWSRELLDRYCVEYGVGIIGFFRAHEH
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 SLLSAQLKGFPLFLHSNLGLKDCSINPKSPLLYVTRPSEVEKGVLPGEDWTVFQSNHSTY
::::::::::::::::::::.: ..::..:::..::::..: : :::.:::.::::::::
CCDS81 SLLSAQLKGFPLFLHSNLGLRDYQVNPSAPLLHLTRPSRLEPGPLPGDDWTIFQSNHSTY
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 EPVLLAKTRSSESIPHLGADAGLHAALHATVVQDLGLHDGIQRVLFGNNLNFWLHKLVFV
::::::. : .: : . . . :. : ::::::::::::::::::..:.::::::.::
CCDS81 EPVLLASLRPAE--PAVPGPV-LRRARLPTVVQDLGLHDGIQRVLFGHGLSFWLHKLIFV
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 DAVAFLTGKRLSLPLDRYILVDIDDIFVGKEGTRMKVEDVKALFDTQNELRAHIPNFTFN
::::.:::::: : ::::::::::::::::::::::: ::.::. :::.::. .::::::
CCDS81 DAVAYLTGKRLCLDLDRYILVDIDDIFVGKEGTRMKVADVEALLTTQNKLRTLVPNFTFN
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 LGYSGKFFHTGTNAEDAGDDLLLSYVKEFWWFPHMWSHMQPHLFHNQSVLAEQMALNKKF
::.::::.::::. ::::::.::.. ::::::::::::::::::::.::::.:: :::.:
CCDS81 LGFSGKFYHTGTEEEDAGDDMLLKHRKEFWWFPHMWSHMQPHLFHNRSVLADQMRLNKQF
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE2 AVEHGIPTDMGYAVAPHHSGVYPVHVQLYEAWKQVWSIRVTSTEEYPHLKPARYRRGFIH
:.:::::::.:::::::::::::.:.:::::::.::.:.::::::::::.::::::::::
CCDS81 ALEHGIPTDLGYAVAPHHSGVYPIHTQLYEAWKSVWGIQVTSTEEYPHLRPARYRRGFIH
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE2 NGIMVLPRQTCGLFTHTIFYNEYPGGSSELDKIINGGELFLTVLLNPISIFMTHLSNYGN
::::::::::::::::::::::::::: :::. : :::::::::::::::::::::::::
CCDS81 NGIMVLPRQTCGLFTHTIFYNEYPGGSRELDRSIRGGELFLTVLLNPISIFMTHLSNYGN
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE2 DRLGLYTFKHLVRFLHSWTNLRLQTLPPVQLAQKYFQIFSEEKDPLWQDPCEDKRHKDIW
::::::::. :::::. :: ::::::::: ::::::..: .:..::::.::.::::::::
CCDS81 DRLGLYTFESLVRFLQCWTRLRLQTLPPVPLAQKYFELFPQERSPLWQNPCDDKRHKDIW
540 550 560 570 580 590
600 610 620 630 640 650
pF1KE2 SKEKTCDRFPKLLIIGPQKTGTTALYLFLGMHPDLSSNYPSSETFEEIQFFNGHNYHKGI
::::::::.::.::.:::::::::...::..:: ..:..:: :::::::::. ::::::
CCDS81 SKEKTCDRLPKFLIVGPQKTGTTAIHFFLSLHPAVTSSFPSPSTFEEIQFFNSPNYHKGI
600 610 620 630 640 650
660 670 680 690 700 710
pF1KE2 DWYMEFFPIPSNTTSDFYFEKSANYFDSEVAPRRAAALLPKAKVLTILINPADRAYSWYQ
::::.:::.:::...:: :::::.::::::.:::.:::::.::..:.: :::::::::::
CCDS81 DWYMDFFPVPSNASTDFLFEKSATYFDSEVVPRRGAALLPRAKIITVLTNPADRAYSWYQ
660 670 680 690 700 710
720 730 740 750 760 770
pF1KE2 HQRAHDDPVALKYTFHEVITAGSDASSKLRALQNRCLVPGWYATHIERWLSAYHANQILV
::::: :::::.:::..::.:.:.. ::.:::::::::.:.::..:::. : ..:.:.
CCDS81 HQRAHGDPVALNYTFYQVISASSQTPLALRSLQNRCLVPGYYSTHLQRWLTYYPSGQLLI
720 730 740 750 760 770
780 790 800 810 820 830
pF1KE2 LDGKLLRTEPAKVMDMVQKFLGVTNTIDYHKTLAFDPKKGFWCQLLEGGKTKCLGKSKGR
.::. :::.:: :. .:::::. :.
CCDS81 VDGQELRTNPAASMESIQKFLGLMMIRDFGARDLKVVRLAV
780 790 800 810
>>CCDS53995.1 HS3ST4 gene_id:9951|Hs108|chr16 (456 aa)
initn: 412 init1: 122 opt: 375 Z-score: 413.5 bits: 86.7 E(32554): 1e-16
Smith-Waterman score: 430; 32.0% identity (60.1% similar) in 281 aa overlap (603-877:196-453)
580 590 600 610 620 630
pF1KE2 IFSEEKDPLWQDPCEDKRHKDIWSKEKTCDRFPKLLIIGPQKTGTTALYLFLGMHPDLSS
..:. :::: .: :: :: . .:::. .
CCDS53 TTDEDLAGRRAANGSSERGGAVSTPDYGEKKLPQALIIGVKKGGTRALLEAIRVHPDVRA
170 180 190 200 210 220
640 650 660 670 680 690
pF1KE2 NYPSSETFEEIQFFNGHNYHKGIDWYMEFFPIPSNTTSDFYFEKSANYFDSEVAPRRAAA
. : .::. .::.::..:: . .:.. ... .::. .:: .. ::.: .
CCDS53 ------VGVEPHFFD-RNYEKGLEWYRNV--MPKTLDGQITMEKTPSYFVTNEAPKRIHS
230 240 250 260 270
700 710 720 730 740
pF1KE2 LLPKAKVLTILINPADRAYSWYQH--QRAHDDPVALKYTFHEVITAGSDAS-SKLRALQN
. :..... ::. :: : : . .. . :. .:.. . ::: : .:
CCDS53 MAKDIKLIVVVRNPVTRAISDYTQTLSKKPEIPTFEVLAFKNRTLGLIDASWSAIRI---
280 290 300 310 320 330
750 760 770 780 790 800
pF1KE2 RCLVPGWYATHIERWLSAYHANQILVLDGKLLRTEPAKVMDMVQKFLGVTNTIDYHKTLA
: :: :.: ::. . .::: ..:. : ..:: : :: :::. .. .: .
CCDS53 -----GIYALHLENWLQYFPLSQILFVSGERLIVDPAGEMAKVQDFLGLKRVVT-EKHFY
340 350 360 370 380
810 820 830 840 850 860
pF1KE2 FDPKKGFWC--QLLEGGKTKCLGKSKGRKYPEMDLDSRAFLKDYYRDHNIELSKLLYKM-
:. ::: : . ... .:::::::: .:..: : :. .:. :. ..:.:
CCDS53 FNKTKGFPCLKKPEDSSAPRCLGKSKGRTHPRIDPDVIHRLRKFYKPFNL----MFYQMT
390 400 410 420 430 440
870 880
pF1KE2 GQTLPTWLREDLQNTR
:: . : .:.
CCDS53 GQDFQ-WEQEEGDK
450
>>CCDS11167.1 HS3ST3B1 gene_id:9953|Hs108|chr17 (390 aa)
initn: 390 init1: 122 opt: 370 Z-score: 409.1 bits: 85.7 E(32554): 1.8e-16
Smith-Waterman score: 436; 33.2% identity (61.9% similar) in 265 aa overlap (603-862:136-382)
580 590 600 610 620 630
pF1KE2 IFSEEKDPLWQDPCEDKRHKDIWSKEKTCDRFPKLLIIGPQKTGTTALYLFLGMHPDLSS
..:. .::: .: :: :: :: .:::. .
CCDS11 EGAASPEEQSPEVPDSPSPISSFFSGSGSKQLPQAIIIGVKKGGTRALLEFLRVHPDVRA
110 120 130 140 150 160
640 650 660 670 680 690
pF1KE2 NYPSSETFEEIQFFNGHNYHKGIDWYMEFFPIPSNTTSDFYFEKSANYFDSEVAPRRAAA
. : .::. ..: ::. :: .. .: . ... .::. .:: .. :: : .:
CCDS11 ------VGAEPHFFD-RSYDKGLAWYRDL--MPRTLDGQITMEKTPSYFVTREAPARISA
170 180 190 200 210
700 710 720 730 740 750
pF1KE2 LLPKAKVLTILINPADRAYSWYQH--QRAHDDPVALKYTFHEVITAGSDASSKLRALQNR
. .:..... .:. :: : : . .. : :. . ::.. ::: ... :.:
CCDS11 MSKDTKLIVVVRDPVTRAISDYTQTLSKRPDIPTFESLTFKNR-TAGL-IDTSWSAIQI-
220 230 240 250 260 270
760 770 780 790 800
pF1KE2 CLVPGWYATHIERWLSAYHANQILVLDGKLLRTEPAKVMDMVQKFLGVTNTI-DYHKTLA
: :: :.:.:: . :.: ..:. : ..:: . :: :::. : : : .
CCDS11 ----GIYAKHLEHWLRHFPIRQMLFVSGERLISDPAGELGRVQDFLGLKRIITDKH--FY
280 290 300 310 320
810 820 830 840 850 860
pF1KE2 FDPKKGFWC-QLLEGG-KTKCLGKSKGRKYPEMDLDSRAFLKDYYRDHNIELSKLLYKMG
:. ::: : . ::. . .::::.::: .::.: . :...:: :... ..
CCDS11 FNKTKGFPCLKKAEGSSRPHCLGKTKGRTHPEIDREVVRRLREFYRPFNLKFYQMTGHDF
330 340 350 360 370 380
870 880
pF1KE2 QTLPTWLREDLQNTR
CCDS11 GWD
390
>>CCDS11165.1 HS3ST3A1 gene_id:9955|Hs108|chr17 (406 aa)
initn: 390 init1: 122 opt: 370 Z-score: 408.8 bits: 85.7 E(32554): 1.9e-16
Smith-Waterman score: 436; 33.2% identity (61.9% similar) in 265 aa overlap (603-862:151-397)
580 590 600 610 620 630
pF1KE2 IFSEEKDPLWQDPCEDKRHKDIWSKEKTCDRFPKLLIIGPQKTGTTALYLFLGMHPDLSS
..:. .::: .: :: :: :: .:::. .
CCDS11 SGGPGGSGAGSTVAEAPPGTLALLLDEGSKQLPQAIIIGVKKGGTRALLEFLRVHPDVRA
130 140 150 160 170 180
640 650 660 670 680 690
pF1KE2 NYPSSETFEEIQFFNGHNYHKGIDWYMEFFPIPSNTTSDFYFEKSANYFDSEVAPRRAAA
. : .::. ..: ::. :: .. .: . ... .::. .:: .. :: : .:
CCDS11 ------VGAEPHFFD-RSYDKGLAWYRDL--MPRTLDGQITMEKTPSYFVTREAPARISA
190 200 210 220 230
700 710 720 730 740 750
pF1KE2 LLPKAKVLTILINPADRAYSWYQH--QRAHDDPVALKYTFHEVITAGSDASSKLRALQNR
. .:..... .:. :: : : . .. : :. . ::.. ::: ... :.:
CCDS11 MSKDTKLIVVVRDPVTRAISDYTQTLSKRPDIPTFESLTFKNR-TAGL-IDTSWSAIQI-
240 250 260 270 280
760 770 780 790 800
pF1KE2 CLVPGWYATHIERWLSAYHANQILVLDGKLLRTEPAKVMDMVQKFLGVTNTI-DYHKTLA
: :: :.:.:: . :.: ..:. : ..:: . :: :::. : : : .
CCDS11 ----GIYAKHLEHWLRHFPIRQMLFVSGERLISDPAGELGRVQDFLGLKRIITDKH--FY
290 300 310 320 330 340
810 820 830 840 850 860
pF1KE2 FDPKKGFWC-QLLEGG-KTKCLGKSKGRKYPEMDLDSRAFLKDYYRDHNIELSKLLYKMG
:. ::: : . ::. . .::::.::: .::.: . :...:: :... ..
CCDS11 FNKTKGFPCLKKAEGSSRPHCLGKTKGRTHPEIDREVVRRLREFYRPFNLKFYQMTGHDF
350 360 370 380 390 400
870 880
pF1KE2 QTLPTWLREDLQNTR
CCDS11 GWDG
>>CCDS10606.1 HS3ST2 gene_id:9956|Hs108|chr16 (367 aa)
initn: 328 init1: 105 opt: 359 Z-score: 397.3 bits: 83.4 E(32554): 8.2e-16
Smith-Waterman score: 425; 32.9% identity (57.8% similar) in 277 aa overlap (603-873:113-366)
580 590 600 610 620 630
pF1KE2 IFSEEKDPLWQDPCEDKRHKDIWSKEKTCDRFPKLLIIGPQKTGTTALYLFLGMHPDLSS
:.:. ::.: .: :: :. :. .:::. .
CCDS10 PSAPSAPAAAVPAPRLSGSNHSGSPKLGTKRLPQALIVGVKKGGTRAVLEFIRVHPDVRA
90 100 110 120 130 140
640 650 660 670 680 690
pF1KE2 NYPSSETFEEIQFFNGHNYHKGIDWYMEFFPIPSNTTSDFYFEKSANYFDSEVAPRRAAA
: .::. .:: .:.::: . .: . :.. .::. .:: .. ::::
CCDS10 ------LGTEPHFFD-RNYGRGLDWYRSL--MPRTLESQITLEKTPSYFVTQEAPRRIFN
150 160 170 180 190
700 710 720 730 740
pF1KE2 LLPKAKVLTILINPADRAYSWYQH--QRAHDDPVALKYTFHEVITAGSDAS-SKLRALQN
. .:..... ::. :: : : . .. : :. .:.. . :.: . .:
CCDS10 MSRDTKLIVVVRNPVTRAISDYTQTLSKKPDIPTFEGLSFRNRTLGLVDVSWNAIRI---
200 210 220 230 240 250
750 760 770 780 790 800
pF1KE2 RCLVPGWYATHIERWLSAYHANQILVLDGKLLRTEPAKVMDMVQKFLGVTNTI-DYHKTL
: :. :.: ::. . :: ..:. : :.:: : :: :::. : : : .
CCDS10 -----GMYVLHLESWLQYFPLAQIHFVSGERLITDPAGEMGRVQDFLGIKRFITDKH--F
260 270 280 290 300
810 820 830 840 850 860
pF1KE2 AFDPKKGFWC-QLLEGGKT-KCLGKSKGRKYPEMDLDSRAFLKDYYRDHNIELSKLLYKM
:. ::: : . :.. .:::::::: . ..: . :...:: .:: :. .
CCDS10 YFNKTKGFPCLKKTESSLLPRCLGKSKGRTHVQIDPEVIDQLREFYRPYNI---KFYETV
310 320 330 340 350 360
870 880
pF1KE2 GQTLPTWLREDLQNTR
:: . :
CCDS10 GQDF-RWE
882 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 21:45:44 2016 done: Sun Nov 6 21:45:44 2016
Total Scan time: 2.950 Total Display time: 0.180
Function used was FASTA [36.3.4 Apr, 2011]