FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2696, 307 aa
1>>>pF1KE2696 307 - 307 aa - 307 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.5919+/-0.000841; mu= 13.9629+/- 0.050
mean_var=69.5529+/-14.008, 0's: 0 Z-trim(107.3): 25 B-trim: 0 in 0/50
Lambda= 0.153786
statistics sampled from 9476 (9495) to 9476 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.676), E-opt: 0.2 (0.292), width: 16
Scan time: 2.540
The best scores are: opt bits E(32554)
CCDS3408.1 HS3ST1 gene_id:9957|Hs108|chr4 ( 307) 2109 476.8 8.7e-135
CCDS34517.1 HS3ST5 gene_id:222537|Hs108|chr6 ( 346) 1014 233.9 1.3e-61
CCDS53995.1 HS3ST4 gene_id:9951|Hs108|chr16 ( 456) 789 184.1 1.8e-46
CCDS10606.1 HS3ST2 gene_id:9956|Hs108|chr16 ( 367) 784 182.9 3.2e-46
CCDS45381.2 HS3ST6 gene_id:64711|Hs108|chr16 ( 342) 781 182.2 4.8e-46
CCDS11167.1 HS3ST3B1 gene_id:9953|Hs108|chr17 ( 390) 773 180.5 1.8e-45
CCDS11165.1 HS3ST3A1 gene_id:9955|Hs108|chr17 ( 406) 766 178.9 5.5e-45
CCDS3706.1 NDST4 gene_id:64579|Hs108|chr4 ( 872) 398 97.4 4e-20
CCDS3708.1 NDST3 gene_id:9348|Hs108|chr4 ( 873) 385 94.6 3e-19
CCDS7335.1 NDST2 gene_id:8509|Hs108|chr10 ( 883) 357 88.4 2.2e-17
>>CCDS3408.1 HS3ST1 gene_id:9957|Hs108|chr4 (307 aa)
initn: 2109 init1: 2109 opt: 2109 Z-score: 2533.3 bits: 476.8 E(32554): 8.7e-135
Smith-Waterman score: 2109; 99.7% identity (99.7% similar) in 307 aa overlap (1-307:1-307)
10 20 30 40 50 60
pF1KE2 MAALLLGAVLLVAQPQLVPSRTAELGQQELLRKAGTLQDDVRDGVAPNGSAQQLPQTIII
::::::::::::::::::::: ::::::::::::::::::::::::::::::::::::::
CCDS34 MAALLLGAVLLVAQPQLVPSRPAELGQQELLRKAGTLQDDVRDGVAPNGSAQQLPQTIII
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 GVRKGGTRALLEMLSLHPDVAAAENEVHFFDWEEHYSHGLGWYLSQMPFSWPHQLTVEKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 GVRKGGTRALLEMLSLHPDVAAAENEVHFFDWEEHYSHGLGWYLSQMPFSWPHQLTVEKT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 PAYFTSPKVPERVYSMNPSIRLLLILRDPSERVLSDYTQVFYNHMQKHKPYPSIEEFLVR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PAYFTSPKVPERVYSMNPSIRLLLILRDPSERVLSDYTQVFYNHMQKHKPYPSIEEFLVR
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 DGRLNVDYKALNRSLYHVHMQNWLRFFPLRHIHIVDGDRLIRDPFPEIQKVERFLKLSPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 DGRLNVDYKALNRSLYHVHMQNWLRFFPLRHIHIVDGDRLIRDPFPEIQKVERFLKLSPQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 INASNFYFNKTKGFYCLRDSGRDRCLHESKGRAHPQVDPKLLNKLHEYFHEPNKKFFELV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 INASNFYFNKTKGFYCLRDSGRDRCLHESKGRAHPQVDPKLLNKLHEYFHEPNKKFFELV
250 260 270 280 290 300
pF1KE2 GRTFDWH
:::::::
CCDS34 GRTFDWH
>>CCDS34517.1 HS3ST5 gene_id:222537|Hs108|chr6 (346 aa)
initn: 1039 init1: 534 opt: 1014 Z-score: 1219.5 bits: 233.9 E(32554): 1.3e-61
Smith-Waterman score: 1014; 49.8% identity (79.8% similar) in 297 aa overlap (20-306:50-345)
10 20 30 40
pF1KE2 MAALLLGAVLLVAQPQLVPSRT-AELGQQELLRKAGTLQDDVRDGVAPN
.:: ::. . : : : :.. : : : .
CCDS34 AVGSLLYLVARVGSLDRLQPICPIEGRLGGARTQAEFPLRALQFKRGLLHE-FRKGNASK
20 30 40 50 60 70
50 60 70 80 90 100
pF1KE2 GSA------QQLPQTIIIGVRKGGTRALLEMLSLHPDVAAAENEVHFFDWEEHYSHGLGW
.. ::::..:::::::::::::::::.::: :. : .:.:::: .:.:..:. :
CCDS34 EQVRLHDLVQQLPKAIIIGVRKGGTRALLEMLNLHPAVVKASQEIHFFDNDENYGKGIEW
80 90 100 110 120 130
110 120 130 140 150 160
pF1KE2 YLSQMPFSWPHQLTVEKTPAYFTSPKVPERVYSMNPSIRLLLILRDPSERVLSDYTQVFY
: ..::::.:.:.:.::.:::: . .::::.:.:: ::.::.:.:.:. :..::::::.
CCDS34 YRKKMPFSYPQQITIEKSPAYFITEEVPERIYKMNSSIKLLIIVREPTTRAISDYTQVLE
140 150 160 170 180 190
170 180 190 200 210 220
pF1KE2 NHMQKHKPYPSIEEFLVRDG--RLNVDYKALNRSLYHVHMQNWLRFFPLRHIHIVDGDRL
.. .:.: : ..:.. . . ..:. :::. :.: :.. ::..::....:.::::::
CCDS34 GKERKNKTYYKFEKLAIDPNTCEVNTKYKAVRTSIYTKHLERWLKYFPIEQFHVVDGDRL
200 210 220 230 240 250
230 240 250 260 270
pF1KE2 IRDPFPEIQKVERFLKLSPQINASNFYFNKTKGFYCLR-DSGRDRCLHESKGRAHPQVDP
: .:.::.: ::.::.: :.:. :.::: :.:::::: . ..:: :::: ::.:::
CCDS34 ITEPLPELQLVEKFLNLPPRISQYNLYFNATRGFYCLRFNIIFNKCLAGSKGRIHPEVDP
260 270 280 290 300 310
280 290 300
pF1KE2 KLLNKLHEYFHEPNKKFFELVGRTFDWH
....::...:: :.::....:::..:
CCDS34 SVITKLRKFFHPFNQKFYQITGRTLNWP
320 330 340
>>CCDS53995.1 HS3ST4 gene_id:9951|Hs108|chr16 (456 aa)
initn: 582 init1: 213 opt: 789 Z-score: 947.9 bits: 184.1 E(32554): 1.8e-46
Smith-Waterman score: 789; 39.6% identity (73.4% similar) in 308 aa overlap (10-306:149-449)
10 20 30
pF1KE2 MAALLLGAVLLVAQPQLVPSRTAELGQ---QELLRKAGT
...:: : : : :. .. ..: . ..
CCDS53 AAPGTDGWGLPSGGGGAQDAWLRTPLAPSEMITAQSAL-PEREAQESSTTDEDLAGRRAA
120 130 140 150 160 170
40 50 60 70 80 90
pF1KE2 LQDDVRDGVA--PNGSAQQLPQTIIIGVRKGGTRALLEMLSLHPDVAAAENEVHFFDWEE
.. : :.. :. . ..:::..::::.::::::::: . .:::: :. : :::: .
CCDS53 NGSSERGGAVSTPDYGEKKLPQALIIGVKKGGTRALLEAIRVHPDVRAVGVEPHFFD--R
180 190 200 210 220 230
100 110 120 130 140 150
pF1KE2 HYSHGLGWYLSQMPFSWPHQLTVEKTPAYFTSPKVPERVYSMNPSIRLLLILRDPSERVL
.: .:: :: . :: . :.:.::::.::.. ..:.:..:: .:.:....:.: :..
CCDS53 NYEKGLEWYRNVMPKTLDGQITMEKTPSYFVTNEAPKRIHSMAKDIKLIVVVRNPVTRAI
240 250 260 270 280 290
160 170 180 190 200 210
pF1KE2 SDYTQVFYNHMQKHKPYPSIEEFLVRD---GRLNVDYKALNRSLYHVHMQNWLRFFPLRH
:::::. ..:. :..: . .. : ......:. ..: .:..:::..::: .
CCDS53 SDYTQT----LSKKPEIPTFEVLAFKNRTLGLIDASWSAIRIGIYALHLENWLQYFPLSQ
300 310 320 330 340 350
220 230 240 250 260
pF1KE2 IHIVDGDRLIRDPFPEIQKVERFLKLSPQINASNFYFNKTKGFYCLR---DSGRDRCLHE
: .:.:.::: :: :. ::. :: :. .. ..::::::::: ::. ::. ::: .
CCDS53 ILFVSGERLIVDPAGEMAKVQDFLGLKRVVTEKHFYFNKTKGFPCLKKPEDSSAPRCLGK
360 370 380 390 400 410
270 280 290 300
pF1KE2 SKGRAHPQVDPKLLNKLHEYFHEPNKKFFELVGRTFDWH
::::.::..:: ....:..... : :....:. :.:
CCDS53 SKGRTHPRIDPDVIHRLRKFYKPFNLMFYQMTGQDFQWEQEEGDK
420 430 440 450
>>CCDS10606.1 HS3ST2 gene_id:9956|Hs108|chr16 (367 aa)
initn: 578 init1: 213 opt: 784 Z-score: 943.3 bits: 182.9 E(32554): 3.2e-46
Smith-Waterman score: 784; 42.3% identity (76.8% similar) in 267 aa overlap (46-306:106-366)
20 30 40 50 60 70
pF1KE2 QLVPSRTAELGQQELLRKAGTLQDDVRDGVAPNGSAQQLPQTIIIGVRKGGTRALLEMLS
.:. ....:::..:.::.::::::.::..
CCDS10 SGPTPSEPSAPSAPAAAVPAPRLSGSNHSGSPKLGTKRLPQALIVGVKKGGTRAVLEFIR
80 90 100 110 120 130
80 90 100 110 120 130
pF1KE2 LHPDVAAAENEVHFFDWEEHYSHGLGWYLSQMPFSWPHQLTVEKTPAYFTSPKVPERVYS
.:::: : .: :::: ..:..:: :: : :: . :.:.::::.::.. ..:.:...
CCDS10 VHPDVRALGTEPHFFD--RNYGRGLDWYRSLMPRTLESQITLEKTPSYFVTQEAPRRIFN
140 150 160 170 180 190
140 150 160 170 180 190
pF1KE2 MNPSIRLLLILRDPSERVLSDYTQVFYNHMQKHKPYPSIEEFLVRD---GRLNVDYKALN
:. . .:....:.: :..:::::. ..:. :..: . :. : ..:...:.
CCDS10 MSRDTKLIVVVRNPVTRAISDYTQT----LSKKPDIPTFEGLSFRNRTLGLVDVSWNAIR
200 210 220 230 240
200 210 220 230 240 250
pF1KE2 RSLYHVHMQNWLRFFPLRHIHIVDGDRLIRDPFPEIQKVERFLKLSPQINASNFYFNKTK
..: .:...::..::: .::.:.:.::: :: :. .:. :: .. :. ..:::::::
CCDS10 IGMYVLHLESWLQYFPLAQIHFVSGERLITDPAGEMGRVQDFLGIKRFITDKHFYFNKTK
250 260 270 280 290 300
260 270 280 290 300
pF1KE2 GFYCLRDSGRD---RCLHESKGRAHPQVDPKLLNKLHEYFHEPNKKFFELVGRTFDWH
:: ::. . . ::: .::::.: :.::.....:.:... : ::.: ::. : :
CCDS10 GFPCLKKTESSLLPRCLGKSKGRTHVQIDPEVIDQLREFYRPYNIKFYETVGQDFRWE
310 320 330 340 350 360
>>CCDS45381.2 HS3ST6 gene_id:64711|Hs108|chr16 (342 aa)
initn: 691 init1: 229 opt: 781 Z-score: 940.2 bits: 182.2 E(32554): 4.8e-46
Smith-Waterman score: 781; 39.5% identity (69.4% similar) in 314 aa overlap (1-306:34-341)
10 20
pF1KE2 MAALLLGAVLLVAQP-QLVPSRTAELGQQE
..::.::: : : : . :. :
CCDS45 SGGLGGGAGGGQGAGAGQGAALRASRAPMLLVALVLGAYCLCALPGRCPPAARAPAPAPA
10 20 30 40 50 60
30 40 50 60 70 80
pF1KE2 LLRKAGTLQDDVRDGV--APNGSAQQLPQTIIIGVRKGGTRALLEMLSLHPDVAAAENEV
. ..... :. : . . ...::..:.::.:::::::::.: ::::: : .:
CCDS45 PSEPSSSVHRPGAPGLPLASGPGRRRFPQALIVGVKKGGTRALLEFLRLHPDVRALGSEP
70 80 90 100 110 120
90 100 110 120 130 140
pF1KE2 HFFDWEEHYSHGLGWYLSQMPFSWPHQLTVEKTPAYFTSPKVPERVYSMNPSIRLLLILR
:::: . : .::.:: : :: . :.:.::::.::.. ..:.:...:.:. .:....:
CCDS45 HFFD--RCYERGLAWYRSLMPRTLDGQITMEKTPSYFVTREAPRRIHAMSPDTKLIVVVR
130 140 150 160 170 180
150 160 170 180 190 200
pF1KE2 DPSERVLSDYTQVFYNHMQKHKPYPSIEEFLVRDGRLNVD--YKALNRSLYHVHMQNWLR
.: :..:::.:. ..: ::.. . : : :: ..:. .:: :...:::
CCDS45 NPVTRAISDYAQT----LSKTPGLPSFRALAFRHGLGPVDTAWSAVRIGLYAQHLDHWLR
190 200 210 220 230
210 220 230 240 250 260
pF1KE2 FFPLRHIHIVDGDRLIRDPFPEIQKVERFLKLSPQINASNFYFNKTKGFYCLRDS---GR
.::: :. .:.:.::. :: :. .:. :: :. .. ..:::: :::: ::. . .:
CCDS45 YFPLSHFLFVSGERLVSDPAGEVGRVQDFLGLKRVVTDKHFYFNATKGFPCLKKAQGGSR
240 250 260 270 280 290
270 280 290 300
pF1KE2 DRCLHESKGRAHPQVDPKLLNKLHEYFHEPNKKFFELVGRTFDWH
::: .:::: ::.: :. .:.:... :..:....:. : :
CCDS45 PRCLGKSKGRPHPRVPQALVRRLQEFYRPFNRRFYQMTGQDFGWG
300 310 320 330 340
>>CCDS11167.1 HS3ST3B1 gene_id:9953|Hs108|chr17 (390 aa)
initn: 578 init1: 207 opt: 773 Z-score: 929.7 bits: 180.5 E(32554): 1.8e-45
Smith-Waterman score: 773; 39.7% identity (72.3% similar) in 307 aa overlap (15-306:89-389)
10 20 30 40
pF1KE2 MAALLLGAVLLVAQPQLVPSRTAELGQQELLRKAGTLQD---DV
: .: : . .:. . :.. .. .:
CCDS11 PGLLLLGSGSRAAHDPPALATAPDGTPPRLPFRAPPATPLASGKEMAEGAASPEEQSPEV
60 70 80 90 100 110
50 60 70 80 90
pF1KE2 RDGVAP-----NGS-AQQLPQTIIIGVRKGGTRALLEMLSLHPDVAAAENEVHFFDWEEH
:. .: .:: ..::::.:::::.:::::::::.: .:::: :. : :::: .
CCDS11 PDSPSPISSFFSGSGSKQLPQAIIIGVKKGGTRALLEFLRVHPDVRAVGAEPHFFD--RS
120 130 140 150 160 170
100 110 120 130 140 150
pF1KE2 YSHGLGWYLSQMPFSWPHQLTVEKTPAYFTSPKVPERVYSMNPSIRLLLILRDPSERVLS
:..::.:: . :: . :.:.::::.::.. ..: :. .:. . .:....::: :..:
CCDS11 YDKGLAWYRDLMPRTLDGQITMEKTPSYFVTREAPARISAMSKDTKLIVVVRDPVTRAIS
180 190 200 210 220 230
160 170 180 190 200 210
pF1KE2 DYTQVFYNHMQKHKPYPSIEEFLVRD---GRLNVDYKALNRSLYHVHMQNWLRFFPLRHI
::::. ..:. :..: . .. : ......:.. ..: :...::: ::.:..
CCDS11 DYTQT----LSKRPDIPTFESLTFKNRTAGLIDTSWSAIQIGIYAKHLEHWLRHFPIRQM
240 250 260 270 280 290
220 230 240 250 260
pF1KE2 HIVDGDRLIRDPFPEIQKVERFLKLSPQINASNFYFNKTKGFYCLRD---SGRDRCLHES
.:.:.::: :: :. .:. :: :. :. ..::::::::: ::. :.: .:: ..
CCDS11 LFVSGERLISDPAGELGRVQDFLGLKRIITDKHFYFNKTKGFPCLKKAEGSSRPHCLGKT
300 310 320 330 340 350
270 280 290 300
pF1KE2 KGRAHPQVDPKLLNKLHEYFHEPNKKFFELVGRTFDWH
:::.::..: ... .:.:... : ::....:. : :
CCDS11 KGRTHPEIDREVVRRLREFYRPFNLKFYQMTGHDFGWD
360 370 380 390
>>CCDS11165.1 HS3ST3A1 gene_id:9955|Hs108|chr17 (406 aa)
initn: 578 init1: 207 opt: 766 Z-score: 921.1 bits: 178.9 E(32554): 5.5e-45
Smith-Waterman score: 766; 42.7% identity (76.0% similar) in 262 aa overlap (51-306:149-404)
30 40 50 60 70 80
pF1KE2 RTAELGQQELLRKAGTLQDDVRDGVAPNGSAQQLPQTIIIGVRKGGTRALLEMLSLHPDV
..::::.:::::.:::::::::.: .::::
CCDS11 GLSGGPGGSGAGSTVAEAPPGTLALLLDEGSKQLPQAIIIGVKKGGTRALLEFLRVHPDV
120 130 140 150 160 170
90 100 110 120 130 140
pF1KE2 AAAENEVHFFDWEEHYSHGLGWYLSQMPFSWPHQLTVEKTPAYFTSPKVPERVYSMNPSI
:. : :::: . :..::.:: . :: . :.:.::::.::.. ..: :. .:. .
CCDS11 RAVGAEPHFFD--RSYDKGLAWYRDLMPRTLDGQITMEKTPSYFVTREAPARISAMSKDT
180 190 200 210 220 230
150 160 170 180 190
pF1KE2 RLLLILRDPSERVLSDYTQVFYNHMQKHKPYPSIEEFLVRD---GRLNVDYKALNRSLYH
.:....::: :..:::::. ..:. :..: . .. : ......:.. ..:
CCDS11 KLIVVVRDPVTRAISDYTQT----LSKRPDIPTFESLTFKNRTAGLIDTSWSAIQIGIYA
240 250 260 270 280 290
200 210 220 230 240 250
pF1KE2 VHMQNWLRFFPLRHIHIVDGDRLIRDPFPEIQKVERFLKLSPQINASNFYFNKTKGFYCL
:...::: ::.:.. .:.:.::: :: :. .:. :: :. :. ..::::::::: ::
CCDS11 KHLEHWLRHFPIRQMLFVSGERLISDPAGELGRVQDFLGLKRIITDKHFYFNKTKGFPCL
300 310 320 330 340 350
260 270 280 290 300
pF1KE2 RD---SGRDRCLHESKGRAHPQVDPKLLNKLHEYFHEPNKKFFELVGRTFDWH
. :.: .:: ..:::.::..: ... .:.:... : ::....:. : :
CCDS11 KKAEGSSRPHCLGKTKGRTHPEIDREVVRRLREFYRPFNLKFYQMTGHDFGWDG
360 370 380 390 400
>>CCDS3706.1 NDST4 gene_id:64579|Hs108|chr4 (872 aa)
initn: 352 init1: 130 opt: 398 Z-score: 474.7 bits: 97.4 E(32554): 4e-20
Smith-Waterman score: 474; 31.5% identity (62.9% similar) in 286 aa overlap (39-302:577-855)
10 20 30 40 50 60
pF1KE2 VLLVAQPQLVPSRTAELGQQELLRKAGTLQDDVR--DGVAPNGSAQQLPQTIIIGVRKGG
:: : : . . . ..::. ..:: .: :
CCDS37 KLQTLPPVQLAHQYFELFPEQKDPLWQNPCDDKRHKDIWSREKTCDHLPKFLVIGPQKTG
550 560 570 580 590 600
70 80 90 100 110
pF1KE2 TRALLEMLSLHPDVAA------AENEVHFFDWEEHYSHGLGWYLS--QMPFSWPHQLTVE
: :: .: .::.. . . .::.::. . .: .:. ::.. : . .. :
CCDS37 TTALYLFLLMHPSIISNLPSPKTFEEVQFFNGN-NYHKGIDWYMDFFPTPSNTTSDFLFE
610 620 630 640 650 660
120 130 140 150 160 170
pF1KE2 KTPAYFTSPKVPERVYSMNPSIRLLLILRDPSERVLSDYTQVFYNHMQKHKPYPSIEEF-
:. :: : ..:.:. :. :. ... :: :::.:. : .:.:...:. :. .:
CCDS37 KSANYFHSEEAPRRAASLVPKAKIITILIDPSDRAYS-----WYQHQRSHED-PAALRFN
670 680 690 700 710
180 190 200 210 220
pF1KE2 ---LVRDGRLN-VDYKALNR-----SLYHVHMQNWLRFFPLRHIHIVDGDRLIRDPFPEI
.. :. : :.:.: . : ::.. :: .: .. :.::..: :: .
CCDS37 FYEVISTGHWAPSDLKTLQRRCLVPGWYAVHIERWLTYFATSQLLIIDGQQLRSDPATVM
720 730 740 750 760 770
230 240 250 260 270 280
pF1KE2 QKVERFLKLSPQINASN-FYFNKTKGFYC-LRDSGRDRCLHESKGRAHPQVDPKLLNKLH
..:..:: ..:. : :. . :. :::.: : ..:. .:: .:::: .: .::. . :
CCDS37 DEVQKFLGVTPRYNYSEALTFDPQKGFWCQLLEGGKTKCLGKSKGRKYPPMDPESRTFLS
780 790 800 810 820 830
290 300
pF1KE2 EYFHEPNKKFFELVGRTFDWH
.:... : .. .:. :
CCDS37 NYYRDHNVELSKLLHRLGQPLPSWLRQELQKVR
840 850 860 870
>>CCDS3708.1 NDST3 gene_id:9348|Hs108|chr4 (873 aa)
initn: 332 init1: 111 opt: 385 Z-score: 459.1 bits: 94.6 E(32554): 3e-19
Smith-Waterman score: 455; 31.4% identity (62.5% similar) in 283 aa overlap (42-302:583-856)
20 30 40 50 60 70
pF1KE2 VAQPQLVPSRTAELGQQELLRKAGTLQDDVRDGVAPNGSAQQLPQTIIIGVRKGGTRALL
:: . . . ..::. ..:: .: :: ::
CCDS37 PPVQLAHKYFELFPDQKDPLWQNPCDDKRHRDIWSKEKTCDRLPKFLVIGPQKTGTTALY
560 570 580 590 600 610
80 90 100 110 120
pF1KE2 EMLSLHPDVAAAE------NEVHFFDWEEHYSHGLGWYLSQMPFSWPHQLTV----EKTP
.: .::.. . .::.::. ...: .:. ::.. .: : ..:. ::.
CCDS37 LFLVMHPSILSNSPSPKTFEEVQFFN-RNNYHRGIDWYMDFFPV--PSNVTTDFLFEKSA
620 630 640 650 660
130 140 150 160 170
pF1KE2 AYFTSPKVPERVYSMNPSIRLLLILRDPSERVLSDYTQVFYNHMQKHKPYPSIEEF----
:: : ..:.:. :. :. ... :: :::.:. : .:.:...:. :. .:
CCDS37 NYFHSEEAPKRAASLVPKAKIITILIDPSDRAYS-----WYQHQRSHED-PAALKFSFYE
670 680 690 700 710 720
180 190 200 210 220 230
pF1KE2 LVRDG-RLNVDYKALN-RSL----YHVHMQNWLRFFPLRHIHIVDGDRLIRDPFPEIQKV
.. : : . .::. : : : :.. :: .:: .. :.::..: :: ...:
CCDS37 VISAGPRAPSELRALQKRCLVPGWYASHIERWLVYFPPFQLLIIDGQQLRTDPATVMDEV
730 740 750 760 770 780
240 250 260 270 280
pF1KE2 ERFLKLSPQINASN-FYFNKTKGFYC-LRDSGRDRCLHESKGRAHPQVDPKLLNKLHEYF
..:: . :. : :. . :.. :::.: : . :. .:: .:::: .: .: . : :.
CCDS37 QKFLGVLPHYNYSEALTFDSHKGFWCQLLEEGKTKCLGKSKGRKYPPMDSDSRTFLSSYY
790 800 810 820 830 840
290 300
pF1KE2 HEPNKKFFELVGRTFDWH
.. : .. .:. .
CCDS37 RDHNVELSKLLHKLGQPLPSWLRQELQKVR
850 860 870
>>CCDS7335.1 NDST2 gene_id:8509|Hs108|chr10 (883 aa)
initn: 311 init1: 107 opt: 357 Z-score: 425.4 bits: 88.4 E(32554): 2.2e-17
Smith-Waterman score: 436; 29.1% identity (62.1% similar) in 285 aa overlap (39-302:586-864)
10 20 30 40 50 60
pF1KE2 VLLVAQPQLVPSRTAELGQQELLRKAGTLQDDVR--DGVAPNGSAQQLPQTIIIGVRKGG
:: : : . . . ..::. .:.: .: :
CCDS73 RLQTLPPVPLAQKYFELFPQERSPLWQNPCDDKRHKDIWSKEKTCDRLPKFLIVGPQKTG
560 570 580 590 600 610
70 80 90 100 110
pF1KE2 TRALLEMLSLHPDVAAAE------NEVHFFDWEEHYSHGLGWYLS--QMPFSWPHQLTVE
: :. .::::: :... .:..::. .: .:. ::.. .: . .. :
CCDS73 TTAIHFFLSLHPAVTSSFPSPSTFEEIQFFN-SPNYHKGIDWYMDFFPVPSNASTDFLFE
620 630 640 650 660 670
120 130 140 150 160 170
pF1KE2 KTPAYFTSPKVPERVYSMNPSIRLLLILRDPSERVLSDYTQVFYNHMQKH-KPYP---SI
:. .:: : ::.: .. : ... .: .:..:. : .:.:.. : : ..
CCDS73 KSATYFDSEVVPRRGAALLPRAKIITVLTNPADRAYS-----WYQHQRAHGDPVALNYTF
680 690 700 710 720
180 190 200 210 220
pF1KE2 EEFLVRDGRLNVDYKAL-NRSL----YHVHMQNWLRFFPLRHIHIVDGDRLIRDPFPEIQ
. . ... . ..: :: : : .:.: :: ..: .. ::::..: .: ..
CCDS73 YQVISASSQTPLALRSLQNRCLVPGYYSTHLQRWLTYYPSGQLLIVDGQELRTNPAASME
730 740 750 760 770 780
230 240 250 260 270 280
pF1KE2 KVERFLKLSPQINAS-NFYFNKTKGFYCLR-DSGRDRCLHESKGRAHPQVDPKLLNKLHE
....:: ..: .: . .. :. :::.: ..:. ::: .:::: .:..: . : .
CCDS73 SIQKFLGITPFLNYTRTLRFDDDKGFWCQGLEGGKTRCLGRSKGRRYPDMDTESRLFLTD
790 800 810 820 830 840
290 300
pF1KE2 YFHEPNKKFFELVGRTFDWH
.:.. : .. .:..:
CCDS73 FFRNHNLELSKLLSRLGQPVPSWLREELQHSSLG
850 860 870 880
307 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Jun 29 17:40:37 2017 done: Thu Jun 29 17:40:37 2017
Total Scan time: 2.540 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]