FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2696, 307 aa 1>>>pF1KE2696 307 - 307 aa - 307 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5919+/-0.000841; mu= 13.9629+/- 0.050 mean_var=69.5529+/-14.008, 0's: 0 Z-trim(107.3): 25 B-trim: 0 in 0/50 Lambda= 0.153786 statistics sampled from 9476 (9495) to 9476 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.676), E-opt: 0.2 (0.292), width: 16 Scan time: 2.540 The best scores are: opt bits E(32554) CCDS3408.1 HS3ST1 gene_id:9957|Hs108|chr4 ( 307) 2109 476.8 8.7e-135 CCDS34517.1 HS3ST5 gene_id:222537|Hs108|chr6 ( 346) 1014 233.9 1.3e-61 CCDS53995.1 HS3ST4 gene_id:9951|Hs108|chr16 ( 456) 789 184.1 1.8e-46 CCDS10606.1 HS3ST2 gene_id:9956|Hs108|chr16 ( 367) 784 182.9 3.2e-46 CCDS45381.2 HS3ST6 gene_id:64711|Hs108|chr16 ( 342) 781 182.2 4.8e-46 CCDS11167.1 HS3ST3B1 gene_id:9953|Hs108|chr17 ( 390) 773 180.5 1.8e-45 CCDS11165.1 HS3ST3A1 gene_id:9955|Hs108|chr17 ( 406) 766 178.9 5.5e-45 CCDS3706.1 NDST4 gene_id:64579|Hs108|chr4 ( 872) 398 97.4 4e-20 CCDS3708.1 NDST3 gene_id:9348|Hs108|chr4 ( 873) 385 94.6 3e-19 CCDS7335.1 NDST2 gene_id:8509|Hs108|chr10 ( 883) 357 88.4 2.2e-17 >>CCDS3408.1 HS3ST1 gene_id:9957|Hs108|chr4 (307 aa) initn: 2109 init1: 2109 opt: 2109 Z-score: 2533.3 bits: 476.8 E(32554): 8.7e-135 Smith-Waterman score: 2109; 99.7% identity (99.7% similar) in 307 aa overlap (1-307:1-307) 10 20 30 40 50 60 pF1KE2 MAALLLGAVLLVAQPQLVPSRTAELGQQELLRKAGTLQDDVRDGVAPNGSAQQLPQTIII ::::::::::::::::::::: :::::::::::::::::::::::::::::::::::::: CCDS34 MAALLLGAVLLVAQPQLVPSRPAELGQQELLRKAGTLQDDVRDGVAPNGSAQQLPQTIII 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 GVRKGGTRALLEMLSLHPDVAAAENEVHFFDWEEHYSHGLGWYLSQMPFSWPHQLTVEKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 GVRKGGTRALLEMLSLHPDVAAAENEVHFFDWEEHYSHGLGWYLSQMPFSWPHQLTVEKT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 PAYFTSPKVPERVYSMNPSIRLLLILRDPSERVLSDYTQVFYNHMQKHKPYPSIEEFLVR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PAYFTSPKVPERVYSMNPSIRLLLILRDPSERVLSDYTQVFYNHMQKHKPYPSIEEFLVR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 DGRLNVDYKALNRSLYHVHMQNWLRFFPLRHIHIVDGDRLIRDPFPEIQKVERFLKLSPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 DGRLNVDYKALNRSLYHVHMQNWLRFFPLRHIHIVDGDRLIRDPFPEIQKVERFLKLSPQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 INASNFYFNKTKGFYCLRDSGRDRCLHESKGRAHPQVDPKLLNKLHEYFHEPNKKFFELV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 INASNFYFNKTKGFYCLRDSGRDRCLHESKGRAHPQVDPKLLNKLHEYFHEPNKKFFELV 250 260 270 280 290 300 pF1KE2 GRTFDWH ::::::: CCDS34 GRTFDWH >>CCDS34517.1 HS3ST5 gene_id:222537|Hs108|chr6 (346 aa) initn: 1039 init1: 534 opt: 1014 Z-score: 1219.5 bits: 233.9 E(32554): 1.3e-61 Smith-Waterman score: 1014; 49.8% identity (79.8% similar) in 297 aa overlap (20-306:50-345) 10 20 30 40 pF1KE2 MAALLLGAVLLVAQPQLVPSRT-AELGQQELLRKAGTLQDDVRDGVAPN .:: ::. . : : : :.. : : : . CCDS34 AVGSLLYLVARVGSLDRLQPICPIEGRLGGARTQAEFPLRALQFKRGLLHE-FRKGNASK 20 30 40 50 60 70 50 60 70 80 90 100 pF1KE2 GSA------QQLPQTIIIGVRKGGTRALLEMLSLHPDVAAAENEVHFFDWEEHYSHGLGW .. ::::..:::::::::::::::::.::: :. : .:.:::: .:.:..:. : CCDS34 EQVRLHDLVQQLPKAIIIGVRKGGTRALLEMLNLHPAVVKASQEIHFFDNDENYGKGIEW 80 90 100 110 120 130 110 120 130 140 150 160 pF1KE2 YLSQMPFSWPHQLTVEKTPAYFTSPKVPERVYSMNPSIRLLLILRDPSERVLSDYTQVFY : ..::::.:.:.:.::.:::: . .::::.:.:: ::.::.:.:.:. :..::::::. CCDS34 YRKKMPFSYPQQITIEKSPAYFITEEVPERIYKMNSSIKLLIIVREPTTRAISDYTQVLE 140 150 160 170 180 190 170 180 190 200 210 220 pF1KE2 NHMQKHKPYPSIEEFLVRDG--RLNVDYKALNRSLYHVHMQNWLRFFPLRHIHIVDGDRL .. .:.: : ..:.. . . ..:. :::. :.: :.. ::..::....:.:::::: CCDS34 GKERKNKTYYKFEKLAIDPNTCEVNTKYKAVRTSIYTKHLERWLKYFPIEQFHVVDGDRL 200 210 220 230 240 250 230 240 250 260 270 pF1KE2 IRDPFPEIQKVERFLKLSPQINASNFYFNKTKGFYCLR-DSGRDRCLHESKGRAHPQVDP : .:.::.: ::.::.: :.:. :.::: :.:::::: . ..:: :::: ::.::: CCDS34 ITEPLPELQLVEKFLNLPPRISQYNLYFNATRGFYCLRFNIIFNKCLAGSKGRIHPEVDP 260 270 280 290 300 310 280 290 300 pF1KE2 KLLNKLHEYFHEPNKKFFELVGRTFDWH ....::...:: :.::....:::..: CCDS34 SVITKLRKFFHPFNQKFYQITGRTLNWP 320 330 340 >>CCDS53995.1 HS3ST4 gene_id:9951|Hs108|chr16 (456 aa) initn: 582 init1: 213 opt: 789 Z-score: 947.9 bits: 184.1 E(32554): 1.8e-46 Smith-Waterman score: 789; 39.6% identity (73.4% similar) in 308 aa overlap (10-306:149-449) 10 20 30 pF1KE2 MAALLLGAVLLVAQPQLVPSRTAELGQ---QELLRKAGT ...:: : : : :. .. ..: . .. CCDS53 AAPGTDGWGLPSGGGGAQDAWLRTPLAPSEMITAQSAL-PEREAQESSTTDEDLAGRRAA 120 130 140 150 160 170 40 50 60 70 80 90 pF1KE2 LQDDVRDGVA--PNGSAQQLPQTIIIGVRKGGTRALLEMLSLHPDVAAAENEVHFFDWEE .. : :.. :. . ..:::..::::.::::::::: . .:::: :. : :::: . CCDS53 NGSSERGGAVSTPDYGEKKLPQALIIGVKKGGTRALLEAIRVHPDVRAVGVEPHFFD--R 180 190 200 210 220 230 100 110 120 130 140 150 pF1KE2 HYSHGLGWYLSQMPFSWPHQLTVEKTPAYFTSPKVPERVYSMNPSIRLLLILRDPSERVL .: .:: :: . :: . :.:.::::.::.. ..:.:..:: .:.:....:.: :.. CCDS53 NYEKGLEWYRNVMPKTLDGQITMEKTPSYFVTNEAPKRIHSMAKDIKLIVVVRNPVTRAI 240 250 260 270 280 290 160 170 180 190 200 210 pF1KE2 SDYTQVFYNHMQKHKPYPSIEEFLVRD---GRLNVDYKALNRSLYHVHMQNWLRFFPLRH :::::. ..:. :..: . .. : ......:. ..: .:..:::..::: . CCDS53 SDYTQT----LSKKPEIPTFEVLAFKNRTLGLIDASWSAIRIGIYALHLENWLQYFPLSQ 300 310 320 330 340 350 220 230 240 250 260 pF1KE2 IHIVDGDRLIRDPFPEIQKVERFLKLSPQINASNFYFNKTKGFYCLR---DSGRDRCLHE : .:.:.::: :: :. ::. :: :. .. ..::::::::: ::. ::. ::: . CCDS53 ILFVSGERLIVDPAGEMAKVQDFLGLKRVVTEKHFYFNKTKGFPCLKKPEDSSAPRCLGK 360 370 380 390 400 410 270 280 290 300 pF1KE2 SKGRAHPQVDPKLLNKLHEYFHEPNKKFFELVGRTFDWH ::::.::..:: ....:..... : :....:. :.: CCDS53 SKGRTHPRIDPDVIHRLRKFYKPFNLMFYQMTGQDFQWEQEEGDK 420 430 440 450 >>CCDS10606.1 HS3ST2 gene_id:9956|Hs108|chr16 (367 aa) initn: 578 init1: 213 opt: 784 Z-score: 943.3 bits: 182.9 E(32554): 3.2e-46 Smith-Waterman score: 784; 42.3% identity (76.8% similar) in 267 aa overlap (46-306:106-366) 20 30 40 50 60 70 pF1KE2 QLVPSRTAELGQQELLRKAGTLQDDVRDGVAPNGSAQQLPQTIIIGVRKGGTRALLEMLS .:. ....:::..:.::.::::::.::.. CCDS10 SGPTPSEPSAPSAPAAAVPAPRLSGSNHSGSPKLGTKRLPQALIVGVKKGGTRAVLEFIR 80 90 100 110 120 130 80 90 100 110 120 130 pF1KE2 LHPDVAAAENEVHFFDWEEHYSHGLGWYLSQMPFSWPHQLTVEKTPAYFTSPKVPERVYS .:::: : .: :::: ..:..:: :: : :: . :.:.::::.::.. ..:.:... CCDS10 VHPDVRALGTEPHFFD--RNYGRGLDWYRSLMPRTLESQITLEKTPSYFVTQEAPRRIFN 140 150 160 170 180 190 140 150 160 170 180 190 pF1KE2 MNPSIRLLLILRDPSERVLSDYTQVFYNHMQKHKPYPSIEEFLVRD---GRLNVDYKALN :. . .:....:.: :..:::::. ..:. :..: . :. : ..:...:. CCDS10 MSRDTKLIVVVRNPVTRAISDYTQT----LSKKPDIPTFEGLSFRNRTLGLVDVSWNAIR 200 210 220 230 240 200 210 220 230 240 250 pF1KE2 RSLYHVHMQNWLRFFPLRHIHIVDGDRLIRDPFPEIQKVERFLKLSPQINASNFYFNKTK ..: .:...::..::: .::.:.:.::: :: :. .:. :: .. :. ..::::::: CCDS10 IGMYVLHLESWLQYFPLAQIHFVSGERLITDPAGEMGRVQDFLGIKRFITDKHFYFNKTK 250 260 270 280 290 300 260 270 280 290 300 pF1KE2 GFYCLRDSGRD---RCLHESKGRAHPQVDPKLLNKLHEYFHEPNKKFFELVGRTFDWH :: ::. . . ::: .::::.: :.::.....:.:... : ::.: ::. : : CCDS10 GFPCLKKTESSLLPRCLGKSKGRTHVQIDPEVIDQLREFYRPYNIKFYETVGQDFRWE 310 320 330 340 350 360 >>CCDS45381.2 HS3ST6 gene_id:64711|Hs108|chr16 (342 aa) initn: 691 init1: 229 opt: 781 Z-score: 940.2 bits: 182.2 E(32554): 4.8e-46 Smith-Waterman score: 781; 39.5% identity (69.4% similar) in 314 aa overlap (1-306:34-341) 10 20 pF1KE2 MAALLLGAVLLVAQP-QLVPSRTAELGQQE ..::.::: : : : . :. : CCDS45 SGGLGGGAGGGQGAGAGQGAALRASRAPMLLVALVLGAYCLCALPGRCPPAARAPAPAPA 10 20 30 40 50 60 30 40 50 60 70 80 pF1KE2 LLRKAGTLQDDVRDGV--APNGSAQQLPQTIIIGVRKGGTRALLEMLSLHPDVAAAENEV . ..... :. : . . ...::..:.::.:::::::::.: ::::: : .: CCDS45 PSEPSSSVHRPGAPGLPLASGPGRRRFPQALIVGVKKGGTRALLEFLRLHPDVRALGSEP 70 80 90 100 110 120 90 100 110 120 130 140 pF1KE2 HFFDWEEHYSHGLGWYLSQMPFSWPHQLTVEKTPAYFTSPKVPERVYSMNPSIRLLLILR :::: . : .::.:: : :: . :.:.::::.::.. ..:.:...:.:. .:....: CCDS45 HFFD--RCYERGLAWYRSLMPRTLDGQITMEKTPSYFVTREAPRRIHAMSPDTKLIVVVR 130 140 150 160 170 180 150 160 170 180 190 200 pF1KE2 DPSERVLSDYTQVFYNHMQKHKPYPSIEEFLVRDGRLNVD--YKALNRSLYHVHMQNWLR .: :..:::.:. ..: ::.. . : : :: ..:. .:: :...::: CCDS45 NPVTRAISDYAQT----LSKTPGLPSFRALAFRHGLGPVDTAWSAVRIGLYAQHLDHWLR 190 200 210 220 230 210 220 230 240 250 260 pF1KE2 FFPLRHIHIVDGDRLIRDPFPEIQKVERFLKLSPQINASNFYFNKTKGFYCLRDS---GR .::: :. .:.:.::. :: :. .:. :: :. .. ..:::: :::: ::. . .: CCDS45 YFPLSHFLFVSGERLVSDPAGEVGRVQDFLGLKRVVTDKHFYFNATKGFPCLKKAQGGSR 240 250 260 270 280 290 270 280 290 300 pF1KE2 DRCLHESKGRAHPQVDPKLLNKLHEYFHEPNKKFFELVGRTFDWH ::: .:::: ::.: :. .:.:... :..:....:. : : CCDS45 PRCLGKSKGRPHPRVPQALVRRLQEFYRPFNRRFYQMTGQDFGWG 300 310 320 330 340 >>CCDS11167.1 HS3ST3B1 gene_id:9953|Hs108|chr17 (390 aa) initn: 578 init1: 207 opt: 773 Z-score: 929.7 bits: 180.5 E(32554): 1.8e-45 Smith-Waterman score: 773; 39.7% identity (72.3% similar) in 307 aa overlap (15-306:89-389) 10 20 30 40 pF1KE2 MAALLLGAVLLVAQPQLVPSRTAELGQQELLRKAGTLQD---DV : .: : . .:. . :.. .. .: CCDS11 PGLLLLGSGSRAAHDPPALATAPDGTPPRLPFRAPPATPLASGKEMAEGAASPEEQSPEV 60 70 80 90 100 110 50 60 70 80 90 pF1KE2 RDGVAP-----NGS-AQQLPQTIIIGVRKGGTRALLEMLSLHPDVAAAENEVHFFDWEEH :. .: .:: ..::::.:::::.:::::::::.: .:::: :. : :::: . CCDS11 PDSPSPISSFFSGSGSKQLPQAIIIGVKKGGTRALLEFLRVHPDVRAVGAEPHFFD--RS 120 130 140 150 160 170 100 110 120 130 140 150 pF1KE2 YSHGLGWYLSQMPFSWPHQLTVEKTPAYFTSPKVPERVYSMNPSIRLLLILRDPSERVLS :..::.:: . :: . :.:.::::.::.. ..: :. .:. . .:....::: :..: CCDS11 YDKGLAWYRDLMPRTLDGQITMEKTPSYFVTREAPARISAMSKDTKLIVVVRDPVTRAIS 180 190 200 210 220 230 160 170 180 190 200 210 pF1KE2 DYTQVFYNHMQKHKPYPSIEEFLVRD---GRLNVDYKALNRSLYHVHMQNWLRFFPLRHI ::::. ..:. :..: . .. : ......:.. ..: :...::: ::.:.. CCDS11 DYTQT----LSKRPDIPTFESLTFKNRTAGLIDTSWSAIQIGIYAKHLEHWLRHFPIRQM 240 250 260 270 280 290 220 230 240 250 260 pF1KE2 HIVDGDRLIRDPFPEIQKVERFLKLSPQINASNFYFNKTKGFYCLRD---SGRDRCLHES .:.:.::: :: :. .:. :: :. :. ..::::::::: ::. :.: .:: .. CCDS11 LFVSGERLISDPAGELGRVQDFLGLKRIITDKHFYFNKTKGFPCLKKAEGSSRPHCLGKT 300 310 320 330 340 350 270 280 290 300 pF1KE2 KGRAHPQVDPKLLNKLHEYFHEPNKKFFELVGRTFDWH :::.::..: ... .:.:... : ::....:. : : CCDS11 KGRTHPEIDREVVRRLREFYRPFNLKFYQMTGHDFGWD 360 370 380 390 >>CCDS11165.1 HS3ST3A1 gene_id:9955|Hs108|chr17 (406 aa) initn: 578 init1: 207 opt: 766 Z-score: 921.1 bits: 178.9 E(32554): 5.5e-45 Smith-Waterman score: 766; 42.7% identity (76.0% similar) in 262 aa overlap (51-306:149-404) 30 40 50 60 70 80 pF1KE2 RTAELGQQELLRKAGTLQDDVRDGVAPNGSAQQLPQTIIIGVRKGGTRALLEMLSLHPDV ..::::.:::::.:::::::::.: .:::: CCDS11 GLSGGPGGSGAGSTVAEAPPGTLALLLDEGSKQLPQAIIIGVKKGGTRALLEFLRVHPDV 120 130 140 150 160 170 90 100 110 120 130 140 pF1KE2 AAAENEVHFFDWEEHYSHGLGWYLSQMPFSWPHQLTVEKTPAYFTSPKVPERVYSMNPSI :. : :::: . :..::.:: . :: . :.:.::::.::.. ..: :. .:. . CCDS11 RAVGAEPHFFD--RSYDKGLAWYRDLMPRTLDGQITMEKTPSYFVTREAPARISAMSKDT 180 190 200 210 220 230 150 160 170 180 190 pF1KE2 RLLLILRDPSERVLSDYTQVFYNHMQKHKPYPSIEEFLVRD---GRLNVDYKALNRSLYH .:....::: :..:::::. ..:. :..: . .. : ......:.. ..: CCDS11 KLIVVVRDPVTRAISDYTQT----LSKRPDIPTFESLTFKNRTAGLIDTSWSAIQIGIYA 240 250 260 270 280 290 200 210 220 230 240 250 pF1KE2 VHMQNWLRFFPLRHIHIVDGDRLIRDPFPEIQKVERFLKLSPQINASNFYFNKTKGFYCL :...::: ::.:.. .:.:.::: :: :. .:. :: :. :. ..::::::::: :: CCDS11 KHLEHWLRHFPIRQMLFVSGERLISDPAGELGRVQDFLGLKRIITDKHFYFNKTKGFPCL 300 310 320 330 340 350 260 270 280 290 300 pF1KE2 RD---SGRDRCLHESKGRAHPQVDPKLLNKLHEYFHEPNKKFFELVGRTFDWH . :.: .:: ..:::.::..: ... .:.:... : ::....:. : : CCDS11 KKAEGSSRPHCLGKTKGRTHPEIDREVVRRLREFYRPFNLKFYQMTGHDFGWDG 360 370 380 390 400 >>CCDS3706.1 NDST4 gene_id:64579|Hs108|chr4 (872 aa) initn: 352 init1: 130 opt: 398 Z-score: 474.7 bits: 97.4 E(32554): 4e-20 Smith-Waterman score: 474; 31.5% identity (62.9% similar) in 286 aa overlap (39-302:577-855) 10 20 30 40 50 60 pF1KE2 VLLVAQPQLVPSRTAELGQQELLRKAGTLQDDVR--DGVAPNGSAQQLPQTIIIGVRKGG :: : : . . . ..::. ..:: .: : CCDS37 KLQTLPPVQLAHQYFELFPEQKDPLWQNPCDDKRHKDIWSREKTCDHLPKFLVIGPQKTG 550 560 570 580 590 600 70 80 90 100 110 pF1KE2 TRALLEMLSLHPDVAA------AENEVHFFDWEEHYSHGLGWYLS--QMPFSWPHQLTVE : :: .: .::.. . . .::.::. . .: .:. ::.. : . .. : CCDS37 TTALYLFLLMHPSIISNLPSPKTFEEVQFFNGN-NYHKGIDWYMDFFPTPSNTTSDFLFE 610 620 630 640 650 660 120 130 140 150 160 170 pF1KE2 KTPAYFTSPKVPERVYSMNPSIRLLLILRDPSERVLSDYTQVFYNHMQKHKPYPSIEEF- :. :: : ..:.:. :. :. ... :: :::.:. : .:.:...:. :. .: CCDS37 KSANYFHSEEAPRRAASLVPKAKIITILIDPSDRAYS-----WYQHQRSHED-PAALRFN 670 680 690 700 710 180 190 200 210 220 pF1KE2 ---LVRDGRLN-VDYKALNR-----SLYHVHMQNWLRFFPLRHIHIVDGDRLIRDPFPEI .. :. : :.:.: . : ::.. :: .: .. :.::..: :: . CCDS37 FYEVISTGHWAPSDLKTLQRRCLVPGWYAVHIERWLTYFATSQLLIIDGQQLRSDPATVM 720 730 740 750 760 770 230 240 250 260 270 280 pF1KE2 QKVERFLKLSPQINASN-FYFNKTKGFYC-LRDSGRDRCLHESKGRAHPQVDPKLLNKLH ..:..:: ..:. : :. . :. :::.: : ..:. .:: .:::: .: .::. . : CCDS37 DEVQKFLGVTPRYNYSEALTFDPQKGFWCQLLEGGKTKCLGKSKGRKYPPMDPESRTFLS 780 790 800 810 820 830 290 300 pF1KE2 EYFHEPNKKFFELVGRTFDWH .:... : .. .:. : CCDS37 NYYRDHNVELSKLLHRLGQPLPSWLRQELQKVR 840 850 860 870 >>CCDS3708.1 NDST3 gene_id:9348|Hs108|chr4 (873 aa) initn: 332 init1: 111 opt: 385 Z-score: 459.1 bits: 94.6 E(32554): 3e-19 Smith-Waterman score: 455; 31.4% identity (62.5% similar) in 283 aa overlap (42-302:583-856) 20 30 40 50 60 70 pF1KE2 VAQPQLVPSRTAELGQQELLRKAGTLQDDVRDGVAPNGSAQQLPQTIIIGVRKGGTRALL :: . . . ..::. ..:: .: :: :: CCDS37 PPVQLAHKYFELFPDQKDPLWQNPCDDKRHRDIWSKEKTCDRLPKFLVIGPQKTGTTALY 560 570 580 590 600 610 80 90 100 110 120 pF1KE2 EMLSLHPDVAAAE------NEVHFFDWEEHYSHGLGWYLSQMPFSWPHQLTV----EKTP .: .::.. . .::.::. ...: .:. ::.. .: : ..:. ::. CCDS37 LFLVMHPSILSNSPSPKTFEEVQFFN-RNNYHRGIDWYMDFFPV--PSNVTTDFLFEKSA 620 630 640 650 660 130 140 150 160 170 pF1KE2 AYFTSPKVPERVYSMNPSIRLLLILRDPSERVLSDYTQVFYNHMQKHKPYPSIEEF---- :: : ..:.:. :. :. ... :: :::.:. : .:.:...:. :. .: CCDS37 NYFHSEEAPKRAASLVPKAKIITILIDPSDRAYS-----WYQHQRSHED-PAALKFSFYE 670 680 690 700 710 720 180 190 200 210 220 230 pF1KE2 LVRDG-RLNVDYKALN-RSL----YHVHMQNWLRFFPLRHIHIVDGDRLIRDPFPEIQKV .. : : . .::. : : : :.. :: .:: .. :.::..: :: ...: CCDS37 VISAGPRAPSELRALQKRCLVPGWYASHIERWLVYFPPFQLLIIDGQQLRTDPATVMDEV 730 740 750 760 770 780 240 250 260 270 280 pF1KE2 ERFLKLSPQINASN-FYFNKTKGFYC-LRDSGRDRCLHESKGRAHPQVDPKLLNKLHEYF ..:: . :. : :. . :.. :::.: : . :. .:: .:::: .: .: . : :. CCDS37 QKFLGVLPHYNYSEALTFDSHKGFWCQLLEEGKTKCLGKSKGRKYPPMDSDSRTFLSSYY 790 800 810 820 830 840 290 300 pF1KE2 HEPNKKFFELVGRTFDWH .. : .. .:. . CCDS37 RDHNVELSKLLHKLGQPLPSWLRQELQKVR 850 860 870 >>CCDS7335.1 NDST2 gene_id:8509|Hs108|chr10 (883 aa) initn: 311 init1: 107 opt: 357 Z-score: 425.4 bits: 88.4 E(32554): 2.2e-17 Smith-Waterman score: 436; 29.1% identity (62.1% similar) in 285 aa overlap (39-302:586-864) 10 20 30 40 50 60 pF1KE2 VLLVAQPQLVPSRTAELGQQELLRKAGTLQDDVR--DGVAPNGSAQQLPQTIIIGVRKGG :: : : . . . ..::. .:.: .: : CCDS73 RLQTLPPVPLAQKYFELFPQERSPLWQNPCDDKRHKDIWSKEKTCDRLPKFLIVGPQKTG 560 570 580 590 600 610 70 80 90 100 110 pF1KE2 TRALLEMLSLHPDVAAAE------NEVHFFDWEEHYSHGLGWYLS--QMPFSWPHQLTVE : :. .::::: :... .:..::. .: .:. ::.. .: . .. : CCDS73 TTAIHFFLSLHPAVTSSFPSPSTFEEIQFFN-SPNYHKGIDWYMDFFPVPSNASTDFLFE 620 630 640 650 660 670 120 130 140 150 160 170 pF1KE2 KTPAYFTSPKVPERVYSMNPSIRLLLILRDPSERVLSDYTQVFYNHMQKH-KPYP---SI :. .:: : ::.: .. : ... .: .:..:. : .:.:.. : : .. CCDS73 KSATYFDSEVVPRRGAALLPRAKIITVLTNPADRAYS-----WYQHQRAHGDPVALNYTF 680 690 700 710 720 180 190 200 210 220 pF1KE2 EEFLVRDGRLNVDYKAL-NRSL----YHVHMQNWLRFFPLRHIHIVDGDRLIRDPFPEIQ . . ... . ..: :: : : .:.: :: ..: .. ::::..: .: .. CCDS73 YQVISASSQTPLALRSLQNRCLVPGYYSTHLQRWLTYYPSGQLLIVDGQELRTNPAASME 730 740 750 760 770 780 230 240 250 260 270 280 pF1KE2 KVERFLKLSPQINAS-NFYFNKTKGFYCLR-DSGRDRCLHESKGRAHPQVDPKLLNKLHE ....:: ..: .: . .. :. :::.: ..:. ::: .:::: .:..: . : . CCDS73 SIQKFLGITPFLNYTRTLRFDDDKGFWCQGLEGGKTRCLGRSKGRRYPDMDTESRLFLTD 790 800 810 820 830 840 290 300 pF1KE2 YFHEPNKKFFELVGRTFDWH .:.. : .. .:..: CCDS73 FFRNHNLELSKLLSRLGQPVPSWLREELQHSSLG 850 860 870 880 307 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Jun 29 17:40:37 2017 done: Thu Jun 29 17:40:37 2017 Total Scan time: 2.540 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]