FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4350, 365 aa
1>>>pF1KE4350 365 - 365 aa - 365 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.6805+/-0.000837; mu= 2.2830+/- 0.051
mean_var=199.2008+/-39.643, 0's: 0 Z-trim(114.2): 24 B-trim: 7 in 1/55
Lambda= 0.090872
statistics sampled from 14773 (14795) to 14773 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.781), E-opt: 0.2 (0.454), width: 16
Scan time: 3.160
The best scores are: opt bits E(32554)
CCDS12723.1 SULT2B1 gene_id:6820|Hs108|chr19 ( 365) 2562 347.9 8.3e-96
CCDS12724.1 SULT2B1 gene_id:6820|Hs108|chr19 ( 350) 2394 325.8 3.4e-89
CCDS12707.1 SULT2A1 gene_id:6822|Hs108|chr19 ( 285) 994 142.2 5.2e-34
CCDS32427.1 SULT1A4 gene_id:445329|Hs108|chr16 ( 295) 739 108.8 6.2e-24
CCDS10674.1 SULT1A3 gene_id:6818|Hs108|chr16 ( 295) 739 108.8 6.2e-24
CCDS32420.1 SULT1A1 gene_id:6817|Hs108|chr16 ( 295) 726 107.1 2e-23
CCDS33267.1 SULT1C3 gene_id:442038|Hs108|chr2 ( 304) 716 105.8 5.1e-23
CCDS10636.1 SULT1A2 gene_id:6799|Hs108|chr16 ( 295) 710 105.0 8.7e-23
CCDS2075.1 SULT1C2 gene_id:6819|Hs108|chr2 ( 296) 708 104.7 1e-22
CCDS3530.1 SULT1B1 gene_id:27284|Hs108|chr4 ( 296) 701 103.8 2e-22
CCDS2077.1 SULT1C4 gene_id:27233|Hs108|chr2 ( 302) 700 103.7 2.2e-22
CCDS3531.1 SULT1E1 gene_id:6783|Hs108|chr4 ( 294) 688 102.1 6.4e-22
CCDS2076.1 SULT1C2 gene_id:6819|Hs108|chr2 ( 307) 550 84.0 1.8e-16
CCDS10637.1 SULT1A1 gene_id:6817|Hs108|chr16 ( 217) 514 79.2 3.7e-15
CCDS33182.1 SULT6B1 gene_id:391365|Hs108|chr2 ( 265) 472 73.8 2e-13
CCDS14051.1 SULT4A1 gene_id:25830|Hs108|chr22 ( 284) 436 69.1 5.5e-12
>>CCDS12723.1 SULT2B1 gene_id:6820|Hs108|chr19 (365 aa)
initn: 2562 init1: 2562 opt: 2562 Z-score: 1833.5 bits: 347.9 E(32554): 8.3e-96
Smith-Waterman score: 2562; 100.0% identity (100.0% similar) in 365 aa overlap (1-365:1-365)
10 20 30 40 50 60
pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIVGAFSLPDQYSPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIVGAFSLPDQYSPR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 LMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 KGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 KGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 VAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 VAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 MRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETP
310 320 330 340 350 360
pF1KE4 HPRPS
:::::
CCDS12 HPRPS
>>CCDS12724.1 SULT2B1 gene_id:6820|Hs108|chr19 (350 aa)
initn: 2394 init1: 2394 opt: 2394 Z-score: 1714.7 bits: 325.8 E(32554): 3.4e-89
Smith-Waterman score: 2394; 100.0% identity (100.0% similar) in 342 aa overlap (24-365:9-350)
10 20 30 40 50 60
pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD
:::::::::::::::::::::::::::::::::::::
CCDS12 MASPPPFHSQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD
10 20 30 40
70 80 90 100 110 120
pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIVGAFSLPDQYSPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIVGAFSLPDQYSPR
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE4 LMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFL
110 120 130 140 150 160
190 200 210 220 230 240
pF1KE4 KGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 KGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSV
170 180 190 200 210 220
250 260 270 280 290 300
pF1KE4 VAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 VAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQ
230 240 250 260 270 280
310 320 330 340 350 360
pF1KE4 MRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETP
290 300 310 320 330 340
pF1KE4 HPRPS
:::::
CCDS12 HPRPS
350
>>CCDS12707.1 SULT2A1 gene_id:6822|Hs108|chr19 (285 aa)
initn: 998 init1: 830 opt: 994 Z-score: 724.0 bits: 142.2 E(32554): 5.2e-34
Smith-Waterman score: 994; 48.1% identity (76.3% similar) in 287 aa overlap (27-310:1-285)
10 20 30 40 50 60
pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD
. ... ..:. ::. . :.. ... .::
CCDS12 MSDDFLWFEGIAFPTMGFRSETLRKVRDEFVIRD
10 20 30
70 80 90 100 110 120
pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIVGAFSLPDQYSPR
.:..:.:::::::.:. ::.::. ..:: .::.:::::::.:: :. .: .: . :::
CCDS12 EDVIILTYPKSGTNWLAEILCLMHSKGDAKWIQSVPIWERSPWVESEIGYTALSETESPR
40 50 60 70 80 90
130 140 150 160 170 180
pF1KE4 LMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFL
:.:::::::.: :.::::::::::. ::::::.:: : . : .: : . ..... :
CCDS12 LFSSHLPIQLFPKSFFSSKAKVIYLMRNPRDVLVSGYFFWKNMKFIKKPKSWEEYFEWFC
100 110 120 130 140 150
190 200 210 220 230 240
pF1KE4 KGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSV
.: : .:::::::.::. :. . :::...::::.:: ..:.:: :::. : : :. .
CCDS12 QGTVLYGSWFDHIHGWMPMREEKNFLLLSYEELKQDTGRTIEKICQFLGKTLEPEELNLI
160 170 180 190 200 210
250 260 270 280 290
pF1KE4 VAHSTFSAMKANTMSNYTLLPPS-LLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRK
. .:.:..:: : ::::.:: . ..: .. .::::: :::::::::::.: ::. ...
CCDS12 LKNSSFQSMKENKMSNYSLLSVDYVVD--KAQLLRKGVSGDWKNHFTVAQAEDFDKLFQE
220 230 240 250 260 270
300 310 320 330 340 350
pF1KE4 QMRGMPT--FPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQAS
.: .: :::.
CCDS12 KMADLPRELFPWE
280
>>CCDS32427.1 SULT1A4 gene_id:445329|Hs108|chr16 (295 aa)
initn: 767 init1: 591 opt: 739 Z-score: 543.2 bits: 108.8 E(32554): 6.2e-24
Smith-Waterman score: 739; 39.3% identity (69.1% similar) in 285 aa overlap (24-303:7-286)
10 20 30 40 50 60
pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD
... : :: ::::. : :... .. : .:
CCDS32 MELIQDTSRPPLEY--VKGVPLI--KYFAEALGPLQSFQ-ARP
10 20 30
70 80 90 100 110
pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETI-----VGAFSLPD
::..: :::::::::. .:. .: . :: .::. :.:. :. : .: :
CCDS32 DDLLINTYPKSGTTWVSQILDMIYQGGDLEKCNRAPIYVRVPFLEVNDPGEPSGLETLKD
40 50 60 70 80 90
120 130 140 150 160 170
pF1KE4 QYSPRLMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQF
:::..::::. .. ......:.::.:..:::.::.:: ::. .. .::: :.:
CCDS32 TPPPRLIKSHLPLALLPQTLLDQKVKVVYVARNPKDVAVSYYHFHRMEKAHPEPGTWDSF
100 110 120 130 140 150
180 190 200 210 220 230
pF1KE4 LRDFLKGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKE
:. :. :::..:::..:.. : ... :.. ::..... . ...: :.:: : .:
CCDS32 LEKFMAGEVSYGSWYQHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEE
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE4 ALGSVVAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDR
.. .: :..:. :: : :.::: .: :.:: . :.:::. ::::. :::::.: ::
CCDS32 TMDFMVQHTSFKEMKKNPMTNYTTVPQELMDHSISPFMRKGMAGDWKTTFTVAQNERFDA
220 230 240 250 260 270
300 310 320 330 340 350
pF1KE4 AYRKQMRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQ
: ..: :
CCDS32 DYAEKMAGCSLSFRSEL
280 290
>>CCDS10674.1 SULT1A3 gene_id:6818|Hs108|chr16 (295 aa)
initn: 767 init1: 591 opt: 739 Z-score: 543.2 bits: 108.8 E(32554): 6.2e-24
Smith-Waterman score: 739; 39.3% identity (69.1% similar) in 285 aa overlap (24-303:7-286)
10 20 30 40 50 60
pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD
... : :: ::::. : :... .. : .:
CCDS10 MELIQDTSRPPLEY--VKGVPLI--KYFAEALGPLQSFQ-ARP
10 20 30
70 80 90 100 110
pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETI-----VGAFSLPD
::..: :::::::::. .:. .: . :: .::. :.:. :. : .: :
CCDS10 DDLLINTYPKSGTTWVSQILDMIYQGGDLEKCNRAPIYVRVPFLEVNDPGEPSGLETLKD
40 50 60 70 80 90
120 130 140 150 160 170
pF1KE4 QYSPRLMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQF
:::..::::. .. ......:.::.:..:::.::.:: ::. .. .::: :.:
CCDS10 TPPPRLIKSHLPLALLPQTLLDQKVKVVYVARNPKDVAVSYYHFHRMEKAHPEPGTWDSF
100 110 120 130 140 150
180 190 200 210 220 230
pF1KE4 LRDFLKGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKE
:. :. :::..:::..:.. : ... :.. ::..... . ...: :.:: : .:
CCDS10 LEKFMAGEVSYGSWYQHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEE
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE4 ALGSVVAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDR
.. .: :..:. :: : :.::: .: :.:: . :.:::. ::::. :::::.: ::
CCDS10 TMDFMVQHTSFKEMKKNPMTNYTTVPQELMDHSISPFMRKGMAGDWKTTFTVAQNERFDA
220 230 240 250 260 270
300 310 320 330 340 350
pF1KE4 AYRKQMRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQ
: ..: :
CCDS10 DYAEKMAGCSLSFRSEL
280 290
>>CCDS32420.1 SULT1A1 gene_id:6817|Hs108|chr16 (295 aa)
initn: 727 init1: 574 opt: 726 Z-score: 533.9 bits: 107.1 E(32554): 2e-23
Smith-Waterman score: 726; 38.9% identity (69.8% similar) in 285 aa overlap (24-303:7-286)
10 20 30 40 50 60
pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD
... : :: ::::. : :... .. : .:
CCDS32 MELIQDTSRPPLEY--VKGVPLI--KYFAEALGPLQSFQ-ARP
10 20 30
70 80 90 100 110
pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIV-----GAFSLPD
::..: :::::::::. .:. .: . :: . .::. :.:. : . : .: :
CCDS32 DDLLISTYPKSGTTWVSQILDMIYQGGDLEKCHRAPIFMRVPFLEFKAPGIPSGMETLKD
40 50 60 70 80 90
120 130 140 150 160 170
pF1KE4 QYSPRLMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQF
.:::...:::. .. ......:.::.:..:: .::.:: ::. ..: .::: :.:
CCDS32 TPAPRLLKTHLPLALLPQTLLDQKVKVVYVARNAKDVAVSYYHFYHMAKVHPEPGTWDSF
100 110 120 130 140 150
180 190 200 210 220 230
pF1KE4 LRDFLKGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKE
:. :. :::..:::..:.. : ... :.. ::..... . ...: :.:: : .:
CCDS32 LEKFMVGEVSYGSWYQHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEE
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE4 ALGSVVAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDR
.. :: :..:. :: : :.::: .: ..:: . :.:::. ::::. :::::.: ::
CCDS32 TVDFVVQHTSFKEMKKNPMTNYTTVPQEFMDHSISPFMRKGMAGDWKTTFTVAQNERFDA
220 230 240 250 260 270
300 310 320 330 340 350
pF1KE4 AYRKQMRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQ
: ..: :
CCDS32 DYAEKMAGCSLSFRSEL
280 290
>>CCDS33267.1 SULT1C3 gene_id:442038|Hs108|chr2 (304 aa)
initn: 726 init1: 607 opt: 716 Z-score: 526.7 bits: 105.8 E(32554): 5.1e-23
Smith-Waterman score: 716; 38.9% identity (68.9% similar) in 270 aa overlap (40-303:27-295)
10 20 30 40 50 60
pF1KE4 PGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRDDDIFIITYP
:. . : : . : : .. ::... :::
CCDS33 MAKIEKNAPTMEKKPELFNIMEVDGVPTLILSKEWWEKVCNFQ-AKPDDLILATYP
10 20 30 40 50
70 80 90 100 110 120
pF1KE4 KSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIVGAFSLPD------QYSPRLMS
::::::: ::. .::..:: . . .: . : :: . ::.:..
CCDS33 KSGTTWMHEILDMILNDGDVEKCKRAQTLDRHAFLELKFPHKEKPDLEFVLEMSSPQLIK
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE4 SHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFLKGE
.::: ... .... . :..:..:::.: .:: ::. ..:. . :: . ..: . :..:.
CCDS33 THLPSHLIPPSIWKENCKIVYVARNPKDCLVSYYHFHRMASFMPDPQNLEEFYEKFMSGK
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE4 VQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSVVAH
: ::::::.::: : .:.. ::....: . .:.: :: . ...: :.... :
CCDS33 VVGGSWFDHVKGWWAAKDMHRILYLFYEDIKKDPKREIEKILKFLEKDISEEILNKIIYH
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE4 STFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQMRG
..:..:: : :.::: :: :..:: . :.:::. :::::.:::::.: ::. :.:.: :
CCDS33 TSFDVMKQNPMTNYTTLPTSIMDHSISPFMRKGMPGDWKNYFTVAQNEEFDKDYQKKMAG
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE4 MPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETPHPR
CCDS33 STLTFRTEI
300
>>CCDS10636.1 SULT1A2 gene_id:6799|Hs108|chr16 (295 aa)
initn: 708 init1: 555 opt: 710 Z-score: 522.6 bits: 105.0 E(32554): 8.7e-23
Smith-Waterman score: 710; 38.8% identity (69.2% similar) in 289 aa overlap (20-303:4-286)
10 20 30 40 50 60
pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD
:..::. : :: ::::. : :... .. : .:
CCDS10 MELIQDISRP-PLEY--VKGVPLI--KYFAEALGPLQSFQ-ARP
10 20 30
70 80 90 100 110
pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIV-----GAFSLPD
::..: :::::::::. .:. .: . :: . .::. :.:. : : : .: .
CCDS10 DDLLISTYPKSGTTWVSQILDMIYQGGDLEKCHRAPIFMRVPFLEFKVPGIPSGMETLKN
40 50 60 70 80 90
120 130 140 150 160 170
pF1KE4 QYSPRLMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQF
.:::...:::. .. ......:.::.:..:: .::.:: ::. ..: ::: ..:
CCDS10 TPAPRLLKTHLPLALLPQTLLDQKVKVVYVARNAKDVAVSYYHFYHMAKVYPHPGTWESF
100 110 120 130 140 150
180 190 200 210 220 230
pF1KE4 LRDFLKGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKE
:. :. :::..:::..:.. : ... :.. ::..... . ...: :.:: : .:
CCDS10 LEKFMAGEVSYGSWYQHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEE
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE4 ALGSVVAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDR
.. .: :..:. :: : :.::: . ..:: . :.:::. ::::. :::::.: ::
CCDS10 TVDLMVEHTSFKEMKKNPMTNYTTVRREFMDHSISPFMRKGMAGDWKTTFTVAQNERFDA
220 230 240 250 260 270
300 310 320 330 340 350
pF1KE4 AYRKQMRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQ
: :.: :
CCDS10 DYAKKMAGCSLSFRSEL
280 290
>>CCDS2075.1 SULT1C2 gene_id:6819|Hs108|chr2 (296 aa)
initn: 742 init1: 599 opt: 708 Z-score: 521.2 bits: 104.7 E(32554): 1e-22
Smith-Waterman score: 708; 38.0% identity (71.0% similar) in 255 aa overlap (57-303:36-287)
30 40 50 60 70 80
pF1KE4 LPGEYFRYKGVPFPVGLYSLESISLAENTQDVRDDDIFIITYPKSGTTWMIEIICLILKE
... ::..: ::::.::::. ::. .: ..
CCDS20 DLGKQIKLKEVEGTLLQPATVDNWSQIQSFEAKPDDLLICTYPKAGTTWIQEIVDMIEQN
10 20 30 40 50 60
90 100 110 120 130
pF1KE4 GDPSWIRSVPI--------WERAPWCETIVGAFSLPDQYSPRLMSSHLPIQIFTKAFFSS
:: . . : : : : . : ..: :::....:: :.. .:. .
CCDS20 GDVEKCQRAIIQHRHPFIEWARPPQPSGVEKAKAMP---SPRILKTHLSTQLLPPSFWEN
70 80 90 100 110 120
140 150 160 170 180 190
pF1KE4 KAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFLKGEVQFGSWFDHIKGWLR
. : .:..:: .: .:: ::.... .: :::: ..... :..:.: .::::::.::: .
CCDS20 NCKFLYVARNAKDCMVSYYHFQRMNHMLPDPGTWEEYFETFINGKVVWGSWFDHVKGWWE
130 140 150 160 170 180
200 210 220 230 240 250
pF1KE4 MKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSVVAHSTFSAMKANTMSNYT
:: . ..::. ::....: . .... :.:. . . .: ..: ...: :: : :.: .
CCDS20 MKDRHQILFLFYEDIKRDPKHEIRKVMQFMGKKVDETVLDKIVQETSFEKMKENPMTNRS
190 200 210 220 230 240
260 270 280 290 300 310
pF1KE4 LLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQMRGMPTFPWDEDPEEDGS
. :.::. ..:.:::. :::::::::::.: ::. ::..:.:
CCDS20 TVSKSILDQSISSFMRKGTVGDWKNHFTVAQNERFDEIYRRKMEGTSINFCMEL
250 260 270 280 290
320 330 340 350 360
pF1KE4 PDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETPHPRPS
>>CCDS3530.1 SULT1B1 gene_id:27284|Hs108|chr4 (296 aa)
initn: 722 init1: 578 opt: 701 Z-score: 516.2 bits: 103.8 E(32554): 2e-22
Smith-Waterman score: 701; 41.4% identity (69.1% similar) in 249 aa overlap (59-301:37-285)
30 40 50 60 70 80
pF1KE4 GEYFRYKGVPFPVGLYSLESISLAENTQDVRDDDIFIITYPKSGTTWMIEIICLILKEGD
: ::: : :::::::::. ::: .::..::
CCDS35 ILRKDLKLVHGYPMTCAFASNWEKIEQFHSRPDDIVIATYPKSGTTWVSEIIDMILNDGD
10 20 30 40 50 60
90 100 110 120 130 140
pF1KE4 PSWIRSVPIWERAPWCETIV------GAFSLPDQYSPRLMSSHLPIQIFTKAFFSSKAKV
. : :..: : . : .: . :::....::: ... :.:. .. :.
CCDS35 IEKCKRGFITEKVPMLEMTLPGLRTSGIEQLEKNPSPRIVKTHLPTDLLPKSFWENNCKM
70 80 90 100 110 120
150 160 170 180 190 200
pF1KE4 IYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFLKGEVQFGSWFDHIKGWLRMKGK
::..:: .:: :: ::.. . . ::: ...:. :: :.: .:::: :.:.: . : .
CCDS35 IYLARNAKDVSVSYYHFDLMNNLQPFPGTWEEYLEKFLTGKVAYGSWFTHVKNWWKKKEE
130 140 150 160 170 180
210 220 230 240 250 260
pF1KE4 DNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSVVAHSTFSAMKANTMSNYTLLPP
.::. ::..... . ...: :: . :. : : .. :..: .:: : . ::: ::
CCDS35 HPILFLYYEDMKENPKEEIKKIIRFLEKNLNDEILDRIIHHTSFEVMKDNPLVNYTHLPT
190 200 210 220 230 240
270 280 290 300 310 320
pF1KE4 SLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQMRGMPTFPWDEDPEEDGSPDPE
...:: .. :.:::. :::::.:::::.: :: :. .:
CCDS35 TVMDHSKSPFMRKGTAGDWKNYFTVAQNEKFDAIYETEMSKTALQFRTEI
250 260 270 280 290
330 340 350 360
pF1KE4 PSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETPHPRPS
365 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 02:08:26 2016 done: Sun Nov 6 02:08:26 2016
Total Scan time: 3.160 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]