FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4350, 365 aa 1>>>pF1KE4350 365 - 365 aa - 365 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.6805+/-0.000837; mu= 2.2830+/- 0.051 mean_var=199.2008+/-39.643, 0's: 0 Z-trim(114.2): 24 B-trim: 7 in 1/55 Lambda= 0.090872 statistics sampled from 14773 (14795) to 14773 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.781), E-opt: 0.2 (0.454), width: 16 Scan time: 3.160 The best scores are: opt bits E(32554) CCDS12723.1 SULT2B1 gene_id:6820|Hs108|chr19 ( 365) 2562 347.9 8.3e-96 CCDS12724.1 SULT2B1 gene_id:6820|Hs108|chr19 ( 350) 2394 325.8 3.4e-89 CCDS12707.1 SULT2A1 gene_id:6822|Hs108|chr19 ( 285) 994 142.2 5.2e-34 CCDS32427.1 SULT1A4 gene_id:445329|Hs108|chr16 ( 295) 739 108.8 6.2e-24 CCDS10674.1 SULT1A3 gene_id:6818|Hs108|chr16 ( 295) 739 108.8 6.2e-24 CCDS32420.1 SULT1A1 gene_id:6817|Hs108|chr16 ( 295) 726 107.1 2e-23 CCDS33267.1 SULT1C3 gene_id:442038|Hs108|chr2 ( 304) 716 105.8 5.1e-23 CCDS10636.1 SULT1A2 gene_id:6799|Hs108|chr16 ( 295) 710 105.0 8.7e-23 CCDS2075.1 SULT1C2 gene_id:6819|Hs108|chr2 ( 296) 708 104.7 1e-22 CCDS3530.1 SULT1B1 gene_id:27284|Hs108|chr4 ( 296) 701 103.8 2e-22 CCDS2077.1 SULT1C4 gene_id:27233|Hs108|chr2 ( 302) 700 103.7 2.2e-22 CCDS3531.1 SULT1E1 gene_id:6783|Hs108|chr4 ( 294) 688 102.1 6.4e-22 CCDS2076.1 SULT1C2 gene_id:6819|Hs108|chr2 ( 307) 550 84.0 1.8e-16 CCDS10637.1 SULT1A1 gene_id:6817|Hs108|chr16 ( 217) 514 79.2 3.7e-15 CCDS33182.1 SULT6B1 gene_id:391365|Hs108|chr2 ( 265) 472 73.8 2e-13 CCDS14051.1 SULT4A1 gene_id:25830|Hs108|chr22 ( 284) 436 69.1 5.5e-12 >>CCDS12723.1 SULT2B1 gene_id:6820|Hs108|chr19 (365 aa) initn: 2562 init1: 2562 opt: 2562 Z-score: 1833.5 bits: 347.9 E(32554): 8.3e-96 Smith-Waterman score: 2562; 100.0% identity (100.0% similar) in 365 aa overlap (1-365:1-365) 10 20 30 40 50 60 pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIVGAFSLPDQYSPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIVGAFSLPDQYSPR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 LMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 KGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 VAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 MRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETP 310 320 330 340 350 360 pF1KE4 HPRPS ::::: CCDS12 HPRPS >>CCDS12724.1 SULT2B1 gene_id:6820|Hs108|chr19 (350 aa) initn: 2394 init1: 2394 opt: 2394 Z-score: 1714.7 bits: 325.8 E(32554): 3.4e-89 Smith-Waterman score: 2394; 100.0% identity (100.0% similar) in 342 aa overlap (24-365:9-350) 10 20 30 40 50 60 pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD ::::::::::::::::::::::::::::::::::::: CCDS12 MASPPPFHSQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD 10 20 30 40 70 80 90 100 110 120 pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIVGAFSLPDQYSPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIVGAFSLPDQYSPR 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE4 LMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFL 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE4 KGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSV 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE4 VAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQ 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE4 MRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETP 290 300 310 320 330 340 pF1KE4 HPRPS ::::: CCDS12 HPRPS 350 >>CCDS12707.1 SULT2A1 gene_id:6822|Hs108|chr19 (285 aa) initn: 998 init1: 830 opt: 994 Z-score: 724.0 bits: 142.2 E(32554): 5.2e-34 Smith-Waterman score: 994; 48.1% identity (76.3% similar) in 287 aa overlap (27-310:1-285) 10 20 30 40 50 60 pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD . ... ..:. ::. . :.. ... .:: CCDS12 MSDDFLWFEGIAFPTMGFRSETLRKVRDEFVIRD 10 20 30 70 80 90 100 110 120 pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIVGAFSLPDQYSPR .:..:.:::::::.:. ::.::. ..:: .::.:::::::.:: :. .: .: . ::: CCDS12 EDVIILTYPKSGTNWLAEILCLMHSKGDAKWIQSVPIWERSPWVESEIGYTALSETESPR 40 50 60 70 80 90 130 140 150 160 170 180 pF1KE4 LMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFL :.:::::::.: :.::::::::::. ::::::.:: : . : .: : . ..... : CCDS12 LFSSHLPIQLFPKSFFSSKAKVIYLMRNPRDVLVSGYFFWKNMKFIKKPKSWEEYFEWFC 100 110 120 130 140 150 190 200 210 220 230 240 pF1KE4 KGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSV .: : .:::::::.::. :. . :::...::::.:: ..:.:: :::. : : :. . CCDS12 QGTVLYGSWFDHIHGWMPMREEKNFLLLSYEELKQDTGRTIEKICQFLGKTLEPEELNLI 160 170 180 190 200 210 250 260 270 280 290 pF1KE4 VAHSTFSAMKANTMSNYTLLPPS-LLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRK . .:.:..:: : ::::.:: . ..: .. .::::: :::::::::::.: ::. ... CCDS12 LKNSSFQSMKENKMSNYSLLSVDYVVD--KAQLLRKGVSGDWKNHFTVAQAEDFDKLFQE 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE4 QMRGMPT--FPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQAS .: .: :::. CCDS12 KMADLPRELFPWE 280 >>CCDS32427.1 SULT1A4 gene_id:445329|Hs108|chr16 (295 aa) initn: 767 init1: 591 opt: 739 Z-score: 543.2 bits: 108.8 E(32554): 6.2e-24 Smith-Waterman score: 739; 39.3% identity (69.1% similar) in 285 aa overlap (24-303:7-286) 10 20 30 40 50 60 pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD ... : :: ::::. : :... .. : .: CCDS32 MELIQDTSRPPLEY--VKGVPLI--KYFAEALGPLQSFQ-ARP 10 20 30 70 80 90 100 110 pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETI-----VGAFSLPD ::..: :::::::::. .:. .: . :: .::. :.:. :. : .: : CCDS32 DDLLINTYPKSGTTWVSQILDMIYQGGDLEKCNRAPIYVRVPFLEVNDPGEPSGLETLKD 40 50 60 70 80 90 120 130 140 150 160 170 pF1KE4 QYSPRLMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQF :::..::::. .. ......:.::.:..:::.::.:: ::. .. .::: :.: CCDS32 TPPPRLIKSHLPLALLPQTLLDQKVKVVYVARNPKDVAVSYYHFHRMEKAHPEPGTWDSF 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE4 LRDFLKGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKE :. :. :::..:::..:.. : ... :.. ::..... . ...: :.:: : .: CCDS32 LEKFMAGEVSYGSWYQHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEE 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE4 ALGSVVAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDR .. .: :..:. :: : :.::: .: :.:: . :.:::. ::::. :::::.: :: CCDS32 TMDFMVQHTSFKEMKKNPMTNYTTVPQELMDHSISPFMRKGMAGDWKTTFTVAQNERFDA 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE4 AYRKQMRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQ : ..: : CCDS32 DYAEKMAGCSLSFRSEL 280 290 >>CCDS10674.1 SULT1A3 gene_id:6818|Hs108|chr16 (295 aa) initn: 767 init1: 591 opt: 739 Z-score: 543.2 bits: 108.8 E(32554): 6.2e-24 Smith-Waterman score: 739; 39.3% identity (69.1% similar) in 285 aa overlap (24-303:7-286) 10 20 30 40 50 60 pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD ... : :: ::::. : :... .. : .: CCDS10 MELIQDTSRPPLEY--VKGVPLI--KYFAEALGPLQSFQ-ARP 10 20 30 70 80 90 100 110 pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETI-----VGAFSLPD ::..: :::::::::. .:. .: . :: .::. :.:. :. : .: : CCDS10 DDLLINTYPKSGTTWVSQILDMIYQGGDLEKCNRAPIYVRVPFLEVNDPGEPSGLETLKD 40 50 60 70 80 90 120 130 140 150 160 170 pF1KE4 QYSPRLMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQF :::..::::. .. ......:.::.:..:::.::.:: ::. .. .::: :.: CCDS10 TPPPRLIKSHLPLALLPQTLLDQKVKVVYVARNPKDVAVSYYHFHRMEKAHPEPGTWDSF 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE4 LRDFLKGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKE :. :. :::..:::..:.. : ... :.. ::..... . ...: :.:: : .: CCDS10 LEKFMAGEVSYGSWYQHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEE 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE4 ALGSVVAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDR .. .: :..:. :: : :.::: .: :.:: . :.:::. ::::. :::::.: :: CCDS10 TMDFMVQHTSFKEMKKNPMTNYTTVPQELMDHSISPFMRKGMAGDWKTTFTVAQNERFDA 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE4 AYRKQMRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQ : ..: : CCDS10 DYAEKMAGCSLSFRSEL 280 290 >>CCDS32420.1 SULT1A1 gene_id:6817|Hs108|chr16 (295 aa) initn: 727 init1: 574 opt: 726 Z-score: 533.9 bits: 107.1 E(32554): 2e-23 Smith-Waterman score: 726; 38.9% identity (69.8% similar) in 285 aa overlap (24-303:7-286) 10 20 30 40 50 60 pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD ... : :: ::::. : :... .. : .: CCDS32 MELIQDTSRPPLEY--VKGVPLI--KYFAEALGPLQSFQ-ARP 10 20 30 70 80 90 100 110 pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIV-----GAFSLPD ::..: :::::::::. .:. .: . :: . .::. :.:. : . : .: : CCDS32 DDLLISTYPKSGTTWVSQILDMIYQGGDLEKCHRAPIFMRVPFLEFKAPGIPSGMETLKD 40 50 60 70 80 90 120 130 140 150 160 170 pF1KE4 QYSPRLMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQF .:::...:::. .. ......:.::.:..:: .::.:: ::. ..: .::: :.: CCDS32 TPAPRLLKTHLPLALLPQTLLDQKVKVVYVARNAKDVAVSYYHFYHMAKVHPEPGTWDSF 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE4 LRDFLKGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKE :. :. :::..:::..:.. : ... :.. ::..... . ...: :.:: : .: CCDS32 LEKFMVGEVSYGSWYQHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEE 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE4 ALGSVVAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDR .. :: :..:. :: : :.::: .: ..:: . :.:::. ::::. :::::.: :: CCDS32 TVDFVVQHTSFKEMKKNPMTNYTTVPQEFMDHSISPFMRKGMAGDWKTTFTVAQNERFDA 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE4 AYRKQMRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQ : ..: : CCDS32 DYAEKMAGCSLSFRSEL 280 290 >>CCDS33267.1 SULT1C3 gene_id:442038|Hs108|chr2 (304 aa) initn: 726 init1: 607 opt: 716 Z-score: 526.7 bits: 105.8 E(32554): 5.1e-23 Smith-Waterman score: 716; 38.9% identity (68.9% similar) in 270 aa overlap (40-303:27-295) 10 20 30 40 50 60 pF1KE4 PGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRDDDIFIITYP :. . : : . : : .. ::... ::: CCDS33 MAKIEKNAPTMEKKPELFNIMEVDGVPTLILSKEWWEKVCNFQ-AKPDDLILATYP 10 20 30 40 50 70 80 90 100 110 120 pF1KE4 KSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIVGAFSLPD------QYSPRLMS ::::::: ::. .::..:: . . .: . : :: . ::.:.. CCDS33 KSGTTWMHEILDMILNDGDVEKCKRAQTLDRHAFLELKFPHKEKPDLEFVLEMSSPQLIK 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE4 SHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFLKGE .::: ... .... . :..:..:::.: .:: ::. ..:. . :: . ..: . :..:. CCDS33 THLPSHLIPPSIWKENCKIVYVARNPKDCLVSYYHFHRMASFMPDPQNLEEFYEKFMSGK 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE4 VQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSVVAH : ::::::.::: : .:.. ::....: . .:.: :: . ...: :.... : CCDS33 VVGGSWFDHVKGWWAAKDMHRILYLFYEDIKKDPKREIEKILKFLEKDISEEILNKIIYH 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE4 STFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQMRG ..:..:: : :.::: :: :..:: . :.:::. :::::.:::::.: ::. :.:.: : CCDS33 TSFDVMKQNPMTNYTTLPTSIMDHSISPFMRKGMPGDWKNYFTVAQNEEFDKDYQKKMAG 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE4 MPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETPHPR CCDS33 STLTFRTEI 300 >>CCDS10636.1 SULT1A2 gene_id:6799|Hs108|chr16 (295 aa) initn: 708 init1: 555 opt: 710 Z-score: 522.6 bits: 105.0 E(32554): 8.7e-23 Smith-Waterman score: 710; 38.8% identity (69.2% similar) in 289 aa overlap (20-303:4-286) 10 20 30 40 50 60 pF1KE4 MDGPAEPQIPGLWDTYEDDISEISQKLPGEYFRYKGVPFPVGLYSLESISLAENTQDVRD :..::. : :: ::::. : :... .. : .: CCDS10 MELIQDISRP-PLEY--VKGVPLI--KYFAEALGPLQSFQ-ARP 10 20 30 70 80 90 100 110 pF1KE4 DDIFIITYPKSGTTWMIEIICLILKEGDPSWIRSVPIWERAPWCETIV-----GAFSLPD ::..: :::::::::. .:. .: . :: . .::. :.:. : : : .: . CCDS10 DDLLISTYPKSGTTWVSQILDMIYQGGDLEKCHRAPIFMRVPFLEFKVPGIPSGMETLKN 40 50 60 70 80 90 120 130 140 150 160 170 pF1KE4 QYSPRLMSSHLPIQIFTKAFFSSKAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQF .:::...:::. .. ......:.::.:..:: .::.:: ::. ..: ::: ..: CCDS10 TPAPRLLKTHLPLALLPQTLLDQKVKVVYVARNAKDVAVSYYHFYHMAKVYPHPGTWESF 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE4 LRDFLKGEVQFGSWFDHIKGWLRMKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKE :. :. :::..:::..:.. : ... :.. ::..... . ...: :.:: : .: CCDS10 LEKFMAGEVSYGSWYQHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEE 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE4 ALGSVVAHSTFSAMKANTMSNYTLLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDR .. .: :..:. :: : :.::: . ..:: . :.:::. ::::. :::::.: :: CCDS10 TVDLMVEHTSFKEMKKNPMTNYTTVRREFMDHSISPFMRKGMAGDWKTTFTVAQNERFDA 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE4 AYRKQMRGMPTFPWDEDPEEDGSPDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQ : :.: : CCDS10 DYAKKMAGCSLSFRSEL 280 290 >>CCDS2075.1 SULT1C2 gene_id:6819|Hs108|chr2 (296 aa) initn: 742 init1: 599 opt: 708 Z-score: 521.2 bits: 104.7 E(32554): 1e-22 Smith-Waterman score: 708; 38.0% identity (71.0% similar) in 255 aa overlap (57-303:36-287) 30 40 50 60 70 80 pF1KE4 LPGEYFRYKGVPFPVGLYSLESISLAENTQDVRDDDIFIITYPKSGTTWMIEIICLILKE ... ::..: ::::.::::. ::. .: .. CCDS20 DLGKQIKLKEVEGTLLQPATVDNWSQIQSFEAKPDDLLICTYPKAGTTWIQEIVDMIEQN 10 20 30 40 50 60 90 100 110 120 130 pF1KE4 GDPSWIRSVPI--------WERAPWCETIVGAFSLPDQYSPRLMSSHLPIQIFTKAFFSS :: . . : : : : . : ..: :::....:: :.. .:. . CCDS20 GDVEKCQRAIIQHRHPFIEWARPPQPSGVEKAKAMP---SPRILKTHLSTQLLPPSFWEN 70 80 90 100 110 120 140 150 160 170 180 190 pF1KE4 KAKVIYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFLKGEVQFGSWFDHIKGWLR . : .:..:: .: .:: ::.... .: :::: ..... :..:.: .::::::.::: . CCDS20 NCKFLYVARNAKDCMVSYYHFQRMNHMLPDPGTWEEYFETFINGKVVWGSWFDHVKGWWE 130 140 150 160 170 180 200 210 220 230 240 250 pF1KE4 MKGKDNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSVVAHSTFSAMKANTMSNYT :: . ..::. ::....: . .... :.:. . . .: ..: ...: :: : :.: . CCDS20 MKDRHQILFLFYEDIKRDPKHEIRKVMQFMGKKVDETVLDKIVQETSFEKMKENPMTNRS 190 200 210 220 230 240 260 270 280 290 300 310 pF1KE4 LLPPSLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQMRGMPTFPWDEDPEEDGS . :.::. ..:.:::. :::::::::::.: ::. ::..:.: CCDS20 TVSKSILDQSISSFMRKGTVGDWKNHFTVAQNERFDEIYRRKMEGTSINFCMEL 250 260 270 280 290 320 330 340 350 360 pF1KE4 PDPEPSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETPHPRPS >>CCDS3530.1 SULT1B1 gene_id:27284|Hs108|chr4 (296 aa) initn: 722 init1: 578 opt: 701 Z-score: 516.2 bits: 103.8 E(32554): 2e-22 Smith-Waterman score: 701; 41.4% identity (69.1% similar) in 249 aa overlap (59-301:37-285) 30 40 50 60 70 80 pF1KE4 GEYFRYKGVPFPVGLYSLESISLAENTQDVRDDDIFIITYPKSGTTWMIEIICLILKEGD : ::: : :::::::::. ::: .::..:: CCDS35 ILRKDLKLVHGYPMTCAFASNWEKIEQFHSRPDDIVIATYPKSGTTWVSEIIDMILNDGD 10 20 30 40 50 60 90 100 110 120 130 140 pF1KE4 PSWIRSVPIWERAPWCETIV------GAFSLPDQYSPRLMSSHLPIQIFTKAFFSSKAKV . : :..: : . : .: . :::....::: ... :.:. .. :. CCDS35 IEKCKRGFITEKVPMLEMTLPGLRTSGIEQLEKNPSPRIVKTHLPTDLLPKSFWENNCKM 70 80 90 100 110 120 150 160 170 180 190 200 pF1KE4 IYMGRNPRDVVVSLYHYSKIAGQLKDPGTPDQFLRDFLKGEVQFGSWFDHIKGWLRMKGK ::..:: .:: :: ::.. . . ::: ...:. :: :.: .:::: :.:.: . : . CCDS35 IYLARNAKDVSVSYYHFDLMNNLQPFPGTWEEYLEKFLTGKVAYGSWFTHVKNWWKKKEE 130 140 150 160 170 180 210 220 230 240 250 260 pF1KE4 DNFLFITYEELQQDLQGSVERICGFLGRPLGKEALGSVVAHSTFSAMKANTMSNYTLLPP .::. ::..... . ...: :: . :. : : .. :..: .:: : . ::: :: CCDS35 HPILFLYYEDMKENPKEEIKKIIRFLEKNLNDEILDRIIHHTSFEVMKDNPLVNYTHLPT 190 200 210 220 230 240 270 280 290 300 310 320 pF1KE4 SLLDHRRGAFLRKGVCGDWKNHFTVAQSEAFDRAYRKQMRGMPTFPWDEDPEEDGSPDPE ...:: .. :.:::. :::::.:::::.: :: :. .: CCDS35 TVMDHSKSPFMRKGTAGDWKNYFTVAQNEKFDAIYETEMSKTALQFRTEI 250 260 270 280 290 330 340 350 360 pF1KE4 PSPEPEPKPSLEPNTSLEREPRPNSSPSPSPGQASETPHPRPS 365 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 02:08:26 2016 done: Sun Nov 6 02:08:26 2016 Total Scan time: 3.160 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]