FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1787, 294 aa 1>>>pF1KE1787 294 - 294 aa - 294 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5403+/-0.000838; mu= 14.1830+/- 0.050 mean_var=66.3371+/-13.551, 0's: 0 Z-trim(106.8): 20 B-trim: 3 in 1/51 Lambda= 0.157469 statistics sampled from 9191 (9210) to 9191 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.67), E-opt: 0.2 (0.283), width: 16 Scan time: 2.440 The best scores are: opt bits E(32554) CCDS3531.1 SULT1E1 gene_id:6783|Hs108|chr4 ( 294) 2030 469.9 1e-132 CCDS3530.1 SULT1B1 gene_id:27284|Hs108|chr4 ( 296) 1161 272.4 2.8e-73 CCDS32420.1 SULT1A1 gene_id:6817|Hs108|chr16 ( 295) 1080 254.0 9.5e-68 CCDS10636.1 SULT1A2 gene_id:6799|Hs108|chr16 ( 295) 1053 247.9 6.7e-66 CCDS10674.1 SULT1A3 gene_id:6818|Hs108|chr16 ( 295) 1051 247.4 9.2e-66 CCDS32427.1 SULT1A4 gene_id:445329|Hs108|chr16 ( 295) 1051 247.4 9.2e-66 CCDS33267.1 SULT1C3 gene_id:442038|Hs108|chr2 ( 304) 1043 245.6 3.3e-65 CCDS2077.1 SULT1C4 gene_id:27233|Hs108|chr2 ( 302) 1024 241.3 6.6e-64 CCDS2075.1 SULT1C2 gene_id:6819|Hs108|chr2 ( 296) 1019 240.2 1.4e-63 CCDS10637.1 SULT1A1 gene_id:6817|Hs108|chr16 ( 217) 714 170.8 7.8e-43 CCDS12724.1 SULT2B1 gene_id:6820|Hs108|chr19 ( 350) 688 165.0 7.1e-41 CCDS12723.1 SULT2B1 gene_id:6820|Hs108|chr19 ( 365) 688 165.0 7.4e-41 CCDS2076.1 SULT1C2 gene_id:6819|Hs108|chr2 ( 307) 685 164.3 1e-40 CCDS12707.1 SULT2A1 gene_id:6822|Hs108|chr19 ( 285) 643 154.7 7.1e-38 CCDS82492.1 SULT1C4 gene_id:27233|Hs108|chr2 ( 227) 512 124.9 5.3e-29 CCDS14051.1 SULT4A1 gene_id:25830|Hs108|chr22 ( 284) 473 116.1 3e-26 CCDS33182.1 SULT6B1 gene_id:391365|Hs108|chr2 ( 265) 470 115.4 4.5e-26 >>CCDS3531.1 SULT1E1 gene_id:6783|Hs108|chr4 (294 aa) initn: 2030 init1: 2030 opt: 2030 Z-score: 2496.2 bits: 469.9 E(32554): 1e-132 Smith-Waterman score: 2030; 100.0% identity (100.0% similar) in 294 aa overlap (1-294:1-294) 10 20 30 40 50 60 pF1KE1 MNSELDYYEKFEEVHGILMYKDFVKYWDNVEAFQARPDDLVIATYPKSGTTWVSEIVYMI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MNSELDYYEKFEEVHGILMYKDFVKYWDNVEAFQARPDDLVIATYPKSGTTWVSEIVYMI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 YKEGDVEKCKEDVIFNRIPFLECRKENLMNGVKQLDEMNSPRIVKTHLPPELLPASFWEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 YKEGDVEKCKEDVIFNRIPFLECRKENLMNGVKQLDEMNSPRIVKTHLPPELLPASFWEK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 DCKIIYLCRNAKDVAVSFYYFFLMVAGHPNPGSFPEFVEKFMQGQVPYGSWYKHVKSWWE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 DCKIIYLCRNAKDVAVSFYYFFLMVAGHPNPGSFPEFVEKFMQGQVPYGSWYKHVKSWWE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 KGKSPRVLFLFYEDLKEDIRKEVIKLIHFLERKPSEELVDRIIHHTSFQEMKNNPSTNYT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 KGKSPRVLFLFYEDLKEDIRKEVIKLIHFLERKPSEELVDRIIHHTSFQEMKNNPSTNYT 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 TLPDEIMNQKLSPFMRKGITGDWKNHFTVALNEKFDKHYEQQMKESTLKFRTEI :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 TLPDEIMNQKLSPFMRKGITGDWKNHFTVALNEKFDKHYEQQMKESTLKFRTEI 250 260 270 280 290 >>CCDS3530.1 SULT1B1 gene_id:27284|Hs108|chr4 (296 aa) initn: 1159 init1: 881 opt: 1161 Z-score: 1429.2 bits: 272.4 E(32554): 2.8e-73 Smith-Waterman score: 1161; 55.7% identity (80.7% similar) in 296 aa overlap (1-294:1-296) 10 20 30 40 50 pF1KE1 MNSELDYYEK-FEEVHGILMYKDFVKYWDNVEAFQARPDDLVIATYPKSGTTWVSEIVYM : : : .: .. ::: : :.. :...: :..::::.::::::::::::::::. : CCDS35 MLSPKDILRKDLKLVHGYPMTCAFASNWEKIEQFHSRPDDIVIATYPKSGTTWVSEIIDM 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 IYKEGDVEKCKEDVIFNRIPFLECRKENL-MNGVKQLDEMNSPRIVKTHLPPELLPASFW : ..::.::::. : ...:.:: .: .:..::.. :::::::::: .::: ::: CCDS35 ILNDGDIEKCKRGFITEKVPMLEMTLPGLRTSGIEQLEKNPSPRIVKTHLPTDLLPKSFW 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 EKDCKIIYLCRNAKDVAVSFYYFFLMVAGHPNPGSFPEFVEKFMQGQVPYGSWYKHVKSW :..::.::: ::::::.::.:.: :: .: ::.. :..:::. :.: ::::. :::.: CCDS35 ENNCKMIYLARNAKDVSVSYYHFDLMNNLQPFPGTWEEYLEKFLTGKVAYGSWFTHVKNW 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 WEKGKSPRVLFLFYEDLKEDIRKEVIKLIHFLERKPSEELVDRIIHHTSFQEMKNNPSTN :.: . .:::.:::.::. ..:. :.:.:::.. ..:..:::::::::. ::.:: .: CCDS35 WKKKEEHPILFLYYEDMKENPKEEIKKIIRFLEKNLNDEILDRIIHHTSFEVMKDNPLVN 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE1 YTTLPDEIMNQKLSPFMRKGITGDWKNHFTVALNEKFDKHYEQQMKESTLKFRTEI :: :: .:... ::::::: .:::::.:::: ::::: :: .:....:.::::: CCDS35 YTHLPTTVMDHSKSPFMRKGTAGDWKNYFTVAQNEKFDAIYETEMSKTALQFRTEI 250 260 270 280 290 >>CCDS32420.1 SULT1A1 gene_id:6817|Hs108|chr16 (295 aa) initn: 1096 init1: 1051 opt: 1080 Z-score: 1329.8 bits: 254.0 E(32554): 9.5e-68 Smith-Waterman score: 1080; 51.8% identity (80.6% similar) in 284 aa overlap (11-294:12-295) 10 20 30 40 50 pF1KE1 MNSELDYYEKFEEVHGILMYKDFVKYWDNVEAFQARPDDLVIATYPKSGTTWVSEIVYM .: :.:. . : :.. ...::::::::.:.:::::::::::.:. : CCDS32 MELIQDTSRPPLEYVKGVPLIKYFAEALGPLQSFQARPDDLLISTYPKSGTTWVSQILDM 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 IYKEGDVEKCKEDVIFNRIPFLECRKENLMNGVKQLDEMNSPRIVKTHLPPELLPASFWE ::. ::.:::.. :: :.:::: . .. .:.. : . .::..::::: ::: .. . CCDS32 IYQGGDLEKCHRAPIFMRVPFLEFKAPGIPSGMETLKDTPAPRLLKTHLPLALLPQTLLD 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 KDCKIIYLCRNAKDVAVSFYYFFLMVAGHPNPGSFPEFVEKFMQGQVPYGSWYKHVKSWW . :..:. :::::::::.:.:. :. ::.::.. :.:::: :.: :::::.::. :: CCDS32 QKVKVVYVARNAKDVAVSYYHFYHMAKVHPEPGTWDSFLEKFMVGEVSYGSWYQHVQEWW 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 EKGKSPRVLFLFYEDLKEDIRKEVIKLIHFLERKPSEELVDRIIHHTSFQEMKNNPSTNY : ... ::.:::::.::. ..:. :...:. :. :: :: ...::::.:::.:: ::: CCDS32 ELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEETVDFVVQHTSFKEMKKNPMTNY 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE1 TTLPDEIMNQKLSPFMRKGITGDWKNHFTVALNEKFDKHYEQQMKESTLKFRTEI ::.:.:.:....:::::::..::::. :::: ::.:: : ..: .:.::.:. CCDS32 TTVPQEFMDHSISPFMRKGMAGDWKTTFTVAQNERFDADYAEKMAGCSLSFRSEL 250 260 270 280 290 >>CCDS10636.1 SULT1A2 gene_id:6799|Hs108|chr16 (295 aa) initn: 1069 init1: 1024 opt: 1053 Z-score: 1296.6 bits: 247.9 E(32554): 6.7e-66 Smith-Waterman score: 1053; 51.1% identity (79.9% similar) in 284 aa overlap (11-294:12-295) 10 20 30 40 50 pF1KE1 MNSELDYYEKFEEVHGILMYKDFVKYWDNVEAFQARPDDLVIATYPKSGTTWVSEIVYM .: :.:. . : :.. ...::::::::.:.:::::::::::.:. : CCDS10 MELIQDISRPPLEYVKGVPLIKYFAEALGPLQSFQARPDDLLISTYPKSGTTWVSQILDM 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 IYKEGDVEKCKEDVIFNRIPFLECRKENLMNGVKQLDEMNSPRIVKTHLPPELLPASFWE ::. ::.:::.. :: :.:::: . .. .:.. : . .::..::::: ::: .. . CCDS10 IYQGGDLEKCHRAPIFMRVPFLEFKVPGIPSGMETLKNTPAPRLLKTHLPLALLPQTLLD 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 KDCKIIYLCRNAKDVAVSFYYFFLMVAGHPNPGSFPEFVEKFMQGQVPYGSWYKHVKSWW . :..:. :::::::::.:.:. :. .:.::.. :.:::: :.: :::::.::. :: CCDS10 QKVKVVYVARNAKDVAVSYYHFYHMAKVYPHPGTWESFLEKFMAGEVSYGSWYQHVQEWW 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 EKGKSPRVLFLFYEDLKEDIRKEVIKLIHFLERKPSEELVDRIIHHTSFQEMKNNPSTNY : ... ::.:::::.::. ..:. :...:. :. :: :: ...::::.:::.:: ::: CCDS10 ELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEETVDLMVEHTSFKEMKKNPMTNY 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE1 TTLPDEIMNQKLSPFMRKGITGDWKNHFTVALNEKFDKHYEQQMKESTLKFRTEI ::. :.:....:::::::..::::. :::: ::.:: : ..: .:.::.:. CCDS10 TTVRREFMDHSISPFMRKGMAGDWKTTFTVAQNERFDADYAKKMAGCSLSFRSEL 250 260 270 280 290 >>CCDS10674.1 SULT1A3 gene_id:6818|Hs108|chr16 (295 aa) initn: 1046 init1: 1022 opt: 1051 Z-score: 1294.1 bits: 247.4 E(32554): 9.2e-66 Smith-Waterman score: 1051; 50.4% identity (78.5% similar) in 284 aa overlap (11-294:12-295) 10 20 30 40 50 pF1KE1 MNSELDYYEKFEEVHGILMYKDFVKYWDNVEAFQARPDDLVIATYPKSGTTWVSEIVYM .: :.:. . : :.. ...::::::::.: :::::::::::.:. : CCDS10 MELIQDTSRPPLEYVKGVPLIKYFAEALGPLQSFQARPDDLLINTYPKSGTTWVSQILDM 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 IYKEGDVEKCKEDVIFNRIPFLECRKENLMNGVKQLDEMNSPRIVKTHLPPELLPASFWE ::. ::.:::.. :. :.:::: . .:.. : . ::..:.::: ::: .. . CCDS10 IYQGGDLEKCNRAPIYVRVPFLEVNDPGEPSGLETLKDTPPPRLIKSHLPLALLPQTLLD 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 KDCKIIYLCRNAKDVAVSFYYFFLMVAGHPNPGSFPEFVEKFMQGQVPYGSWYKHVKSWW . :..:. :: ::::::.:.: : .::.::.. :.:::: :.: :::::.::. :: CCDS10 QKVKVVYVARNPKDVAVSYYHFHRMEKAHPEPGTWDSFLEKFMAGEVSYGSWYQHVQEWW 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 EKGKSPRVLFLFYEDLKEDIRKEVIKLIHFLERKPSEELVDRIIHHTSFQEMKNNPSTNY : ... ::.:::::.::. ..:. :...:. :. :: .: ...::::.:::.:: ::: CCDS10 ELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEETMDFMVQHTSFKEMKKNPMTNY 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE1 TTLPDEIMNQKLSPFMRKGITGDWKNHFTVALNEKFDKHYEQQMKESTLKFRTEI ::.:.:.:....:::::::..::::. :::: ::.:: : ..: .:.::.:. CCDS10 TTVPQELMDHSISPFMRKGMAGDWKTTFTVAQNERFDADYAEKMAGCSLSFRSEL 250 260 270 280 290 >>CCDS32427.1 SULT1A4 gene_id:445329|Hs108|chr16 (295 aa) initn: 1046 init1: 1022 opt: 1051 Z-score: 1294.1 bits: 247.4 E(32554): 9.2e-66 Smith-Waterman score: 1051; 50.4% identity (78.5% similar) in 284 aa overlap (11-294:12-295) 10 20 30 40 50 pF1KE1 MNSELDYYEKFEEVHGILMYKDFVKYWDNVEAFQARPDDLVIATYPKSGTTWVSEIVYM .: :.:. . : :.. ...::::::::.: :::::::::::.:. : CCDS32 MELIQDTSRPPLEYVKGVPLIKYFAEALGPLQSFQARPDDLLINTYPKSGTTWVSQILDM 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 IYKEGDVEKCKEDVIFNRIPFLECRKENLMNGVKQLDEMNSPRIVKTHLPPELLPASFWE ::. ::.:::.. :. :.:::: . .:.. : . ::..:.::: ::: .. . CCDS32 IYQGGDLEKCNRAPIYVRVPFLEVNDPGEPSGLETLKDTPPPRLIKSHLPLALLPQTLLD 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 KDCKIIYLCRNAKDVAVSFYYFFLMVAGHPNPGSFPEFVEKFMQGQVPYGSWYKHVKSWW . :..:. :: ::::::.:.: : .::.::.. :.:::: :.: :::::.::. :: CCDS32 QKVKVVYVARNPKDVAVSYYHFHRMEKAHPEPGTWDSFLEKFMAGEVSYGSWYQHVQEWW 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 EKGKSPRVLFLFYEDLKEDIRKEVIKLIHFLERKPSEELVDRIIHHTSFQEMKNNPSTNY : ... ::.:::::.::. ..:. :...:. :. :: .: ...::::.:::.:: ::: CCDS32 ELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEETMDFMVQHTSFKEMKKNPMTNY 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE1 TTLPDEIMNQKLSPFMRKGITGDWKNHFTVALNEKFDKHYEQQMKESTLKFRTEI ::.:.:.:....:::::::..::::. :::: ::.:: : ..: .:.::.:. CCDS32 TTVPQELMDHSISPFMRKGMAGDWKTTFTVAQNERFDADYAEKMAGCSLSFRSEL 250 260 270 280 290 >>CCDS33267.1 SULT1C3 gene_id:442038|Hs108|chr2 (304 aa) initn: 1055 init1: 820 opt: 1043 Z-score: 1284.1 bits: 245.6 E(32554): 3.3e-65 Smith-Waterman score: 1043; 52.3% identity (77.7% similar) in 283 aa overlap (13-294:22-304) 10 20 30 40 50 pF1KE1 MNSELDYYEKFEEVHGILMYKDFVKYWDNVEAFQARPDDLVIATYPKSGTT :: :. ..:..: :::.::::..::::::::: CCDS33 MAKIEKNAPTMEKKPELFNIMEVDGVPTLILSKEWWEKVCNFQAKPDDLILATYPKSGTT 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 WVSEIVYMIYKEGDVEKCKEDVIFNRIPFLECR-KENLMNGVKQLDEMNSPRIVKTHLPP :. ::. :: ..:::::::. ..: ::: . .. .. . ::.::...::::: CCDS33 WMHEILDMILNDGDVEKCKRAQTLDRHAFLELKFPHKEKPDLEFVLEMSSPQLIKTHLPS 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 ELLPASFWEKDCKIIYLCRNAKDVAVSFYYFFLMVAGHPNPGSFPEFVEKFMQGQVPYGS .:.: :.:...:::.:. :: :: ::.:.: :.. :.: .. :: ::::.:.: :: CCDS33 HLIPPSIWKENCKIVYVARNPKDCLVSYYHFHRMASFMPDPQNLEEFYEKFMSGKVVGGS 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 WYKHVKSWWEKGKSPRVLFLFYEDLKEDIRKEVIKLIHFLERKPSEELVDRIIHHTSFQE :. :::.:: :.:.:::::.:.: ..:. :...:::. :::....::.::::. CCDS33 WFDHVKGWWAAKDMHRILYLFYEDIKKDPKREIEKILKFLEKDISEEILNKIIYHTSFDV 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE1 MKNNPSTNYTTLPDEIMNQKLSPFMRKGITGDWKNHFTVALNEKFDKHYEQQMKESTLKF ::.:: ::::::: ::....:::::::. :::::.:::: ::.::: :...: ::: : CCDS33 MKQNPMTNYTTLPTSIMDHSISPFMRKGMPGDWKNYFTVAQNEEFDKDYQKKMAGSTLTF 250 260 270 280 290 300 pF1KE1 RTEI :::: CCDS33 RTEI >>CCDS2077.1 SULT1C4 gene_id:27233|Hs108|chr2 (302 aa) initn: 1091 init1: 1019 opt: 1024 Z-score: 1260.8 bits: 241.3 E(32554): 6.6e-64 Smith-Waterman score: 1024; 51.3% identity (78.7% similar) in 277 aa overlap (14-290:22-298) 10 20 30 40 50 pF1KE1 MNSELDYYEKFEEVHGILMYKDFVKYWDNVEAFQARPDDLVIATYPKSGTTW :.:::. : ::.. :::.::::.:.::::.:::: CCDS20 MALHDMEDFTFDGTKRLSVNYVKGILQPTDTCDIWDKIWNFQAKPDDLLISTYPKAGTTW 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 VSEIVYMIYKEGDVEKCKEDVIFNRIPFLECRKENLMNGVKQLDEMNSPRIVKTHLPPEL ..::: .: .:::::: :. .:.:::: . .: .:..: : ::::.::::: .: CCDS20 TQEIVELIQNEGDVEKSKRAPTHQRFPFLEMKIPSLGSGLEQAHAMPSPRILKTHLPFHL 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 LPASFWEKDCKIIYLCRNAKDVAVSFYYFFLMVAGHPNPGSFPEFVEKFMQGQVPYGSWY :: :. ::.:::::. :: :: ::.:.: : . : ::.. :. : :. :.: .:::. CCDS20 LPPSLLEKNCKIIYVARNPKDNMVSYYHFQRMNKALPAPGTWEEYFETFLAGKVCWGSWH 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 KHVKSWWEKGKSPRVLFLFYEDLKEDIRKEVIKLIHFLERKPSEELVDRIIHHTSFQEMK .:::.::: . :.:.:::::.:.. ..:. :: .:. .: .....:.:.:.:::. :: CCDS20 EHVKGWWEAKDKHRILYLFYEDMKKNPKHEIQKLAEFIGKKLDDKVLDKIVHYTSFDVMK 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE1 NNPSTNYTTLPDEIMNQKLSPFMRKGITGDWKNHFTVALNEKFDKHYEQQMKESTLKFRT .:: .::...: :::....::::::: .::::.::::: ::.::. :...: .. : : CCDS20 QNPMANYSSIPAEIMDHSISPFMRKGAVGDWKKHFTVAQNERFDEDYKKKMTDTRLTFHF 250 260 270 280 290 300 pF1KE1 EI CCDS20 QF >>CCDS2075.1 SULT1C2 gene_id:6819|Hs108|chr2 (296 aa) initn: 1031 init1: 1001 opt: 1019 Z-score: 1254.8 bits: 240.2 E(32554): 1.4e-63 Smith-Waterman score: 1019; 47.6% identity (77.6% similar) in 294 aa overlap (1-294:3-296) 10 20 30 40 50 pF1KE1 MNSELDYYEKFEEVHGILMYKDFVKYWDNVEAFQARPDDLVIATYPKSGTTWVSEIVY ..:.: :..::.: :. : :.....:.:.::::.: ::::.::::..::: CCDS20 MALTSDLGKQIKLKEVEGTLLQPATVDNWSQIQSFEAKPDDLLICTYPKAGTTWIQEIVD 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 MIYKEGDVEKCKEDVIFNRIPFLECRKENLMNGVKQLDEMNSPRIVKTHLPPELLPASFW :: ..::::::.. .: .: ::.: . .::.. : ::::.:::: .::: ::: CCDS20 MIEQNGDVEKCQRAIIQHRHPFIEWARPPQPSGVEKAKAMPSPRILKTHLSTQLLPPSFW 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 EKDCKIIYLCRNAKDVAVSFYYFFLMVAGHPNPGSFPEFVEKFMQGQVPYGSWYKHVKSW :..::..:. ::::: ::.:.: : :.::.. :. : :..:.: .:::. :::.: CCDS20 ENNCKFLYVARNAKDCMVSYYHFQRMNHMLPDPGTWEEYFETFINGKVVWGSWFDHVKGW 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 WEKGKSPRVLFLFYEDLKEDIRKEVIKLIHFLERKPSEELVDRIIHHTSFQEMKNNPSTN :: ..:::::::.:.: ..:. :...:. .: .: ..:.:...:::..::.:: :: CCDS20 WEMKDRHQILFLFYEDIKRDPKHEIRKVMQFMGKKVDETVLDKIVQETSFEKMKENPMTN 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE1 YTTLPDEIMNQKLSPFMRKGITGDWKNHFTVALNEKFDKHYEQQMKESTLKFRTEI .:. :..:..: ::::: .:::::::::: ::.::. :...:. ....: :. CCDS20 RSTVSKSILDQSISSFMRKGTVGDWKNHFTVAQNERFDEIYRRKMEGTSINFCMEL 250 260 270 280 290 >>CCDS10637.1 SULT1A1 gene_id:6817|Hs108|chr16 (217 aa) initn: 714 init1: 690 opt: 714 Z-score: 882.5 bits: 170.8 E(32554): 7.8e-43 Smith-Waterman score: 714; 52.7% identity (81.3% similar) in 182 aa overlap (113-294:37-217) 90 100 110 120 130 140 pF1KE1 CRKENLMNGVKQLDEMNSPRIVKTHLPPELLPASFWEKDCKIIYLCRNAKDVAVSFYYFF : .::. ..:. :::::::::.:.:. CCDS10 CDQVVGAPIAVSAFYAGMSILQGKDDIFLDLKQKFWNTYM-VVYVARNAKDVAVSYYHFY 10 20 30 40 50 60 150 160 170 180 190 200 pF1KE1 LMVAGHPNPGSFPEFVEKFMQGQVPYGSWYKHVKSWWEKGKSPRVLFLFYEDLKEDIRKE :. ::.::.. :.:::: :.: :::::.::. ::: ... ::.:::::.::. ..: CCDS10 HMAKVHPEPGTWDSFLEKFMVGEVSYGSWYQHVQEWWELSRTHPVLYLFYEDMKENPKRE 70 80 90 100 110 120 210 220 230 240 250 260 pF1KE1 VIKLIHFLERKPSEELVDRIIHHTSFQEMKNNPSTNYTTLPDEIMNQKLSPFMRKGITGD . :...:. :. :: :: ...::::.:::.:: :::::.:.:.:....:::::::..:: CCDS10 IQKILEFVGRSLPEETVDFVVQHTSFKEMKKNPMTNYTTVPQEFMDHSISPFMRKGMAGD 130 140 150 160 170 180 270 280 290 pF1KE1 WKNHFTVALNEKFDKHYEQQMKESTLKFRTEI ::. :::: ::.:: : ..: .:.::.:. CCDS10 WKTTFTVAQNERFDADYAEKMAGCSLSFRSEL 190 200 210 294 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 17:29:24 2016 done: Sun Nov 6 17:29:25 2016 Total Scan time: 2.440 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]