FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3875, 352 aa
1>>>pF1KE3875 352 - 352 aa - 352 aa
Library: human.CCDS.faa
18921897 residues in 33420 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.4037+/-0.00103; mu= 15.9616+/- 0.062
mean_var=67.3414+/-13.510, 0's: 0 Z-trim(103.3): 21 B-trim: 0 in 0/50
Lambda= 0.156291
statistics sampled from 7428 (7436) to 7428 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.586), E-opt: 0.2 (0.223), width: 16
Scan time: 1.090
The best scores are: opt bits E(33420)
CCDS9099.1 CHST11 gene_id:50515|Hs109|chr12 ( 352) 2372 544.0 7.1e-155
CCDS55878.1 CHST11 gene_id:50515|Hs109|chr12 ( 347) 2314 530.9 6.1e-151
CCDS3039.1 CHST13 gene_id:166012|Hs109|chr3 ( 341) 1092 255.4 5.3e-68
CCDS12433.1 CHST8 gene_id:64377|Hs109|chr19 ( 424) 737 175.4 7.9e-44
CCDS42422.1 CHST9 gene_id:83539|Hs109|chr18 ( 443) 723 172.2 7.3e-43
CCDS2047.1 CHST10 gene_id:9486|Hs109|chr2 ( 356) 573 138.4 9.2e-33
CCDS5333.1 CHST12 gene_id:55501|Hs109|chr7 ( 414) 524 127.4 2.2e-29
CCDS10059.1 CHST14 gene_id:113189|Hs109|chr15 ( 376) 482 117.9 1.5e-26
>>CCDS9099.1 CHST11 gene_id:50515|Hs109|chr12 (352 aa)
initn: 2372 init1: 2372 opt: 2372 Z-score: 2894.2 bits: 544.0 E(33420): 7.1e-155
Smith-Waterman score: 2372; 100.0% identity (100.0% similar) in 352 aa overlap (1-352:1-352)
10 20 30 40 50 60
pF1KE3 MKPALLEVMRMNRICRMVLATCLGSFILVIFYFQSMLHPVMRRNPFGVDICCRKGSRSPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 MKPALLEVMRMNRICRMVLATCLGSFILVIFYFQSMLHPVMRRNPFGVDICCRKGSRSPL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 QELYNPIQLELSNTAVLHQMRRDQVTDTCRANSATSRKRRVLTPNDLKHLVVDEDHELIY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 QELYNPIQLELSNTAVLHQMRRDQVTDTCRANSATSRKRRVLTPNDLKHLVVDEDHELIY
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 CYVPKVACTNWKRLMMVLTGRGKYSDPMEIPANEAHVSANLKTLNQYSIPEINHRLKSYM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 CYVPKVACTNWKRLMMVLTGRGKYSDPMEIPANEAHVSANLKTLNQYSIPEINHRLKSYM
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 KFLFVREPFERLVSAYRNKFTQKYNISFHKRYGTKIIKRQRKNATQEALRKGDDVKFEEF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 KFLFVREPFERLVSAYRNKFTQKYNISFHKRYGTKIIKRQRKNATQEALRKGDDVKFEEF
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 VAYLIDPHTQREEPFNEHWQTVYSLCHPCHIHYDLVGKYETLEEDSNYVLQLAGVGSYLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 VAYLIDPHTQREEPFNEHWQTVYSLCHPCHIHYDLVGKYETLEEDSNYVLQLAGVGSYLK
250 260 270 280 290 300
310 320 330 340 350
pF1KE3 FPTYAKSTRTTDEMTTEFFQNISSEHQTQLYEVYKLDFLMFNYSVPSYLKLE
::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 FPTYAKSTRTTDEMTTEFFQNISSEHQTQLYEVYKLDFLMFNYSVPSYLKLE
310 320 330 340 350
>>CCDS55878.1 CHST11 gene_id:50515|Hs109|chr12 (347 aa)
initn: 2108 init1: 2108 opt: 2314 Z-score: 2823.6 bits: 530.9 E(33420): 6.1e-151
Smith-Waterman score: 2314; 98.3% identity (98.6% similar) in 352 aa overlap (1-352:1-347)
10 20 30 40 50 60
pF1KE3 MKPALLEVMRMNRICRMVLATCLGSFILVIFYFQSMLHPVMRRNPFGVDICCRKGSRSPL
:::::::::::::::::::::::::::::::::: .::::::::::::::::::::
CCDS55 MKPALLEVMRMNRICRMVLATCLGSFILVIFYFQ-----IMRRNPFGVDICCRKGSRSPL
10 20 30 40 50
70 80 90 100 110 120
pF1KE3 QELYNPIQLELSNTAVLHQMRRDQVTDTCRANSATSRKRRVLTPNDLKHLVVDEDHELIY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 QELYNPIQLELSNTAVLHQMRRDQVTDTCRANSATSRKRRVLTPNDLKHLVVDEDHELIY
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE3 CYVPKVACTNWKRLMMVLTGRGKYSDPMEIPANEAHVSANLKTLNQYSIPEINHRLKSYM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 CYVPKVACTNWKRLMMVLTGRGKYSDPMEIPANEAHVSANLKTLNQYSIPEINHRLKSYM
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE3 KFLFVREPFERLVSAYRNKFTQKYNISFHKRYGTKIIKRQRKNATQEALRKGDDVKFEEF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 KFLFVREPFERLVSAYRNKFTQKYNISFHKRYGTKIIKRQRKNATQEALRKGDDVKFEEF
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE3 VAYLIDPHTQREEPFNEHWQTVYSLCHPCHIHYDLVGKYETLEEDSNYVLQLAGVGSYLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VAYLIDPHTQREEPFNEHWQTVYSLCHPCHIHYDLVGKYETLEEDSNYVLQLAGVGSYLK
240 250 260 270 280 290
310 320 330 340 350
pF1KE3 FPTYAKSTRTTDEMTTEFFQNISSEHQTQLYEVYKLDFLMFNYSVPSYLKLE
::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 FPTYAKSTRTTDEMTTEFFQNISSEHQTQLYEVYKLDFLMFNYSVPSYLKLE
300 310 320 330 340
>>CCDS3039.1 CHST13 gene_id:166012|Hs109|chr3 (341 aa)
initn: 856 init1: 612 opt: 1092 Z-score: 1334.6 bits: 255.4 E(33420): 5.3e-68
Smith-Waterman score: 1092; 47.1% identity (78.0% similar) in 346 aa overlap (11-351:1-340)
10 20 30 40 50
pF1KE3 MKPALLEVMRMNRIC---RMVLATCLGSFILVIFYFQSMLHPVMRRNPFGVDICCRKGSR
:.: : :.. :.:::. .:.. :.:.. .: . . .:
CCDS30 MGRRCCRRRVLAAACLGAALLLLCAAPRSLRPAFGNRALGSSWLGGE-KR
10 20 30 40
60 70 80 90 100 110
pF1KE3 SPLQELYNPIQLELSNTAVLHQMRRDQVTDTCRANSATSRKRRVLTPNDLKHLVVDEDHE
::::.::. : :. : .:..::: ....: : ::..:.: :.::.:..::. :
CCDS30 SPLQKLYDLDQDPRSTLAKVHRQRRDLLNSAC---SRHSRRQRLLQPEDLRHVLVDDAHG
50 60 70 80 90 100
120 130 140 150 160 170
pF1KE3 LIYCYVPKVACTNWKRLMMVLTGRGKYSDPMEIPANEAHVSANLKTLNQYSIPEINHRLK
:.::::::::::::::....:.:... .:: : :.:::. . : .: ..: :::.::.
CCDS30 LLYCYVPKVACTNWKRVLLALSGQAR-GDPRAISAQEAHAPGRLPSLADFSPAEINRRLR
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE3 SYMKFLFVREPFERLVSAYRNKFTQKYNISFHKRYGTKIIKRQRKNATQEALRKGDDVKF
.:. :::::::::::.::::::... :. .:..:::..:..: : : .: .: ::.:
CCDS30 AYLAFLFVREPFERLASAYRNKLARPYSAAFQRRYGARIVQRLRPRALPDARARGHDVRF
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE3 EEFVAYLIDPHTQREEPFNEHWQTVYSLCHPCHIHYDLVGKYETLEEDSNYVLQLAGVGS
::.:::.::.:.:::::::::. ...:::::...::.:::.::: ::. .:: :::. :
CCDS30 AEFLAYLLDPRTRREEPFNEHWERAHALCHPCRLRYDVVGKFETLAEDAAFVLGLAGA-S
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE3 YLKFP--TYAKSTRTTDEMTTEFFQNISSEHQTQLYEVYKLDFLMFNYSVPSYLKLE
:.:: ... .. ......:..:: .: .:...::.:::.::::.::::.:
CCDS30 DLSFPGPPRPRGAAASRDLAARLFRDISPFYQRRLFDLYKMDFLLFNYSAPSYLRLL
290 300 310 320 330 340
>>CCDS12433.1 CHST8 gene_id:64377|Hs109|chr19 (424 aa)
initn: 682 init1: 181 opt: 737 Z-score: 900.5 bits: 175.4 E(33420): 7.9e-44
Smith-Waterman score: 737; 41.8% identity (70.3% similar) in 273 aa overlap (78-346:153-419)
50 60 70 80 90 100
pF1KE3 VDICCRKGSRSPLQELYNPIQLELSNTAVLHQMRRDQVTDTCRANSATSRKRRVLTPNDL
.: :. . ..: :.: .::..:: .
CCDS12 ATIPANSSDAPFIRPGPGTLDGRWVSLHRSQQERKRVMQEACAKYRASS-SRRAVTPRHV
130 140 150 160 170 180
110 120 130 140 150 160
pF1KE3 KHLVVDEDHELIYCYVPKVACTNWKRLMMVLTGRGKYSDPMEIPANEAHVSANLKTLNQY
... :.. :...:: :::..:.::::..:::.: . :. .: : .: .. :: :. .
CCDS12 SRIFVEDRHRVLYCEVPKAGCSNWKRVLMVLAGLA--SSTADIQHNTVHYGSALKRLDTF
190 200 210 220 230
170 180 190 200 210 220
pF1KE3 SIPEINHRLKSYMKFLFVREPFERLVSAYRNKFTQKYNISFHKRYGTKIIKRQRKNATQE
. : :::..: :.:::::::::::::.:.:: .. : .: .: :. : : ::..:
CCDS12 DRQGILHRLSTYTKMLFVREPFERLVSAFRDKF-EHPNSYYHPVFGKAILARYRANASRE
240 250 260 270 280 290
230 240 250 260 270 280
pF1KE3 ALRKGDDVKFEEFVAYLIDPHTQREEPFNEHWQTVYSLCHPCHIHYDLVGKYETLEEDSN
::: :. :.: ::: ::.: : : .. ::. : :: :: : ::.:::.:..:.:.:
CCDS12 ALRTGSGVRFPEFVQYLLDVH--RPVGMDIHWDHVSRLCSPCLIDYDFVGKFESMEDDAN
300 310 320 330 340 350
290 300 310 320 330 340
pF1KE3 YVLQLAGVGSYLKFPTY----AKSTRTTDEMTTEFFQNISSEHQTQLYEVYKLDFLMFNY
. :.: . : :: . .. .::: ... ..: ..:. .. . :. : .:.:::::
CCDS12 FFLSLIRAPRNLTFPRFKDRHSQEARTTARIAHQYFAQLSALQRQRTYDFYYMDYLMFNY
360 370 380 390 400 410
350
pF1KE3 SVPSYLKLE
: :
CCDS12 SKPFADLY
420
>>CCDS42422.1 CHST9 gene_id:83539|Hs109|chr18 (443 aa)
initn: 627 init1: 217 opt: 723 Z-score: 883.2 bits: 172.2 E(33420): 7.3e-43
Smith-Waterman score: 723; 40.5% identity (73.7% similar) in 274 aa overlap (78-346:175-441)
50 60 70 80 90 100
pF1KE3 VDICCRKGSRSPLQELYNPIQLELSNTAVLHQMRRDQVTDTCRANSATSRKRRVLTPNDL
.. ::. . . :. ...:... : . .
CCDS42 KFSNMNWPVDIHPLNKSLVKDNKWKKTEETQEKRRSFLQEFCKKYGGVSHHQSHLF-HTV
150 160 170 180 190 200
110 120 130 140 150 160
pF1KE3 KHLVVDEDHELIYCYVPKVACTNWKRLMMVLTGRGKYSDPMEIPANEAHVSANLKTLNQY
... :.. :...:: :::..:.::::..:::.: . :. ..: : .: . .:: :...
CCDS42 SRIYVEDKHKILYCEVPKAGCSNWKRILMVLNGLA--SSAYNISHNAVHYGKHLKKLDSF
210 220 230 240 250 260
170 180 190 200 210 220
pF1KE3 SIPEINHRLKSYMKFLFVREPFERLVSAYRNKFTQKYNISFHKRYGTKIIKRQRKNATQE
.. : ::..: : .:::.:.::::::.:.:: .. : .: .: :::. : :: .:
CCDS42 DLKGIYTRLNTYTKAVFVRDPMERLVSAFRDKF-EHPNSYYHPVFGKAIIKKYRPNACEE
270 280 290 300 310 320
230 240 250 260 270 280
pF1KE3 ALRKGDDVKFEEFVAYLIDPHTQREEPFNEHWQTVYSLCHPCHIHYDLVGKYETLEEDSN
:: .:. :::.::. ::.: : : .. ::. : .::.:: :.::.:::.::::::.:
CCDS42 ALINGSGVKFKEFIHYLLDSH--RPVGMDIHWEKVSKLCYPCLINYDFVGKFETLEEDAN
330 340 350 360 370
290 300 310 320 330 340
pF1KE3 YVLQLAGVGSYLKFPTYAKSTRTTDEMTT-----EFFQNISSEHQTQLYEVYKLDFLMFN
: ::. :. . ::::.. :. ...:: :. ....... .. .:. : ::.::::
CCDS42 YFLQMIGAPKELKFPNF-KDRHSSDERTNAQVVRQYLKDLTRTERQLIYDFYYLDYLMFN
380 390 400 410 420 430
350
pF1KE3 YSVPSYLKLE
:..:
CCDS42 YTTPFL
440
>>CCDS2047.1 CHST10 gene_id:9486|Hs109|chr2 (356 aa)
initn: 516 init1: 268 opt: 573 Z-score: 701.8 bits: 138.4 E(33420): 9.2e-33
Smith-Waterman score: 573; 32.0% identity (66.7% similar) in 303 aa overlap (60-349:59-354)
30 40 50 60 70 80
pF1KE3 IFYFQSMLHPVMRRNPFGVDICCRKGSRSPLQELYNPIQLELSNTAVLHQM----RRDQV
. : .: :: .. ... . : . .
CCDS20 FKDPDVYSAKQEFLFLTTMPEVRKLPEEKHIPEELKPTGKELPDSQLVQPLVYMERLELI
30 40 50 60 70 80
90 100 110 120 130 140
pF1KE3 TDTCRANSATSRKRRVLTPNDLKHLVVDEDHELIYCYVPKVACTNWKRLMMVLTGRGKYS
..:: .. . .. .. : .. : . :....: .:::. :.::....::.: .:
CCDS20 RNVCRDDALKNLSHTPVSKFVLDRIFVCDKHKILFCQTPKVGNTQWKKVLIVLNG--AFS
90 100 110 120 130 140
150 160 170 180 190 200
pF1KE3 DPMEIPAN--EAHVSANLKTLNQYSIPEINHRLKSYMKFLFVREPFERLVSAYRNKFTQ-
. ::: : . : . .: :...: ::..:::.:.::..::.:::::.::...::..
CCDS20 SIEEIPENVVHDHEKNGLPRLSSFSDAEIQKRLKTYFKFFIVRDPFERLISAFKDKFVHN
150 160 170 180 190 200
210 220 230 240 250
pF1KE3 -KYNISFHKRYGTKIIKRQRKNATQEALRKGDDVKFEEFVAYLIDP-HTQREEPFNEH--
... .... . ::.. :.: :. .: ..::.:: :: :: : . :..:
CCDS20 PRFEPWYRHEIAPGIIRKYRRNRTET---RG--IQFEDFVRYLGDPNHRWLDLQFGDHII
210 220 230 240 250 260
260 270 280 290 300 310
pF1KE3 -WQTVYSLCHPCHIHYDLVGKYETLEEDSNYVLQLAGVGSYLKFPTYAKSTRTTDEMTTE
: : :: ::.: :...:..::::.:. :.:. ::. ...:: . . .. .:
CCDS20 HWVTYVELCAPCEIMYSVIGHHETLEDDAPYILKEAGIDHLVSYPTIPPGITVYNRTKVE
270 280 290 300 310 320
320 330 340 350
pF1KE3 -FFQNISSEHQTQLYEVYKLDFLMFNYSVPSYLKLE
.: .::.. .:: .. :: .:.:. :..:
CCDS20 HYFLGISKRDIRRLYARFEGDFKLFGYQKPDFLLN
330 340 350
>>CCDS5333.1 CHST12 gene_id:55501|Hs109|chr7 (414 aa)
initn: 725 init1: 327 opt: 524 Z-score: 641.1 bits: 127.4 E(33420): 2.2e-29
Smith-Waterman score: 746; 43.0% identity (68.0% similar) in 291 aa overlap (81-349:124-411)
60 70 80 90 100
pF1KE3 CCRKGSRSPLQELYNPIQLELSNTAVLHQMRRDQVTDTCRANS--ATSRKRRVLT--PN-
::. . : ::: : :.:.. ::
CCDS53 PGSMEESVRGYDWSPRDARRSPDQGRQQAERRSVLRGFC-ANSSLAFPTKERAFDDIPNS
100 110 120 130 140 150
110 120 130 140 150 160
pF1KE3 DLKHLVVDEDHELIYCYVPKVACTNWKRLMMVLTG----RGK-YSDPMEIPANEAHVSAN
.:.::.::. : :::::::::::::::.:.::.: :: : ::..:: ...: ..
CCDS53 ELSHLIVDDRHGAIYCYVPKVACTNWKRVMIVLSGSLLHRGAPYRDPLRIPREHVHNASA
160 170 180 190 200 210
170 180 190 200 210
pF1KE3 LKTLNQY-------SIPEINHRLKSYMKFLFVREPFERLVSAYRNKFTQKYNISFHKRYG
:.:.. : .. .::.: ::::::.:: ::.::.:.:: . : :.....
CCDS53 HLTFNKFWRRYGKLSRHLMKVKLKKYTKFLFVRDPFVRLISAFRSKFELE-NEEFYRKFA
220 230 240 250 260 270
220 230 240 250 260
pF1KE3 TKIIKRQRKNAT-----QEALRKGDDVKFEEFVAYLIDPHTQREEPFNEHWQTVYSLCHP
. ... .... .::.: : :.: .:. ::.::::.. ::::::. :: ::::
CCDS53 VPMLRLYANHTSLPASAREAFRAGLKVSFANFIQYLLDPHTEKLAPFNEHWRQVYRLCHP
280 290 300 310 320 330
270 280 290 300 310 320
pF1KE3 CHIHYDLVGKYETLEEDSNYVLQLAGVGSYLKFPTYAKSTRTTDEMTTEFFQNISSEHQT
:.: ::.::: :::.::. .::: : :.:: .. ::.. ..: .: .
CCDS53 CQIDYDFVGKLETLDEDAAQLLQLLQVDRQLRFPPSYRN-RTASSWEEDWFAKIPLAWRQ
340 350 360 370 380 390
330 340 350
pF1KE3 QLYEVYKLDFLMFNYSVPSYLKLE
:::..:. ::..:.: : :
CCDS53 QLYKLYEADFVLFGYPKPENLLRD
400 410
>>CCDS10059.1 CHST14 gene_id:113189|Hs109|chr15 (376 aa)
initn: 462 init1: 202 opt: 482 Z-score: 590.6 bits: 117.9 E(33420): 1.5e-26
Smith-Waterman score: 630; 41.4% identity (66.8% similar) in 256 aa overlap (98-350:133-371)
70 80 90 100 110 120
pF1KE3 QLELSNTAVLHQMRRDQVTDTCRANSATSRKRRVLTPNDLKHLVVDEDHELIYCYVPKVA
.::.: :.:..:.. ....::::::::
CCDS10 QVRQDVRNRTLRAVCGQPGMPRDPWDLPVGQRRTL----LRHILVSDRYRFLYCYVPKVA
110 120 130 140 150
130 140 150 160 170 180
pF1KE3 CTNWKRLMMVLTGRGKYSDPMEIPANEAHVSANLKTLNQYSIPEINHRLKSYMKFLFVRE
:.::::.: ::.: : ... . : : .: : . :: .::. :.:::::::
CCDS10 CSNWKRVMKVLAG---VLDSVDVRLKMDHRS-DLVFLADLRPEEIRYRLQHYFKFLFVRE
160 170 180 190 200 210
190 200 210 220 230 240
pF1KE3 PFERLVSAYRNKFTQKYNISFHKRYGTKIIKRQRKNATQEALRKGDDVKFEEFVAYLIDP
:.:::.::::::: . . ...:::..:..: : .: :::: : ::. ::.:
CCDS10 PLERLLSAYRNKFGEIRE--YQQRYGAEIVRRYRAGAGPSP--AGDDVTFPEFLRYLVDE
220 230 240 250 260 270
250 260 270 280 290 300
pF1KE3 HTQREEPFNEHWQTVYSLCHPCHIHYDLVGKYETLEEDSNYVLQLAGVGSYLKFPTYAKS
.: .::::. :: ::.:: .:::.::.:: :: :.: ::. . . ...::.
CCDS10 DPER---MNEHWMPVYHLCQPCAVHYDFVGSYERLEADANQVLEWVRAPPHVRFPARQAW
280 290 300 310 320
310 320 330 340 350
pF1KE3 TRTTDEMTTEFFQNISSEHQTQLYEV---YKLDFLMFNYSVPSYLKLE
: .. . .. .. : .. : .: : ::: .: : .:. :
CCDS10 YRPASPESLHY--HLCSAPRALLQDVLPKYILDFSLFAYPLPNVTKEACQQ
330 340 350 360 370
352 residues in 1 query sequences
18921897 residues in 33420 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Aug 4 20:35:08 2021 done: Wed Aug 4 20:35:08 2021
Total Scan time: 1.090 Total Display time: 0.080
Function used was FASTA [36.3.4 Apr, 2011]