FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5309, 423 aa
1>>>pF1KB5309 423 - 423 aa - 423 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.4663+/-0.000775; mu= 16.3280+/- 0.047
mean_var=66.2267+/-13.197, 0's: 0 Z-trim(108.4): 13 B-trim: 0 in 0/49
Lambda= 0.157601
statistics sampled from 10185 (10193) to 10185 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.687), E-opt: 0.2 (0.313), width: 16
Scan time: 3.070
The best scores are: opt bits E(32554)
CCDS13879.1 GAL3ST1 gene_id:9514|Hs108|chr22 ( 423) 2908 669.9 1.3e-192
CCDS33427.1 GAL3ST2 gene_id:64090|Hs108|chr2 ( 398) 824 196.1 5.2e-50
CCDS8128.1 GAL3ST3 gene_id:89792|Hs108|chr11 ( 431) 759 181.3 1.6e-45
CCDS5688.1 GAL3ST4 gene_id:79690|Hs108|chr7 ( 486) 295 75.8 1e-13
>>CCDS13879.1 GAL3ST1 gene_id:9514|Hs108|chr22 (423 aa)
initn: 2908 init1: 2908 opt: 2908 Z-score: 3571.7 bits: 669.9 E(32554): 1.3e-192
Smith-Waterman score: 2908; 99.8% identity (100.0% similar) in 423 aa overlap (1-423:1-423)
10 20 30 40 50 60
pF1KB5 MLPPQKKPWESMAKGLVLGALFTSFLLLMYSYAVPPLHAGLASTTPEAAASCSPPALEPE
::::::::::::::::::::::::::::.:::::::::::::::::::::::::::::::
CCDS13 MLPPQKKPWESMAKGLVLGALFTSFLLLVYSYAVPPLHAGLASTTPEAAASCSPPALEPE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 AVIRANGSAGECQPRRNIVFLKTHKTASSTLLNILFRFGQKHRLKFAFPNGRNDFDYPTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 AVIRANGSAGECQPRRNIVFLKTHKTASSTLLNILFRFGQKHRLKFAFPNGRNDFDYPTF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 FARSLVQDYRPGACFNIICNHMRFHYDEVRGLVPTNAIFITVLRDPARLFESSFHYFGPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 FARSLVQDYRPGACFNIICNHMRFHYDEVRGLVPTNAIFITVLRDPARLFESSFHYFGPV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 VPLTWKLSAGDKLTEFLQDPDRYYDPNGFNAHYLRNLLFFDLGYDNSLDPSSPQVQEHIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 VPLTWKLSAGDKLTEFLQDPDRYYDPNGFNAHYLRNLLFFDLGYDNSLDPSSPQVQEHIL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 EVERRFHLVLLQEYFDESLVLLKDLLCWELEDVLYFKLNARRDSPVPRLSGELYGRATAW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 EVERRFHLVLLQEYFDESLVLLKDLLCWELEDVLYFKLNARRDSPVPRLSGELYGRATAW
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 NMLDSHLYRHFNASFWRKVEAFGRERMAREVAALRHANERMRTICIDGGHAVDAAAIQDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 NMLDSHLYRHFNASFWRKVEAFGRERMAREVAALRHANERMRTICIDGGHAVDAAAIQDE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 AMQPWQPLGTKSILGYNLKKSIGQRHAQLCRRMLTPEIQYLMDLGANLWVTKLWKFIRDF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 AMQPWQPLGTKSILGYNLKKSIGQRHAQLCRRMLTPEIQYLMDLGANLWVTKLWKFIRDF
370 380 390 400 410 420
pF1KB5 LRW
:::
CCDS13 LRW
>>CCDS33427.1 GAL3ST2 gene_id:64090|Hs108|chr2 (398 aa)
initn: 736 init1: 323 opt: 824 Z-score: 1011.3 bits: 196.1 E(32554): 5.2e-50
Smith-Waterman score: 824; 39.8% identity (66.6% similar) in 344 aa overlap (67-406:43-382)
40 50 60 70 80 90
pF1KB5 LHAGLASTTPEAAASCSPPALEPEAVIRANGSAGECQPRRNIVFLKTHKTASSTLLNILF
:. .: : ::.:::::::::::.::::.
CCDS33 RVILLLLLALTLLLLAGFLHSDLELDTPLFGGQAEGPPVTNIMFLKTHKTASSTVLNILY
20 30 40 50 60 70
100 110 120 130 140 150
pF1KB5 RFGQKHRLKFAFPNG-RNDFDYPTFFARSLVQDYRPGACFNIICNHMRFHYDEVRGLVPT
::.. : :. :.: : : . :: .: :. :::.:::.::. .:. ..:.
CCDS33 RFAETHNLSVALPAGSRVHLGYPWLFLARYVEGVGSQQRFNIMCNHLRFNLPQVQKVMPN
80 90 100 110 120 130
160 170 180 190 200 210
pF1KB5 NAIFITVLRDPARLFESSFHYFGPVVPLTWKLSAGDKLTEFLQDPDRYY-DPNGFNAHYL
.......::.:. .:::: :. .: . .. .: :: .: .: : . :
CCDS33 DTFYFSILRNPVFQLESSFIYYKTYAP---AFRGAPSLDAFLASPRTFYNDSRHLRNVYA
140 150 160 170 180
220 230 240 250 260 270
pF1KB5 RNLLFFDLGYDNSLDPSSPQVQEHILEVERRFHLVLLQEYFDESLVLLKDLLCWELEDVL
.: ..::.:.: . . :. .: ::::::.:::. :..:::::::. : : :.::.
CCDS33 KNNMWFDFGFDPNAQCEEGYVRARIAEVERRFRLVLIAEHLDESLVLLRRRLRWALDDVV
190 200 210 220 230 240
280 290 300 310 320 330
pF1KB5 YFKLNARRDSPVPRLSGELYGRATAWNMLDSHLYRHFNASFWRKVEA-FGRERMAREVAA
:.::.: : ::: : :: .: :: .::.::: ..: ...: .: .:. ::
CCDS33 AFRLNSRSARSVARLSPETRERARSWCALDWRLYEHFNRTLWAQLRAELGPRRLRGEVER
250 260 270 280 290 300
340 350 360 370 380 390
pF1KB5 LRHANERMRTICI-DGGHAVDAAAIQDEAMQPWQPLGTKSILGYNLKKSIGQRHAQLCRR
:: ... ..:. ::: . . :.: ..:.: : .::::::. .. .. .:.:
CCDS33 LRARRRELASLCLQDGGALKNHTQIRDPRLRPYQS-GKADILGYNLRPGLDNQTLGVCQR
310 320 330 340 350 360
400 410 420
pF1KB5 MLTPEIQYLMDLGANLWVTKLWKFIRDFLRW
.. ::.::. : :
CCDS33 LVMPELQYMARLYALQFPEKPLKNIPFLGA
370 380 390
>>CCDS8128.1 GAL3ST3 gene_id:89792|Hs108|chr11 (431 aa)
initn: 734 init1: 238 opt: 759 Z-score: 930.9 bits: 181.3 E(32554): 1.6e-45
Smith-Waterman score: 762; 39.1% identity (62.9% similar) in 345 aa overlap (72-400:51-391)
50 60 70 80 90
pF1KB5 ASTTPEAAASCSPPALEPEAVIRANGSAGECQPRRN---------IVFLKTHKTASSTLL
: : :: ..::::::::..:.
CCDS81 LLLVLGCSTVSLLIHQGAQLSWYPKLFPLSCPPLRNSPPRPKHMTVAFLKTHKTAGTTVQ
30 40 50 60 70 80
100 110 120 130 140
pF1KB5 NILFRFGQKHRLKFAFPNG--RNDFDYPTFFARSLVQDY-RPGACFNIICNHMRFHYDEV
::::::...: : :.:. ...: :: :. .:. :: ... .:.:: :.
CCDS81 NILFRFAERHNLTVALPHPSCEHQFCYPRNFSAHFVHPATRPP---HVLASHLRFDRAEL
90 100 110 120 130
150 160 170 180 190 200
pF1KB5 RGLVPTNAIFITVLRDPARLFESSFHYFGPVVPLTWKLSAGDKLTEFLQDPDRYYDPNGF
. :.: .....:.::.:: .::: : :.. : ... . .: ::. :. :: .
CCDS81 ERLMPPSTVYVTILREPAAMFESLFSYYNQYCP-AFRRVPNASLEAFLRAPEAYYRAGEH
140 150 160 170 180 190
210 220 230 240 250 260
pF1KB5 NAHYLRNLLFFDLGYDNSLDP--SSPQVQEHILEVERRFHLVLLQEYFDESLVLLKDLLC
: . .: : .::: :: .: .. . : .::. : ::.. ::::::::::. ::
CCDS81 FAMFAHNTLAYDLGGDNERSPRDDAAYLAGLIRQVEEVFSLVMIAEYFDESLVLLRRLLA
200 210 220 230 240 250
270 280 290 300 310 320
pF1KB5 WELEDVLYFKLNARRDSP-VPRLSGELYGRATAWNMLDSHLYRHFNASFWRKVEAFGRER
:.:.:::: ::::: : . . . : : .:: ::. :: ::::.:::.: ::
CCDS81 WDLDDVLYAKLNARAASSRLAAIPAALARAARTWNALDAGLYDHFNATFWRHVARAGRAC
260 270 280 290 300 310
330 340 350 360 370 380
pF1KB5 MAREVAALRHANERMRTICI-DGGHAVDAAAIQDEAMQPWQPLGTKSILGYNLKKSIGQR
. ::. ::.: .:. :. : :: :. . .::::: .:.::.: . .
CCDS81 VEREARELREARQRLLRRCFGDEPLLRPAAQIRTKQLQPWQPSRKVDIMGYDLPGGGAGP
320 330 340 350 360 370
390 400 410 420
pF1KB5 HAQLCRRMLTPEIQYLMDLGANLWVTKLWKFIRDFLRW
.. : .. ::.::
CCDS81 ATEACLKLAMPEVQYSNYLLRKQKRRGGARARPEPVLDNPPPRPIRVLPRGPQGP
380 390 400 410 420 430
>>CCDS5688.1 GAL3ST4 gene_id:79690|Hs108|chr7 (486 aa)
initn: 817 init1: 203 opt: 295 Z-score: 359.9 bits: 75.8 E(32554): 1e-13
Smith-Waterman score: 735; 34.6% identity (56.8% similar) in 410 aa overlap (72-406:63-467)
50 60 70 80 90 100
pF1KB5 ASTTPEAAASCSPPALEPEAVIRANGSAGECQPRRNIVFLKTHKTASSTLLNILFRFGQK
: ::. .:::::::..::..:..: :.:..
CCDS56 QLLGGPFQRRLPGLQLRQPSAPSLRPALPSCPPRQRLVFLKTHKSGSSSVLSLLHRYGDQ
40 50 60 70 80 90
110 120 130 140 150
pF1KB5 HRLKFAFPNGRNDFDYPTFFARSLVQDYRP--GAC---FNIICNHMRFHYDEVRGLVPTN
: :.::.: .: .: :: .: : :. ::: :. :.:.:.::::. :: ..:..
CCDS56 HGLRFALP-ARYQFGYPKLFQASRVKGYRPQGGGTQLPFHILCHHMRFNLKEVLQVMPSD
100 110 120 130 140 150
160 170 180 190 200 210
pF1KB5 AIFITVLRDPARLFESSFHYFGPVVPLTWKLSAGDKLTEFLQDPDRYYDPNGFNAHYLRN
..:....:::: : .:.: :. . . . . .:. :: .: .: :.. . :: ::
CCDS56 SFFFSIVRDPAALARSAFSYYKST---SSAFRKSPSLAAFLANPRGFYRPGARGDHYARN
160 170 180 190 200
220 230
pF1KB5 LLFFDLGYD-------------NSLDPSSPQVQ--------------------------E
::.::.: ::. ::.: .
CCDS56 LLWFDFGLPFPPEKRAKRGNIHPPRDPNPPQLQVLPSGAGPRAQTLNPNALIHPVSTVTD
210 220 230 240 250 260
240 250 260 270
pF1KB5 HILEV---------------------ERRFHLVLLQEYFDESLVLLKDLLCWELEDVLYF
: .. . : ::.. :::::::::: : ::: :.::. :
CCDS56 HRSQISSPASFDLGSSSFIQWGLAWLDSVFDLVMVAEYFDESLVLLADALCWGLDDVVGF
270 280 290 300 310 320
280 290 300 310 320
pF1KB5 KLNAR----------RDSPVPRLSGELYGRATAWNMLDSHLYRHFNASFWRKVEAFGRER
::. .: . . .: .:: ::: :: :: ::: :.: ..: .:. :
CCDS56 MHNAQAGHKQGLSTVSNSGLTAEDRQLTARARAWNNLDWALYVHFNRSLWARIEKYGQGR
330 340 350 360 370 380
330 340 350 360 370 380
pF1KB5 MAREVAALRHANERMRTICIDGGHAVDAAAIQDEAMQPWQPLGTKSILGYNLKKSIGQRH
. :: :: : . :. ::.: : : :. ..:.: .:. ..::: :..... .
CCDS56 LQTAVAELRARREALAKHCLVGGEASDPKYITDRRFRPFQ-FGSAKVLGYILRSGLSPQD
390 400 410 420 430 440
390 400 410 420
pF1KB5 AQLCRRMLTPEIQYLMDLGANLWVTKLWKFIRDFLRW
. :.:. :::.:: : :
CCDS56 QEECERLATPELQYKDKLDAKQFPPTVSLPLKTSRPLSP
450 460 470 480
423 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 03:32:55 2016 done: Fri Nov 4 03:32:56 2016
Total Scan time: 3.070 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]