FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6322, 322 aa
1>>>pF1KE6322 322 - 322 aa - 322 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.7038+/-0.00117; mu= 12.8750+/- 0.070
mean_var=60.1482+/-12.952, 0's: 0 Z-trim(100.5): 30 B-trim: 374 in 1/47
Lambda= 0.165372
statistics sampled from 6115 (6135) to 6115 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.53), E-opt: 0.2 (0.188), width: 16
Scan time: 1.920
The best scores are: opt bits E(32554)
CCDS11552.2 SLC35B1 gene_id:10237|Hs108|chr17 ( 359) 2090 507.6 5.9e-144
CCDS75463.1 SLC35B2 gene_id:347734|Hs108|chr6 ( 383) 457 118.0 1.2e-26
CCDS34462.1 SLC35B2 gene_id:347734|Hs108|chr6 ( 432) 457 118.0 1.3e-26
CCDS69127.1 SLC35B2 gene_id:347734|Hs108|chr6 ( 339) 433 112.3 5.6e-25
CCDS4508.1 SLC35B3 gene_id:51000|Hs108|chr6 ( 401) 408 106.3 4.1e-23
CCDS75462.1 SLC35B2 gene_id:347734|Hs108|chr6 ( 299) 390 102.0 6.1e-22
>>CCDS11552.2 SLC35B1 gene_id:10237|Hs108|chr17 (359 aa)
initn: 2090 init1: 2090 opt: 2090 Z-score: 2698.0 bits: 507.6 E(32554): 5.9e-144
Smith-Waterman score: 2090; 99.7% identity (100.0% similar) in 322 aa overlap (1-322:38-359)
10 20 30
pF1KE6 MASSSSLVPDRLRLPLCFLGVFVCYFYYGI
::::::::::::::::::::::::::::::
CCDS11 GDVRLELSPPPPLLPVPVVSGSPVGSSGRLMASSSSLVPDRLRLPLCFLGVFVCYFYYGI
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE6 LQEKITRGKYGEGAKQETFTFALTLVFIQCVINAVFAKILIQFFDTARVDHTRSWLYAAC
::::::::::::::::::::::::::::::::::::::::::::::::::.:::::::::
CCDS11 LQEKITRGKYGEGAKQETFTFALTLVFIQCVINAVFAKILIQFFDTARVDRTRSWLYAAC
70 80 90 100 110 120
100 110 120 130 140 150
pF1KE6 SISYLGAMVSSNSALQFVNYPTQVLGKSCKPIPVMLLGVTLLKKKYPLAKYLCVLLIVAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SISYLGAMVSSNSALQFVNYPTQVLGKSCKPIPVMLLGVTLLKKKYPLAKYLCVLLIVAG
130 140 150 160 170 180
160 170 180 190 200 210
pF1KE6 VALFMYKPKKVVGIEEHTVGYGELLLLLSLTLDGLTGVSQDHMRAHYQTGSNHMMLNINL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VALFMYKPKKVVGIEEHTVGYGELLLLLSLTLDGLTGVSQDHMRAHYQTGSNHMMLNINL
190 200 210 220 230 240
220 230 240 250 260 270
pF1KE6 WSTLLLGMGILFTGELWEFLSFAERYPAIIYNILLFGLTSALGQSFIFMTVVYFGPLTCS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 WSTLLLGMGILFTGELWEFLSFAERYPAIIYNILLFGLTSALGQSFIFMTVVYFGPLTCS
250 260 270 280 290 300
280 290 300 310 320
pF1KE6 IITTTRKFFTILASVILFANPISPMQWVGTVLVFLGLGLDAKFGKGAKKTSH
::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 IITTTRKFFTILASVILFANPISPMQWVGTVLVFLGLGLDAKFGKGAKKTSH
310 320 330 340 350
>>CCDS75463.1 SLC35B2 gene_id:347734|Hs108|chr6 (383 aa)
initn: 362 init1: 183 opt: 457 Z-score: 591.9 bits: 118.0 E(32554): 1.2e-26
Smith-Waterman score: 457; 31.9% identity (60.6% similar) in 310 aa overlap (12-319:61-367)
10 20 30 40
pF1KE6 MASSSSLVPDRLRLPLCFLGVFVCYFYYGILQEKITRGKYG
:.: .: :. : :. .:.:::.. .::
CCDS75 CVFGNEPKASDEVPLAPRTEAAETTPMWQALKLLFCATGLQVSYLTWGVLQERVMTRSYG
40 50 60 70 80 90
50 60 70 80 90
pF1KE6 EGAKQ--ETFTFALTLVFIQCVINAVFAKILIQFFDTARVDHTRSWLYAACSISYLGAMV
: . : :: . ::... :. . : . . : . . :. :.: . .
CCDS75 ATATSPGERFTDSQFLVLMNRVLALIVAGLSCVLCKQPR-HGAPMYRYSFASLSNVLSSW
100 110 120 130 140
100 110 120 130 140 150
pF1KE6 SSNSALQFVNYPTQVLGKSCKPIPVMLLGVTLLKKKYPLAKYLCVLLIVAGVALFMYKPK
. ::.::..:::::.:. : :::::.: . ...: .:: . :: ::..:. .
CCDS75 CQYEALKFVSFPTQVLAKASKVIPVMLMGKLVSRRSYEHWEYLTATLISIGVSMFLLSSG
150 160 170 180 190 200
160 170 180 190 200 210
pF1KE6 KVVGIEEHTVGYGELLLLLSLTLDGLTGVSQDHMRAHYQTGSNHMMLNINLWSTLLLGMG
:. : .:: ...:..:. :: . : :. .: .::...:..: :. .
CCDS75 PEPRSSPATTLSGLILLAGYIAFDSFTSNWQDALFA-YKMSSVQMMFGVNFFSCLFTVGS
210 220 230 240 250 260
220 230 240 250 260 270
pF1KE6 ILFTGELWEFLSFAERYPAIIYNILLFGLTSALGQSFIFMTVVYFGPLTCSIITTTRKFF
.: : : : : :. . . ::... :: :: :::.:. :: . .:: : :. :
CCDS75 LLEQGALLEGTRFMGRHSEFAAHALLLSICSACGQLFIFYTIGQFGAAVFTIIMTLRQAF
270 280 290 300 310 320
280 290 300 310 320
pF1KE6 TILASVILFANPISPMQWVGTVLVFLGLGLDAKFGKGAKKTSH
.:: : .:... .. . .:...:: .: : . ...: :
CCDS75 AILLSCLLYGHTVTVVGGLGVAVVFAALLLRV-YARGRLKQRGKKAVPVESPVQKV
330 340 350 360 370 380
>>CCDS34462.1 SLC35B2 gene_id:347734|Hs108|chr6 (432 aa)
initn: 362 init1: 183 opt: 457 Z-score: 591.0 bits: 118.0 E(32554): 1.3e-26
Smith-Waterman score: 457; 31.9% identity (60.6% similar) in 310 aa overlap (12-319:110-416)
10 20 30 40
pF1KE6 MASSSSLVPDRLRLPLCFLGVFVCYFYYGILQEKITRGKYG
:.: .: :. : :. .:.:::.. .::
CCDS34 CVFGNEPKASDEVPLAPRTEAAETTPMWQALKLLFCATGLQVSYLTWGVLQERVMTRSYG
80 90 100 110 120 130
50 60 70 80 90
pF1KE6 EGAKQ--ETFTFALTLVFIQCVINAVFAKILIQFFDTARVDHTRSWLYAACSISYLGAMV
: . : :: . ::... :. . : . . : . . :. :.: . .
CCDS34 ATATSPGERFTDSQFLVLMNRVLALIVAGLSCVLCKQPR-HGAPMYRYSFASLSNVLSSW
140 150 160 170 180 190
100 110 120 130 140 150
pF1KE6 SSNSALQFVNYPTQVLGKSCKPIPVMLLGVTLLKKKYPLAKYLCVLLIVAGVALFMYKPK
. ::.::..:::::.:. : :::::.: . ...: .:: . :: ::..:. .
CCDS34 CQYEALKFVSFPTQVLAKASKVIPVMLMGKLVSRRSYEHWEYLTATLISIGVSMFLLSSG
200 210 220 230 240 250
160 170 180 190 200 210
pF1KE6 KVVGIEEHTVGYGELLLLLSLTLDGLTGVSQDHMRAHYQTGSNHMMLNINLWSTLLLGMG
:. : .:: ...:..:. :: . : :. .: .::...:..: :. .
CCDS34 PEPRSSPATTLSGLILLAGYIAFDSFTSNWQDALFA-YKMSSVQMMFGVNFFSCLFTVGS
260 270 280 290 300 310
220 230 240 250 260 270
pF1KE6 ILFTGELWEFLSFAERYPAIIYNILLFGLTSALGQSFIFMTVVYFGPLTCSIITTTRKFF
.: : : : : :. . . ::... :: :: :::.:. :: . .:: : :. :
CCDS34 LLEQGALLEGTRFMGRHSEFAAHALLLSICSACGQLFIFYTIGQFGAAVFTIIMTLRQAF
320 330 340 350 360 370
280 290 300 310 320
pF1KE6 TILASVILFANPISPMQWVGTVLVFLGLGLDAKFGKGAKKTSH
.:: : .:... .. . .:...:: .: : . ...: :
CCDS34 AILLSCLLYGHTVTVVGGLGVAVVFAALLLRV-YARGRLKQRGKKAVPVESPVQKV
380 390 400 410 420 430
>>CCDS69127.1 SLC35B2 gene_id:347734|Hs108|chr6 (339 aa)
initn: 362 init1: 183 opt: 433 Z-score: 561.9 bits: 112.3 E(32554): 5.6e-25
Smith-Waterman score: 433; 31.8% identity (60.5% similar) in 299 aa overlap (23-319:28-323)
10 20 30 40 50
pF1KE6 MASSSSLVPDRLRLPLCFLGVFVCYFYYGILQEKITRGKYGEGAKQ--ETFTFAL
: :. .:.:::.. .:: : . : :: .
CCDS69 MLLAMPALWYLATSWCSTSGGRTTWRPVSYLTWGVLQERVMTRSYGATATSPGERFTDSQ
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE6 TLVFIQCVINAVFAKILIQFFDTARVDHTRSWLYAACSISYLGAMVSSNSALQFVNYPTQ
::... :. . : . . : . . :. :.: . . . ::.::..:::
CCDS69 FLVLMNRVLALIVAGLSCVLCKQPR-HGAPMYRYSFASLSNVLSSWCQYEALKFVSFPTQ
70 80 90 100 110
120 130 140 150 160 170
pF1KE6 VLGKSCKPIPVMLLGVTLLKKKYPLAKYLCVLLIVAGVALFMYKPKKVVGIEEHTVGYGE
::.:. : :::::.: . ...: .:: . :: ::..:. . :. :
CCDS69 VLAKASKVIPVMLMGKLVSRRSYEHWEYLTATLISIGVSMFLLSSGPEPRSSPATTLSGL
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE6 LLLLLSLTLDGLTGVSQDHMRAHYQTGSNHMMLNINLWSTLLLGMGILFTGELWEFLSFA
.:: ...:..:. :: . : :. .: .::...:..: :. ..: : : : :
CCDS69 ILLAGYIAFDSFTSNWQDALFA-YKMSSVQMMFGVNFFSCLFTVGSLLEQGALLEGTRFM
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE6 ERYPAIIYNILLFGLTSALGQSFIFMTVVYFGPLTCSIITTTRKFFTILASVILFANPIS
:. . . ::... :: :: :::.:. :: . .:: : :. :.:: : .:... ..
CCDS69 GRHSEFAAHALLLSICSACGQLFIFYTIGQFGAAVFTIIMTLRQAFAILLSCLLYGHTVT
240 250 260 270 280 290
300 310 320
pF1KE6 PMQWVGTVLVFLGLGLDAKFGKGAKKTSH
. .:...:: .: : . ...: :
CCDS69 VVGGLGVAVVFAALLLRV-YARGRLKQRGKKAVPVESPVQKV
300 310 320 330
>>CCDS4508.1 SLC35B3 gene_id:51000|Hs108|chr6 (401 aa)
initn: 354 init1: 147 opt: 408 Z-score: 528.4 bits: 106.3 E(32554): 4.1e-23
Smith-Waterman score: 408; 32.2% identity (59.3% similar) in 307 aa overlap (16-319:83-375)
10 20 30 40
pF1KE6 MASSSSLVPDRLRLPLCFLGVFVCYFYYGILQEKITRGKYGEGAK
.: :::: :. :: ::: : :: :
CCDS45 QTMSPHIKSVDDVVVLGMNLSKFNKLTQFFICVAGVFVFYLIYGYLQELIFSV---EGFK
60 70 80 90 100
50 60 70 80 90 100
pF1KE6 QETFTFALTLVFIQCVINAVFAKILIQFFDTARVDHTRSWLYAACSISYLGAMVSSNSAL
. . :::: : .. ..:. : .:... : . . : .. .:.: ::..:
CCDS45 --SCGWYLTLV--QFAFYSIFGLIELQLIQDKR-RRIPGKTYMIIAFLTVGTMGLSNTSL
110 120 130 140 150 160
110 120 130 140 150 160
pF1KE6 QFVNYPTQVLGKSCKPIPVMLLGVTLLKKKYPLAKYLCVLLIVAGVALFMYKPKKVVGIE
..::::::. : :: ::::: :: . :.: .: .. . :. : . ..
CCDS45 GYLNYPTQVIFKCCKLIPVMLGGVFIQGKRYNVADVSAAICMSLGLIWFTLADSTTAPNF
170 180 190 200 210 220
170 180 190 200 210 220
pF1KE6 EHTVGYGELLLLLSLTLDGLTGVSQDH-MRAHYQTGSNHMMLNINLWSTLLLGMGILFTG
. : : .:. :.: :.. : :.. :. : ..:. .. . .. . .: .:. :.
CCDS45 NLT---GVVLISLALCADAVIGNVQEKAMKLHNASNSEMVLYSYSIGFVYIL-LGLTCTS
230 240 250 260 270 280
230 240 250 260 270 280
pF1KE6 ELWEFLSFAERYPAIIYNI-LLFGLTSALGQSFIFMTVVYFGPLTCSIITTTRKFFTILA
: ..: . :. :. .::.::. .: ::.. . :: : .:: :: .::.
CCDS45 GLGPAVTFCAKNPVRTYGYAFLFSLTGYFGISFVLALIKIFGALIAVTVTTGRKAMTIVL
290 300 310 320 330 340
290 300 310 320
pF1KE6 SVILFANPIS-PMQWVGTVLVFLGLGLDAKFGKGAKKTSH
: :.::.:.. . : : .:: ::. :.. ..:. :
CCDS45 SFIFFAKPFTFQYVWSG-LLVVLGIFLNV-YSKNMDKIRLPSLYDLINKSVEARKSRTLA
350 360 370 380 390
CCDS45 QTV
400
>>CCDS75462.1 SLC35B2 gene_id:347734|Hs108|chr6 (299 aa)
initn: 338 init1: 183 opt: 390 Z-score: 507.4 bits: 102.0 E(32554): 6.1e-22
Smith-Waterman score: 390; 31.7% identity (60.3% similar) in 287 aa overlap (35-319:1-283)
10 20 30 40 50 60
pF1KE6 SSLVPDRLRLPLCFLGVFVCYFYYGILQEKITRGKYGEGAKQ--ETFTFALTLVFIQCVI
.::. :: : . : :: . ::... :.
CCDS75 MTRS-YGATATSPGERFTDSQFLVLMNRVL
10 20
70 80 90 100 110 120
pF1KE6 NAVFAKILIQFFDTARVDHTRSWLYAACSISYLGAMVSSNSALQFVNYPTQVLGKSCKPI
. : . . : . . :. :.: . . . ::.::..:::::.:. : :
CCDS75 ALIVAGLSCVLCKQPR-HGAPMYRYSFASLSNVLSSWCQYEALKFVSFPTQVLAKASKVI
30 40 50 60 70 80
130 140 150 160 170 180
pF1KE6 PVMLLGVTLLKKKYPLAKYLCVLLIVAGVALFMYKPKKVVGIEEHTVGYGELLLLLSLTL
::::.: . ...: .:: . :: ::..:. . :. : .:: ...
CCDS75 PVMLMGKLVSRRSYEHWEYLTATLISIGVSMFLLSSGPEPRSSPATTLSGLILLAGYIAF
90 100 110 120 130 140
190 200 210 220 230 240
pF1KE6 DGLTGVSQDHMRAHYQTGSNHMMLNINLWSTLLLGMGILFTGELWEFLSFAERYPAIIYN
:..:. :: . : :. .: .::...:..: :. ..: : : : : :. . .
CCDS75 DSFTSNWQDALFA-YKMSSVQMMFGVNFFSCLFTVGSLLEQGALLEGTRFMGRHSEFAAH
150 160 170 180 190 200
250 260 270 280 290 300
pF1KE6 ILLFGLTSALGQSFIFMTVVYFGPLTCSIITTTRKFFTILASVILFANPISPMQWVGTVL
::... :: :: :::.:. :: . .:: : :. :.:: : .:... .. . .:...
CCDS75 ALLLSICSACGQLFIFYTIGQFGAAVFTIIMTLRQAFAILLSCLLYGHTVTVVGGLGVAV
210 220 230 240 250 260
310 320
pF1KE6 VFLGLGLDAKFGKGAKKTSH
:: .: : . ...: :
CCDS75 VFAALLLRV-YARGRLKQRGKKAVPVESPVQKV
270 280 290
322 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 12:05:25 2016 done: Tue Nov 8 12:05:26 2016
Total Scan time: 1.920 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]