FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6322, 322 aa 1>>>pF1KE6322 322 - 322 aa - 322 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7038+/-0.00117; mu= 12.8750+/- 0.070 mean_var=60.1482+/-12.952, 0's: 0 Z-trim(100.5): 30 B-trim: 374 in 1/47 Lambda= 0.165372 statistics sampled from 6115 (6135) to 6115 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.53), E-opt: 0.2 (0.188), width: 16 Scan time: 1.920 The best scores are: opt bits E(32554) CCDS11552.2 SLC35B1 gene_id:10237|Hs108|chr17 ( 359) 2090 507.6 5.9e-144 CCDS75463.1 SLC35B2 gene_id:347734|Hs108|chr6 ( 383) 457 118.0 1.2e-26 CCDS34462.1 SLC35B2 gene_id:347734|Hs108|chr6 ( 432) 457 118.0 1.3e-26 CCDS69127.1 SLC35B2 gene_id:347734|Hs108|chr6 ( 339) 433 112.3 5.6e-25 CCDS4508.1 SLC35B3 gene_id:51000|Hs108|chr6 ( 401) 408 106.3 4.1e-23 CCDS75462.1 SLC35B2 gene_id:347734|Hs108|chr6 ( 299) 390 102.0 6.1e-22 >>CCDS11552.2 SLC35B1 gene_id:10237|Hs108|chr17 (359 aa) initn: 2090 init1: 2090 opt: 2090 Z-score: 2698.0 bits: 507.6 E(32554): 5.9e-144 Smith-Waterman score: 2090; 99.7% identity (100.0% similar) in 322 aa overlap (1-322:38-359) 10 20 30 pF1KE6 MASSSSLVPDRLRLPLCFLGVFVCYFYYGI :::::::::::::::::::::::::::::: CCDS11 GDVRLELSPPPPLLPVPVVSGSPVGSSGRLMASSSSLVPDRLRLPLCFLGVFVCYFYYGI 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE6 LQEKITRGKYGEGAKQETFTFALTLVFIQCVINAVFAKILIQFFDTARVDHTRSWLYAAC ::::::::::::::::::::::::::::::::::::::::::::::::::.::::::::: CCDS11 LQEKITRGKYGEGAKQETFTFALTLVFIQCVINAVFAKILIQFFDTARVDRTRSWLYAAC 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE6 SISYLGAMVSSNSALQFVNYPTQVLGKSCKPIPVMLLGVTLLKKKYPLAKYLCVLLIVAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SISYLGAMVSSNSALQFVNYPTQVLGKSCKPIPVMLLGVTLLKKKYPLAKYLCVLLIVAG 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE6 VALFMYKPKKVVGIEEHTVGYGELLLLLSLTLDGLTGVSQDHMRAHYQTGSNHMMLNINL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 VALFMYKPKKVVGIEEHTVGYGELLLLLSLTLDGLTGVSQDHMRAHYQTGSNHMMLNINL 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE6 WSTLLLGMGILFTGELWEFLSFAERYPAIIYNILLFGLTSALGQSFIFMTVVYFGPLTCS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 WSTLLLGMGILFTGELWEFLSFAERYPAIIYNILLFGLTSALGQSFIFMTVVYFGPLTCS 250 260 270 280 290 300 280 290 300 310 320 pF1KE6 IITTTRKFFTILASVILFANPISPMQWVGTVLVFLGLGLDAKFGKGAKKTSH :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 IITTTRKFFTILASVILFANPISPMQWVGTVLVFLGLGLDAKFGKGAKKTSH 310 320 330 340 350 >>CCDS75463.1 SLC35B2 gene_id:347734|Hs108|chr6 (383 aa) initn: 362 init1: 183 opt: 457 Z-score: 591.9 bits: 118.0 E(32554): 1.2e-26 Smith-Waterman score: 457; 31.9% identity (60.6% similar) in 310 aa overlap (12-319:61-367) 10 20 30 40 pF1KE6 MASSSSLVPDRLRLPLCFLGVFVCYFYYGILQEKITRGKYG :.: .: :. : :. .:.:::.. .:: CCDS75 CVFGNEPKASDEVPLAPRTEAAETTPMWQALKLLFCATGLQVSYLTWGVLQERVMTRSYG 40 50 60 70 80 90 50 60 70 80 90 pF1KE6 EGAKQ--ETFTFALTLVFIQCVINAVFAKILIQFFDTARVDHTRSWLYAACSISYLGAMV : . : :: . ::... :. . : . . : . . :. :.: . . CCDS75 ATATSPGERFTDSQFLVLMNRVLALIVAGLSCVLCKQPR-HGAPMYRYSFASLSNVLSSW 100 110 120 130 140 100 110 120 130 140 150 pF1KE6 SSNSALQFVNYPTQVLGKSCKPIPVMLLGVTLLKKKYPLAKYLCVLLIVAGVALFMYKPK . ::.::..:::::.:. : :::::.: . ...: .:: . :: ::..:. . CCDS75 CQYEALKFVSFPTQVLAKASKVIPVMLMGKLVSRRSYEHWEYLTATLISIGVSMFLLSSG 150 160 170 180 190 200 160 170 180 190 200 210 pF1KE6 KVVGIEEHTVGYGELLLLLSLTLDGLTGVSQDHMRAHYQTGSNHMMLNINLWSTLLLGMG :. : .:: ...:..:. :: . : :. .: .::...:..: :. . CCDS75 PEPRSSPATTLSGLILLAGYIAFDSFTSNWQDALFA-YKMSSVQMMFGVNFFSCLFTVGS 210 220 230 240 250 260 220 230 240 250 260 270 pF1KE6 ILFTGELWEFLSFAERYPAIIYNILLFGLTSALGQSFIFMTVVYFGPLTCSIITTTRKFF .: : : : : :. . . ::... :: :: :::.:. :: . .:: : :. : CCDS75 LLEQGALLEGTRFMGRHSEFAAHALLLSICSACGQLFIFYTIGQFGAAVFTIIMTLRQAF 270 280 290 300 310 320 280 290 300 310 320 pF1KE6 TILASVILFANPISPMQWVGTVLVFLGLGLDAKFGKGAKKTSH .:: : .:... .. . .:...:: .: : . ...: : CCDS75 AILLSCLLYGHTVTVVGGLGVAVVFAALLLRV-YARGRLKQRGKKAVPVESPVQKV 330 340 350 360 370 380 >>CCDS34462.1 SLC35B2 gene_id:347734|Hs108|chr6 (432 aa) initn: 362 init1: 183 opt: 457 Z-score: 591.0 bits: 118.0 E(32554): 1.3e-26 Smith-Waterman score: 457; 31.9% identity (60.6% similar) in 310 aa overlap (12-319:110-416) 10 20 30 40 pF1KE6 MASSSSLVPDRLRLPLCFLGVFVCYFYYGILQEKITRGKYG :.: .: :. : :. .:.:::.. .:: CCDS34 CVFGNEPKASDEVPLAPRTEAAETTPMWQALKLLFCATGLQVSYLTWGVLQERVMTRSYG 80 90 100 110 120 130 50 60 70 80 90 pF1KE6 EGAKQ--ETFTFALTLVFIQCVINAVFAKILIQFFDTARVDHTRSWLYAACSISYLGAMV : . : :: . ::... :. . : . . : . . :. :.: . . CCDS34 ATATSPGERFTDSQFLVLMNRVLALIVAGLSCVLCKQPR-HGAPMYRYSFASLSNVLSSW 140 150 160 170 180 190 100 110 120 130 140 150 pF1KE6 SSNSALQFVNYPTQVLGKSCKPIPVMLLGVTLLKKKYPLAKYLCVLLIVAGVALFMYKPK . ::.::..:::::.:. : :::::.: . ...: .:: . :: ::..:. . CCDS34 CQYEALKFVSFPTQVLAKASKVIPVMLMGKLVSRRSYEHWEYLTATLISIGVSMFLLSSG 200 210 220 230 240 250 160 170 180 190 200 210 pF1KE6 KVVGIEEHTVGYGELLLLLSLTLDGLTGVSQDHMRAHYQTGSNHMMLNINLWSTLLLGMG :. : .:: ...:..:. :: . : :. .: .::...:..: :. . CCDS34 PEPRSSPATTLSGLILLAGYIAFDSFTSNWQDALFA-YKMSSVQMMFGVNFFSCLFTVGS 260 270 280 290 300 310 220 230 240 250 260 270 pF1KE6 ILFTGELWEFLSFAERYPAIIYNILLFGLTSALGQSFIFMTVVYFGPLTCSIITTTRKFF .: : : : : :. . . ::... :: :: :::.:. :: . .:: : :. : CCDS34 LLEQGALLEGTRFMGRHSEFAAHALLLSICSACGQLFIFYTIGQFGAAVFTIIMTLRQAF 320 330 340 350 360 370 280 290 300 310 320 pF1KE6 TILASVILFANPISPMQWVGTVLVFLGLGLDAKFGKGAKKTSH .:: : .:... .. . .:...:: .: : . ...: : CCDS34 AILLSCLLYGHTVTVVGGLGVAVVFAALLLRV-YARGRLKQRGKKAVPVESPVQKV 380 390 400 410 420 430 >>CCDS69127.1 SLC35B2 gene_id:347734|Hs108|chr6 (339 aa) initn: 362 init1: 183 opt: 433 Z-score: 561.9 bits: 112.3 E(32554): 5.6e-25 Smith-Waterman score: 433; 31.8% identity (60.5% similar) in 299 aa overlap (23-319:28-323) 10 20 30 40 50 pF1KE6 MASSSSLVPDRLRLPLCFLGVFVCYFYYGILQEKITRGKYGEGAKQ--ETFTFAL : :. .:.:::.. .:: : . : :: . CCDS69 MLLAMPALWYLATSWCSTSGGRTTWRPVSYLTWGVLQERVMTRSYGATATSPGERFTDSQ 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 TLVFIQCVINAVFAKILIQFFDTARVDHTRSWLYAACSISYLGAMVSSNSALQFVNYPTQ ::... :. . : . . : . . :. :.: . . . ::.::..::: CCDS69 FLVLMNRVLALIVAGLSCVLCKQPR-HGAPMYRYSFASLSNVLSSWCQYEALKFVSFPTQ 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 VLGKSCKPIPVMLLGVTLLKKKYPLAKYLCVLLIVAGVALFMYKPKKVVGIEEHTVGYGE ::.:. : :::::.: . ...: .:: . :: ::..:. . :. : CCDS69 VLAKASKVIPVMLMGKLVSRRSYEHWEYLTATLISIGVSMFLLSSGPEPRSSPATTLSGL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 LLLLLSLTLDGLTGVSQDHMRAHYQTGSNHMMLNINLWSTLLLGMGILFTGELWEFLSFA .:: ...:..:. :: . : :. .: .::...:..: :. ..: : : : : CCDS69 ILLAGYIAFDSFTSNWQDALFA-YKMSSVQMMFGVNFFSCLFTVGSLLEQGALLEGTRFM 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 ERYPAIIYNILLFGLTSALGQSFIFMTVVYFGPLTCSIITTTRKFFTILASVILFANPIS :. . . ::... :: :: :::.:. :: . .:: : :. :.:: : .:... .. CCDS69 GRHSEFAAHALLLSICSACGQLFIFYTIGQFGAAVFTIIMTLRQAFAILLSCLLYGHTVT 240 250 260 270 280 290 300 310 320 pF1KE6 PMQWVGTVLVFLGLGLDAKFGKGAKKTSH . .:...:: .: : . ...: : CCDS69 VVGGLGVAVVFAALLLRV-YARGRLKQRGKKAVPVESPVQKV 300 310 320 330 >>CCDS4508.1 SLC35B3 gene_id:51000|Hs108|chr6 (401 aa) initn: 354 init1: 147 opt: 408 Z-score: 528.4 bits: 106.3 E(32554): 4.1e-23 Smith-Waterman score: 408; 32.2% identity (59.3% similar) in 307 aa overlap (16-319:83-375) 10 20 30 40 pF1KE6 MASSSSLVPDRLRLPLCFLGVFVCYFYYGILQEKITRGKYGEGAK .: :::: :. :: ::: : :: : CCDS45 QTMSPHIKSVDDVVVLGMNLSKFNKLTQFFICVAGVFVFYLIYGYLQELIFSV---EGFK 60 70 80 90 100 50 60 70 80 90 100 pF1KE6 QETFTFALTLVFIQCVINAVFAKILIQFFDTARVDHTRSWLYAACSISYLGAMVSSNSAL . . :::: : .. ..:. : .:... : . . : .. .:.: ::..: CCDS45 --SCGWYLTLV--QFAFYSIFGLIELQLIQDKR-RRIPGKTYMIIAFLTVGTMGLSNTSL 110 120 130 140 150 160 110 120 130 140 150 160 pF1KE6 QFVNYPTQVLGKSCKPIPVMLLGVTLLKKKYPLAKYLCVLLIVAGVALFMYKPKKVVGIE ..::::::. : :: ::::: :: . :.: .: .. . :. : . .. CCDS45 GYLNYPTQVIFKCCKLIPVMLGGVFIQGKRYNVADVSAAICMSLGLIWFTLADSTTAPNF 170 180 190 200 210 220 170 180 190 200 210 220 pF1KE6 EHTVGYGELLLLLSLTLDGLTGVSQDH-MRAHYQTGSNHMMLNINLWSTLLLGMGILFTG . : : .:. :.: :.. : :.. :. : ..:. .. . .. . .: .:. :. CCDS45 NLT---GVVLISLALCADAVIGNVQEKAMKLHNASNSEMVLYSYSIGFVYIL-LGLTCTS 230 240 250 260 270 280 230 240 250 260 270 280 pF1KE6 ELWEFLSFAERYPAIIYNI-LLFGLTSALGQSFIFMTVVYFGPLTCSIITTTRKFFTILA : ..: . :. :. .::.::. .: ::.. . :: : .:: :: .::. CCDS45 GLGPAVTFCAKNPVRTYGYAFLFSLTGYFGISFVLALIKIFGALIAVTVTTGRKAMTIVL 290 300 310 320 330 340 290 300 310 320 pF1KE6 SVILFANPIS-PMQWVGTVLVFLGLGLDAKFGKGAKKTSH : :.::.:.. . : : .:: ::. :.. ..:. : CCDS45 SFIFFAKPFTFQYVWSG-LLVVLGIFLNV-YSKNMDKIRLPSLYDLINKSVEARKSRTLA 350 360 370 380 390 CCDS45 QTV 400 >>CCDS75462.1 SLC35B2 gene_id:347734|Hs108|chr6 (299 aa) initn: 338 init1: 183 opt: 390 Z-score: 507.4 bits: 102.0 E(32554): 6.1e-22 Smith-Waterman score: 390; 31.7% identity (60.3% similar) in 287 aa overlap (35-319:1-283) 10 20 30 40 50 60 pF1KE6 SSLVPDRLRLPLCFLGVFVCYFYYGILQEKITRGKYGEGAKQ--ETFTFALTLVFIQCVI .::. :: : . : :: . ::... :. CCDS75 MTRS-YGATATSPGERFTDSQFLVLMNRVL 10 20 70 80 90 100 110 120 pF1KE6 NAVFAKILIQFFDTARVDHTRSWLYAACSISYLGAMVSSNSALQFVNYPTQVLGKSCKPI . : . . : . . :. :.: . . . ::.::..:::::.:. : : CCDS75 ALIVAGLSCVLCKQPR-HGAPMYRYSFASLSNVLSSWCQYEALKFVSFPTQVLAKASKVI 30 40 50 60 70 80 130 140 150 160 170 180 pF1KE6 PVMLLGVTLLKKKYPLAKYLCVLLIVAGVALFMYKPKKVVGIEEHTVGYGELLLLLSLTL ::::.: . ...: .:: . :: ::..:. . :. : .:: ... CCDS75 PVMLMGKLVSRRSYEHWEYLTATLISIGVSMFLLSSGPEPRSSPATTLSGLILLAGYIAF 90 100 110 120 130 140 190 200 210 220 230 240 pF1KE6 DGLTGVSQDHMRAHYQTGSNHMMLNINLWSTLLLGMGILFTGELWEFLSFAERYPAIIYN :..:. :: . : :. .: .::...:..: :. ..: : : : : :. . . CCDS75 DSFTSNWQDALFA-YKMSSVQMMFGVNFFSCLFTVGSLLEQGALLEGTRFMGRHSEFAAH 150 160 170 180 190 200 250 260 270 280 290 300 pF1KE6 ILLFGLTSALGQSFIFMTVVYFGPLTCSIITTTRKFFTILASVILFANPISPMQWVGTVL ::... :: :: :::.:. :: . .:: : :. :.:: : .:... .. . .:... CCDS75 ALLLSICSACGQLFIFYTIGQFGAAVFTIIMTLRQAFAILLSCLLYGHTVTVVGGLGVAV 210 220 230 240 250 260 310 320 pF1KE6 VFLGLGLDAKFGKGAKKTSH :: .: : . ...: : CCDS75 VFAALLLRV-YARGRLKQRGKKAVPVESPVQKV 270 280 290 322 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 12:05:25 2016 done: Tue Nov 8 12:05:26 2016 Total Scan time: 1.920 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]