FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5917, 505 aa 1>>>pF1KB5917 505 - 505 aa - 505 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.0780+/-0.000818; mu= 12.2777+/- 0.050 mean_var=145.9651+/-29.308, 0's: 0 Z-trim(112.8): 103 B-trim: 240 in 2/53 Lambda= 0.106157 statistics sampled from 13410 (13519) to 13410 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.745), E-opt: 0.2 (0.415), width: 16 Scan time: 3.360 The best scores are: opt bits E(32554) CCDS13220.1 SNTA1 gene_id:6640|Hs108|chr20 ( 505) 3322 520.2 2.1e-147 CCDS6334.1 SNTB1 gene_id:6641|Hs108|chr8 ( 538) 1603 257.0 3.9e-68 CCDS10873.1 SNTB2 gene_id:6645|Hs108|chr16 ( 540) 1432 230.8 3e-60 >>CCDS13220.1 SNTA1 gene_id:6640|Hs108|chr20 (505 aa) initn: 3322 init1: 3322 opt: 3322 Z-score: 2759.9 bits: 520.2 E(32554): 2.1e-147 Smith-Waterman score: 3322; 100.0% identity (100.0% similar) in 505 aa overlap (1-505:1-505) 10 20 30 40 50 60 pF1KB5 MASGRRAPRTGLLELRAGAGSGAGGERWQRVLLSLAEDVLTVSPADGDPGPEPGAPREQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MASGRRAPRTGLLELRAGAGSGAGGERWQRVLLSLAEDVLTVSPADGDPGPEPGAPREQE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 PAQLNGAAEPGAGPPQLPEALLLQRRRVTVRKADAGGLGISIKGGRENKMPILISKIFKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 PAQLNGAAEPGAGPPQLPEALLLQRRRVTVRKADAGGLGISIKGGRENKMPILISKIFKG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 LAADQTEALFVGDAILSVNGEDLSSATHDEAVQVLKKTGKEVVLEVKYMKDVSPYFKNST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LAADQTEALFVGDAILSVNGEDLSSATHDEAVQVLKKTGKEVVLEVKYMKDVSPYFKNST 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 GGTSVGWDSPPASPLQRQPSSPGPTPRNFSEAKHMSLKMAYVSKRCTPNDPEPRYLEICS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GGTSVGWDSPPASPLQRQPSSPGPTPRNFSEAKHMSLKMAYVSKRCTPNDPEPRYLEICS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 ADGQDTLFLRAKDEASARSWATAIQAQVNTLTPRVKDELQALLAATSTAGSQDIKQIGWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 ADGQDTLFLRAKDEASARSWATAIQAQVNTLTPRVKDELQALLAATSTAGSQDIKQIGWL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 TEQLPSGGTAPTLALLTEKELLLYLSLPETREALSRPARTAPLIATRLVHSGPSKGSVPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 TEQLPSGGTAPTLALLTEKELLLYLSLPETREALSRPARTAPLIATRLVHSGPSKGSVPY 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 DAELSFALRTGTRHGVDTHLFSVESPQELAAWTRQLVDGCHRAAEGVQEVSTACTWNGRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 DAELSFALRTGTRHGVDTHLFSVESPQELAAWTRQLVDGCHRAAEGVQEVSTACTWNGRP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 CSLSVHIDKGFTLWAAEPGAARAVLLRQPFEKLQMSSDDGASLLFLDFGGAEGEIQLDLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 CSLSVHIDKGFTLWAAEPGAARAVLLRQPFEKLQMSSDDGASLLFLDFGGAEGEIQLDLH 430 440 450 460 470 480 490 500 pF1KB5 SCPKTIVFIIHSFLSAKVTRLGLLA ::::::::::::::::::::::::: CCDS13 SCPKTIVFIIHSFLSAKVTRLGLLA 490 500 >>CCDS6334.1 SNTB1 gene_id:6641|Hs108|chr8 (538 aa) initn: 1690 init1: 541 opt: 1603 Z-score: 1336.7 bits: 257.0 E(32554): 3.9e-68 Smith-Waterman score: 1665; 50.8% identity (75.6% similar) in 532 aa overlap (2-505:15-538) 10 20 30 40 pF1KB5 MASGRRAPRTGLLELRAGAGSGAGGERWQRVLLSLAEDVLTVSPADG :.: :: :.::::. . .::..::..:.::.:..: .: CCDS63 MAVAAAAAAAGPAGAGGGRAQRSGLLEVLV-------RDRWHKVLVNLSEDALVLSSEEG 10 20 30 40 50 50 60 70 80 pF1KB5 DPGPEP-GAPREQEPAQLNGAAEPGAG---PP---------------QLPEALLLQRRRV . . :. . . ::..:::: :: :.::.. :.: : CCDS63 AAAYNGIGTATNGSFCRGAGAGHPGAGGAQPPDSPAGVRTAFTDLPEQVPESISNQKRGV 60 70 80 90 100 110 90 100 110 120 130 140 pF1KB5 TVRKADAGGLGISIKGGRENKMPILISKIFKGLAADQTEALFVGDAILSVNGEDLSSATH : : . ::::::::::.::::::::::::::::::::.::.:::::::::: :: .::: CCDS63 KVLKQELGGLGISIKGGKENKMPILISKIFKGLAADQTQALYVGDAILSVNGADLRDATH 120 130 140 150 160 170 150 160 170 180 190 200 pF1KB5 DEAVQVLKKTGKEVVLEVKYMKDVSPYFKNSTGGTSVGWDSPPA-SPLQRQPSSPGPTPR :::::.::..::::.::::::....:: :... . .::..:: :: .: :. . CCDS63 DEAVQALKRAGKEVLLEVKYMREATPYVKKGSPVSEIGWETPPPESPRLGGSTSDPPSSQ 180 190 200 210 220 230 210 220 230 240 250 260 pF1KB5 NFS---EAKHMSLKMAYVSKRCTPNDPEPRYLEICSADGQDTLFLRAKDEASARSWATAI .:: . : . ::: ::.. . ::: : ::: : :.. :..::.:: :.:..: .:: CCDS63 SFSFHRDRKSIPLKMCYVTRSMALADPENRQLEIHSPDAKHTVILRSKDSATAQAWFSAI 240 250 260 270 280 290 270 280 290 300 310 320 pF1KB5 QAQVNTLTPRVKDELQALLAATSTAGSQDIKQIGWLTEQLPSGGTA---PTLALLTEKEL ...:: : :: :.. :. :. :::..:...:::.:..:. . :.:..::::.: CCDS63 HSNVNDLLTRVIAEVREQLGKTGIAGSREIRHLGWLAEKVPGESKKQWKPALVVLTEKDL 300 310 320 330 340 350 330 340 350 360 370 380 pF1KB5 LLYLSLPETREALSRPARTAPLIATRLVHSGPSKGSVPYDAELSFALRTGTRHGVDTHLF :.: :.:. .:: :..: ::.:::::::::.::: ..:::: :::::.:..:::: CCDS63 LIYDSMPRRKEAWFSPVHTYPLLATRLVHSGPGKGSPQAGVDLSFATRTGTRQGIETHLF 360 370 380 390 400 410 390 400 410 420 430 pF1KB5 SVESPQELAAWTRQLVDGCHRAAEGVQEVSTACTWNGRPCSLSVHIDKGFTLWAAEP--G .:. ..:. :::..:.::: .:: . :.:::::.... : :..: ..::.. ..:: : CCDS63 RAETSRDLSHWTRSIVQGCHNSAELIAEISTACTYKNQECRLTIHYENGFSI-TTEPQEG 420 430 440 450 460 470 440 450 460 470 480 490 pF1KB5 AARAVLLRQPFEKLQMSSDDGASLLFLDFGGAEGEIQLDLHSCPKTIVFIIHSFLSAKVT : .....:.:::.:::::: .:.::::: .:::::::::::: ::::::::::::.: CCDS63 AFPKTIIQSPYEKLKMSSDDGIRMLYLDFGGKDGEIQLDLHSCPKPIVFIIHSFLSAKIT 480 490 500 510 520 530 500 pF1KB5 RLGLLA ::::.: CCDS63 RLGLVA >>CCDS10873.1 SNTB2 gene_id:6645|Hs108|chr16 (540 aa) initn: 1422 init1: 443 opt: 1432 Z-score: 1195.1 bits: 230.8 E(32554): 3e-60 Smith-Waterman score: 1458; 47.6% identity (71.4% similar) in 532 aa overlap (1-504:16-539) 10 20 30 40 pF1KB5 MASGRRAPRTGLLELRAGAGSGAGGERWQRVLLSLAEDVLTVS-- :: :: ..::.:: ::: ::. :. . :... CCDS10 MRVAAATAAAGAGPAMAVWTRATKAGLVELLLR-------ERWVRVVAELSGESLSLTGD 10 20 30 40 50 50 60 70 80 pF1KB5 --PADGDP--GPEP----GAPREQEPAQ-LNGAAEPGAGPPQLP--------EALLLQR- :. .: :: : : .. : :. : :::. : :: CCDS10 AAAAELEPALGPAAAAFNGLPNGGGAGDSLPGSPSRGLGPPSPPAPPRGPAGEAGASPPV 60 70 80 90 100 110 90 100 110 120 130 140 pF1KB5 RRVTVRKADAGGLGISIKGGRENKMPILISKIFKGLAADQTEALFVGDAILSVNGEDLSS ::: : : .::::::::::::::.::::::::: ::::::..:: .::::::::: :: . CCDS10 RRVRVVKQEAGGLGISIKGGRENRMPILISKIFPGLAADQSRALRLGDAILSVNGTDLRQ 120 130 140 150 160 170 150 160 170 180 190 200 pF1KB5 ATHDEAVQVLKKTGKEVVLEVKYMKDVSPYFKNSTGGTSVGWD-SPPASP-LQRQPSSPG ::::.:::.::..::::.::::....:.::.:. . ... :. . : :: .. . .: . CCDS10 ATHDQAVQALKRAGKEVLLEVKFIREVTPYIKKPSLVSDLPWEGAAPQSPSFSGSEDSGS 180 190 200 210 220 230 210 220 230 240 250 260 pF1KB5 PTPRNFSEAKHM-SLKMAYVSKRCTPNDPEPRYLEICSADGQDTLFLRAKDEASARSWAT : .: .. ... ::: .... . : : : .:. : :...::.:: :: :.:.:: . CCDS10 PKHQNSTKDRKIIPLKMCFAARNLSMPDLENRLIELHSPDSRNTLILRCKDTATAHSWFV 240 250 260 270 280 290 270 280 290 300 310 pF1KB5 AIQAQVNTLTPRVKDELQALLAATSTAG-SQDIKQIGWLTEQLP-SGGTA---PTLALLT ::.... .: :.: ::.:.:.:::::: :...:.:.::.:: .:: :.: .: CCDS10 AIHTNIMALLPQVLAELNAMLGATSTAGGSKEVKHIAWLAEQAKLDGGRQQWRPVLMAVT 300 310 320 330 340 350 320 330 340 350 360 370 pF1KB5 EKELLLYLSLPETREALSRPARTAPLIATRLVHSGPSKGSVPYDAELSFALRTGTRHGVD ::.:::: .: ::.: . : .. ::.:::::::: . : ..:.:: :::.:.:.. CCDS10 EKDLLLYDCMPWTRDAWASPCHSYPLVATRLVHSGSGCRSPSLGSDLTFATRTGSRQGIE 360 370 380 390 400 410 380 390 400 410 420 430 pF1KB5 THLFSVESPQELAAWTRQLVDGCHRAAEGVQEVSTACTWNGRPCSLSVHIDKGFTLWAAE ::: ::. ..:..::: ::.::: ::: ..::: .: ::. :..: ..:::. . : CCDS10 MHLFRVETHRDLSSWTRILVQGCHAAAELIKEVSLGCMLNGQEVRLTIHYENGFTI-SRE 420 430 440 450 460 470 440 450 460 470 480 490 pF1KB5 PGAARAVLLRQPFEKLQMSSDDGASLLFLDFGGAEGEIQLDLHSCPKTIVFIIHSFLSAK :.. ..: : :::.:.::.::: :.::::: :::. .::::::: :::..:.::::: CCDS10 NGGSSSILYRYPFERLKMSADDGIRNLYLDFGGPEGELTMDLHSCPKPIVFVLHTFLSAK 480 490 500 510 520 530 500 pF1KB5 VTRLGLLA :::.::: CCDS10 VTRMGLLV 540 505 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 00:28:24 2016 done: Mon Nov 7 00:28:25 2016 Total Scan time: 3.360 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]