FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5932, 538 aa 1>>>pF1KB5932 538 - 538 aa - 538 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.1867+/-0.000786; mu= 16.1406+/- 0.048 mean_var=114.4326+/-23.199, 0's: 0 Z-trim(111.7): 116 B-trim: 171 in 1/53 Lambda= 0.119895 statistics sampled from 12434 (12570) to 12434 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.719), E-opt: 0.2 (0.386), width: 16 Scan time: 3.850 The best scores are: opt bits E(32554) CCDS6334.1 SNTB1 gene_id:6641|Hs108|chr8 ( 538) 3549 624.7 8.3e-179 CCDS10873.1 SNTB2 gene_id:6645|Hs108|chr16 ( 540) 1990 355.0 1.3e-97 CCDS13220.1 SNTA1 gene_id:6640|Hs108|chr20 ( 505) 1603 288.1 1.7e-77 CCDS46220.1 SNTG2 gene_id:54221|Hs108|chr2 ( 539) 349 71.2 3.5e-12 >>CCDS6334.1 SNTB1 gene_id:6641|Hs108|chr8 (538 aa) initn: 3549 init1: 3549 opt: 3549 Z-score: 3323.6 bits: 624.7 E(32554): 8.3e-179 Smith-Waterman score: 3549; 100.0% identity (100.0% similar) in 538 aa overlap (1-538:1-538) 10 20 30 40 50 60 pF1KB5 MAVAAAAAAAGPAGAGGGRAQRSGLLEVLVRDRWHKVLVNLSEDALVLSSEEGAAAYNGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 MAVAAAAAAAGPAGAGGGRAQRSGLLEVLVRDRWHKVLVNLSEDALVLSSEEGAAAYNGI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 GTATNGSFCRGAGAGHPGAGGAQPPDSPAGVRTAFTDLPEQVPESISNQKRGVKVLKQEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 GTATNGSFCRGAGAGHPGAGGAQPPDSPAGVRTAFTDLPEQVPESISNQKRGVKVLKQEL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 GGLGISIKGGKENKMPILISKIFKGLAADQTQALYVGDAILSVNGADLRDATHDEAVQAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 GGLGISIKGGKENKMPILISKIFKGLAADQTQALYVGDAILSVNGADLRDATHDEAVQAL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 KRAGKEVLLEVKYMREATPYVKKGSPVSEIGWETPPPESPRLGGSTSDPPSSQSFSFHRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 KRAGKEVLLEVKYMREATPYVKKGSPVSEIGWETPPPESPRLGGSTSDPPSSQSFSFHRD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 RKSIPLKMCYVTRSMALADPENRQLEIHSPDAKHTVILRSKDSATAQAWFSAIHSNVNDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 RKSIPLKMCYVTRSMALADPENRQLEIHSPDAKHTVILRSKDSATAQAWFSAIHSNVNDL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 LTRVIAEVREQLGKTGIAGSREIRHLGWLAEKVPGESKKQWKPALVVLTEKDLLIYDSMP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 LTRVIAEVREQLGKTGIAGSREIRHLGWLAEKVPGESKKQWKPALVVLTEKDLLIYDSMP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 RRKEAWFSPVHTYPLLATRLVHSGPGKGSPQAGVDLSFATRTGTRQGIETHLFRAETSRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 RRKEAWFSPVHTYPLLATRLVHSGPGKGSPQAGVDLSFATRTGTRQGIETHLFRAETSRD 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 LSHWTRSIVQGCHNSAELIAEISTACTYKNQECRLTIHYENGFSITTEPQEGAFPKTIIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 LSHWTRSIVQGCHNSAELIAEISTACTYKNQECRLTIHYENGFSITTEPQEGAFPKTIIQ 430 440 450 460 470 480 490 500 510 520 530 pF1KB5 SPYEKLKMSSDDGIRMLYLDFGGKDGEIQLDLHSCPKPIVFIIHSFLSAKITRLGLVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 SPYEKLKMSSDDGIRMLYLDFGGKDGEIQLDLHSCPKPIVFIIHSFLSAKITRLGLVA 490 500 510 520 530 >>CCDS10873.1 SNTB2 gene_id:6645|Hs108|chr16 (540 aa) initn: 1690 init1: 609 opt: 1990 Z-score: 1866.2 bits: 355.0 E(32554): 1.3e-97 Smith-Waterman score: 1990; 56.8% identity (79.2% similar) in 549 aa overlap (1-537:3-539) 10 20 30 40 50 pF1KB5 MAVAAAAAAAGPAGAGGGRAQRSGLLEVLVRDRWHKVLVNLSEDALVLSSEEGAA--- .:.:.:::.:::: : :: ..::.:.:.:.:: .:...:: ..: :... .:: CCDS10 MRVAAATAAAGAGPAMAVWTRATKAGLVELLLRERWVRVVAELSGESLSLTGDAAAAELE 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB5 -AYNGIGTATNGSFCRGAGAGH--PGAG--GAQPPDSPAGVRTAFTDLPEQVPESISNQK : . ..: :: . :.::: ::. : ::. :: : . . : CCDS10 PALGPAAAAFNG-LPNGGGAGDSLPGSPSRGLGPPSPPAPPRGPAGEAGASPPV------ 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 RGVKVLKQELGGLGISIKGGKENKMPILISKIFKGLAADQTQALYVGDAILSVNGADLRD : :.:.::: ::::::::::.::.::::::::: ::::::..:: .:::::::::.:::. CCDS10 RRVRVVKQEAGGLGISIKGGRENRMPILISKIFPGLAADQSRALRLGDAILSVNGTDLRQ 120 130 140 150 160 170 180 190 200 210 220 pF1KB5 ATHDEAVQALKRAGKEVLLEVKYMREATPYVKKGSPVSEIGWETPPPESPRLGGST-SDP ::::.:::::::::::::::::..::.:::.:: : ::.. :: :.:: ..:: : CCDS10 ATHDQAVQALKRAGKEVLLEVKFIREVTPYIKKPSLVSDLPWEGAAPQSPSFSGSEDSGS 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB5 PSSQSFSFHRDRKSIPLKMCYVTRSMALADPENRQLEIHSPDAKHTVILRSKDSATAQAW :. :. . .::: ::::::...:.... : ::: .:.::::...:.::: ::.:::..: CCDS10 PKHQNST--KDRKIIPLKMCFAARNLSMPDLENRLIELHSPDSRNTLILRCKDTATAHSW 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB5 FSAIHSNVNDLLTRVIAEVREQLGKTGIAG-SREIRHLGWLAE--KVPGESKKQWKPALV : :::.:. :: .:.::. .:: :. :: :.:..:..:::: :. : ...::.:.:. CCDS10 FVAIHTNIMALLPQVLAELNAMLGATSTAGGSKEVKHIAWLAEQAKLDG-GRQQWRPVLM 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB5 VLTEKDLLIYDSMPRRKEAWFSPVHTYPLLATRLVHSGPGKGSPQAGVDLSFATRTGTRQ ..::::::.:: :: ..:: :: :.:::.:::::::: : ::. : ::.::::::.:: CCDS10 AVTEKDLLLYDCMPWTRDAWASPCHSYPLVATRLVHSGSGCRSPSLGSDLTFATRTGSRQ 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB5 GIETHLFRAETSRDLSHWTRSIVQGCHNSAELIAEISTACTYKNQECRLTIHYENGFSIT ::: ::::.:: :::: ::: .::::: .:::: :.: .: ..:: ::::::::::.:. CCDS10 GIEMHLFRVETHRDLSSWTRILVQGCHAAAELIKEVSLGCMLNGQEVRLTIHYENGFTIS 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB5 TEPQEGAFPKTIIQSPYEKLKMSSDDGIRMLYLDFGGKDGEIQLDLHSCPKPIVFIIHSF : .:. . . . :.:.::::.::::: ::::::: .::. .:::::::::::..:.: CCDS10 RE--NGGSSSILYRYPFERLKMSADDGIRNLYLDFGGPEGELTMDLHSCPKPIVFVLHTF 480 490 500 510 520 530 pF1KB5 LSAKITRLGLVA ::::.::.::. CCDS10 LSAKVTRMGLLV 530 540 >>CCDS13220.1 SNTA1 gene_id:6640|Hs108|chr20 (505 aa) initn: 1647 init1: 541 opt: 1603 Z-score: 1504.8 bits: 288.1 E(32554): 1.7e-77 Smith-Waterman score: 1665; 50.8% identity (75.6% similar) in 532 aa overlap (15-538:2-505) 10 20 30 40 50 pF1KB5 MAVAAAAAAAGPAGAGGGRAQRSGLLEVLVR-------DRWHKVLVNLSEDALVLSSEEG :.: :: :.::::. . .::..::..:.::.:..: .: CCDS13 MASGRRAPRTGLLELRAGAGSGAGGERWQRVLLSLAEDVLTVSPADG 10 20 30 40 60 70 80 90 100 110 pF1KB5 AAAYNGIGTATNGSFCRGAGAGHPGAGGAQPPDSPAGVRTAFTDLPEQVPESISNQKRGV . . :. . . ::..:::: :: :.::.. :.: : CCDS13 DPGPEP-GAPREQEPAQLNGAAEPGAG---PP---------------QLPEALLLQRRRV 50 60 70 80 120 130 140 150 160 170 pF1KB5 KVLKQELGGLGISIKGGKENKMPILISKIFKGLAADQTQALYVGDAILSVNGADLRDATH : : . ::::::::::.::::::::::::::::::::.::.:::::::::: :: .::: CCDS13 TVRKADAGGLGISIKGGRENKMPILISKIFKGLAADQTEALFVGDAILSVNGEDLSSATH 90 100 110 120 130 140 180 190 200 210 220 230 pF1KB5 DEAVQALKRAGKEVLLEVKYMREATPYVKKGSPVSEIGWETPPPESPRLGGSTSDPPSSQ :::::.::..::::.::::::....:: :... . .::..:: :: .: :. . CCDS13 DEAVQVLKKTGKEVVLEVKYMKDVSPYFKNSTGGTSVGWDSPPA-SPLQRQPSSPGPTPR 150 160 170 180 190 200 240 250 260 270 280 290 pF1KB5 SFSFHRDRKSIPLKMCYVTRSMALADPENRQLEIHSPDAKHTVILRSKDSATAQAWFSAI .:: . : . ::: ::.. . ::: : ::: : :.. :..::.:: :.:..: .:: CCDS13 NFS---EAKHMSLKMAYVSKRCTPNDPEPRYLEICSADGQDTLFLRAKDEASARSWATAI 210 220 230 240 250 260 300 310 320 330 340 350 pF1KB5 HSNVNDLLTRVIAEVREQLGKTGIAGSREIRHLGWLAEKVPGESKKQWKPALVVLTEKDL ...:: : :: :.. :. :. :::..:...:::.:..:. . :.:..::::.: CCDS13 QAQVNTLTPRVKDELQALLAATSTAGSQDIKQIGWLTEQLPSGGT---APTLALLTEKEL 270 280 290 300 310 320 360 370 380 390 400 410 pF1KB5 LIYDSMPRRKEAWFSPVHTYPLLATRLVHSGPGKGSPQAGVDLSFATRTGTRQGIETHLF :.: :.:. .:: :..: ::.:::::::::.::: ..:::: :::::.:..:::: CCDS13 LLYLSLPETREALSRPARTAPLIATRLVHSGPSKGSVPYDAELSFALRTGTRHGVDTHLF 330 340 350 360 370 380 420 430 440 450 460 470 pF1KB5 RAETSRDLSHWTRSIVQGCHNSAELIAEISTACTYKNQECRLTIHYENGFSI-TTEPQEG .:. ..:. :::..:.::: .:: . :.:::::.... : :..: ..::.. ..:: : CCDS13 SVESPQELAAWTRQLVDGCHRAAEGVQEVSTACTWNGRPCSLSVHIDKGFTLWAAEP--G 390 400 410 420 430 480 490 500 510 520 530 pF1KB5 AFPKTIIQSPYEKLKMSSDDGIRMLYLDFGGKDGEIQLDLHSCPKPIVFIIHSFLSAKIT : .....:.:::.:::::: .:.::::: .:::::::::::: ::::::::::::.: CCDS13 AARAVLLRQPFEKLQMSSDDGASLLFLDFGGAEGEIQLDLHSCPKTIVFIIHSFLSAKVT 440 450 460 470 480 490 pF1KB5 RLGLVA ::::.: CCDS13 RLGLLA 500 >>CCDS46220.1 SNTG2 gene_id:54221|Hs108|chr2 (539 aa) initn: 431 init1: 331 opt: 349 Z-score: 332.2 bits: 71.2 E(32554): 3.5e-12 Smith-Waterman score: 569; 27.9% identity (59.0% similar) in 458 aa overlap (110-531:71-518) 80 90 100 110 120 130 pF1KB5 GGAQPPDSPAGVRTAFTDLPEQVPESISNQKRGVKVLKQELGGLGISIKGGKENKMPILI .: : . .: .::::.:::::.:...:..: CCDS46 YDIRLKLTKEVLTIQKQDVVCVGGSHQGRNRRTVTLRRQPVGGLGLSIKGGSEHNVPVVI 50 60 70 80 90 100 140 150 160 170 180 190 pF1KB5 SKIFKGLAADQTQALYVGDAILSVNGADLRDATHDEAVQALKRAGKEVLLEVKYMREATP ::::. ::::: :.::::.:.::: ...:::.:.:. :. :: :: . :.:.::: CCDS46 SKIFEDQAADQTGMLFVGDAVLQVNGIHVENATHEEVVHLLRNAGDEVTITVEYLREAPA 110 120 130 140 150 160 200 210 220 230 240 pF1KB5 YVKK--GSP--VSE--IGWETPPPESP-RLGG-STSDPPSSQSFSFHRDRK--------- ..: ::: :. : .: .: .:.: :.. ::: : . .: . CCDS46 FLKLPLGSPGPSSDHSSGASSPLFDSGLHLNGNSSTTAPSSPSSPIAKDPRYEKRWLDTL 170 180 190 200 210 220 250 260 270 280 290 300 pF1KB5 SIPLKMCYVTRSMALADPEN-RQLEIHSPDAKHTVILRSKDSATAQAWFSAIHSNVNDLL :.::.: ..: : .. .:. . :. . ::: . . :. :. .:. .: CCDS46 SVPLSMARISRYKAGTEKLRWNAFEVLALDGVSSGILRFYTAQDGTDWLRAVSANIRELT 230 240 250 260 270 280 310 320 330 340 350 360 pF1KB5 TRVIAEVREQLGKTGIAGSREIRHLGWLAEKVPG-ESKKQWKPALVVLTEKDLLIYDSMP . . .... . : .. :.::. ::. : .:.. ..: ...: .. .... : CCDS46 LQNM-----KMANKCCSPSDQVVHMGWVNEKLQGADSSQTFRPKFLALKGPSFYVFSTPP 290 300 310 320 330 370 380 390 400 pF1KB5 RRKEAWFSPVHTYPLLATRL-VHS------GPGKGSPQAGV-DLSFATRTGTRQGI---- : .:: : . . ::. ... :. :..: . .: CCDS46 VSTFDWVRAERTYHLCEVLFKVHKFWLTEDCWLQANLYLGLQDFDFEDQRPYCFSIVAGH 340 350 360 370 380 390 410 420 430 440 450 460 pF1KB5 -ETHLFRAETSRDLSHWTRSIVQGCHNSAELIAEISTACTYKNQECRLTIHYENGFSITT ..:.: .: . .:. : .:. .. .. . . :..... .:. . ::. CCDS46 GKSHVFNVELGSELAMWEKSFQRATFMEVQRTGSRTYMCSWQGEMLCFTVDFALGFTCF- 400 410 420 430 440 450 470 480 490 500 510 520 pF1KB5 EPQEGAFPKTIIQSPYEKLKMSSDDG---IRMLYLDFGGKDGEIQ-LDLHSCPKPIVFII :. ... . . .:: ::::: ...:. .. :. : . :.... . .. : CCDS46 ---ESKTKNVLWRFKFSQLKGSSDDGKTRVKLLFQNLDTKQIETKELEFQDL-RAVLHCI 460 470 480 490 500 510 530 pF1KB5 HSFLSAKITRLGLVA :::..::. CCDS46 HSFIAAKVASVDPGFMDSQSLARKYMYSS 520 530 538 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 15:55:05 2016 done: Sun Nov 6 15:55:05 2016 Total Scan time: 3.850 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]