FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5932, 538 aa
1>>>pF1KB5932 538 - 538 aa - 538 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.1867+/-0.000786; mu= 16.1406+/- 0.048
mean_var=114.4326+/-23.199, 0's: 0 Z-trim(111.7): 116 B-trim: 171 in 1/53
Lambda= 0.119895
statistics sampled from 12434 (12570) to 12434 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.719), E-opt: 0.2 (0.386), width: 16
Scan time: 3.850
The best scores are: opt bits E(32554)
CCDS6334.1 SNTB1 gene_id:6641|Hs108|chr8 ( 538) 3549 624.7 8.3e-179
CCDS10873.1 SNTB2 gene_id:6645|Hs108|chr16 ( 540) 1990 355.0 1.3e-97
CCDS13220.1 SNTA1 gene_id:6640|Hs108|chr20 ( 505) 1603 288.1 1.7e-77
CCDS46220.1 SNTG2 gene_id:54221|Hs108|chr2 ( 539) 349 71.2 3.5e-12
>>CCDS6334.1 SNTB1 gene_id:6641|Hs108|chr8 (538 aa)
initn: 3549 init1: 3549 opt: 3549 Z-score: 3323.6 bits: 624.7 E(32554): 8.3e-179
Smith-Waterman score: 3549; 100.0% identity (100.0% similar) in 538 aa overlap (1-538:1-538)
10 20 30 40 50 60
pF1KB5 MAVAAAAAAAGPAGAGGGRAQRSGLLEVLVRDRWHKVLVNLSEDALVLSSEEGAAAYNGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 MAVAAAAAAAGPAGAGGGRAQRSGLLEVLVRDRWHKVLVNLSEDALVLSSEEGAAAYNGI
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 GTATNGSFCRGAGAGHPGAGGAQPPDSPAGVRTAFTDLPEQVPESISNQKRGVKVLKQEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 GTATNGSFCRGAGAGHPGAGGAQPPDSPAGVRTAFTDLPEQVPESISNQKRGVKVLKQEL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 GGLGISIKGGKENKMPILISKIFKGLAADQTQALYVGDAILSVNGADLRDATHDEAVQAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 GGLGISIKGGKENKMPILISKIFKGLAADQTQALYVGDAILSVNGADLRDATHDEAVQAL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 KRAGKEVLLEVKYMREATPYVKKGSPVSEIGWETPPPESPRLGGSTSDPPSSQSFSFHRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 KRAGKEVLLEVKYMREATPYVKKGSPVSEIGWETPPPESPRLGGSTSDPPSSQSFSFHRD
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 RKSIPLKMCYVTRSMALADPENRQLEIHSPDAKHTVILRSKDSATAQAWFSAIHSNVNDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 RKSIPLKMCYVTRSMALADPENRQLEIHSPDAKHTVILRSKDSATAQAWFSAIHSNVNDL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 LTRVIAEVREQLGKTGIAGSREIRHLGWLAEKVPGESKKQWKPALVVLTEKDLLIYDSMP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 LTRVIAEVREQLGKTGIAGSREIRHLGWLAEKVPGESKKQWKPALVVLTEKDLLIYDSMP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 RRKEAWFSPVHTYPLLATRLVHSGPGKGSPQAGVDLSFATRTGTRQGIETHLFRAETSRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 RRKEAWFSPVHTYPLLATRLVHSGPGKGSPQAGVDLSFATRTGTRQGIETHLFRAETSRD
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB5 LSHWTRSIVQGCHNSAELIAEISTACTYKNQECRLTIHYENGFSITTEPQEGAFPKTIIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 LSHWTRSIVQGCHNSAELIAEISTACTYKNQECRLTIHYENGFSITTEPQEGAFPKTIIQ
430 440 450 460 470 480
490 500 510 520 530
pF1KB5 SPYEKLKMSSDDGIRMLYLDFGGKDGEIQLDLHSCPKPIVFIIHSFLSAKITRLGLVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 SPYEKLKMSSDDGIRMLYLDFGGKDGEIQLDLHSCPKPIVFIIHSFLSAKITRLGLVA
490 500 510 520 530
>>CCDS10873.1 SNTB2 gene_id:6645|Hs108|chr16 (540 aa)
initn: 1690 init1: 609 opt: 1990 Z-score: 1866.2 bits: 355.0 E(32554): 1.3e-97
Smith-Waterman score: 1990; 56.8% identity (79.2% similar) in 549 aa overlap (1-537:3-539)
10 20 30 40 50
pF1KB5 MAVAAAAAAAGPAGAGGGRAQRSGLLEVLVRDRWHKVLVNLSEDALVLSSEEGAA---
.:.:.:::.:::: : :: ..::.:.:.:.:: .:...:: ..: :... .::
CCDS10 MRVAAATAAAGAGPAMAVWTRATKAGLVELLLRERWVRVVAELSGESLSLTGDAAAAELE
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB5 -AYNGIGTATNGSFCRGAGAGH--PGAG--GAQPPDSPAGVRTAFTDLPEQVPESISNQK
: . ..: :: . :.::: ::. : ::. :: : . . :
CCDS10 PALGPAAAAFNG-LPNGGGAGDSLPGSPSRGLGPPSPPAPPRGPAGEAGASPPV------
70 80 90 100 110
120 130 140 150 160 170
pF1KB5 RGVKVLKQELGGLGISIKGGKENKMPILISKIFKGLAADQTQALYVGDAILSVNGADLRD
: :.:.::: ::::::::::.::.::::::::: ::::::..:: .:::::::::.:::.
CCDS10 RRVRVVKQEAGGLGISIKGGRENRMPILISKIFPGLAADQSRALRLGDAILSVNGTDLRQ
120 130 140 150 160 170
180 190 200 210 220
pF1KB5 ATHDEAVQALKRAGKEVLLEVKYMREATPYVKKGSPVSEIGWETPPPESPRLGGST-SDP
::::.:::::::::::::::::..::.:::.:: : ::.. :: :.:: ..:: :
CCDS10 ATHDQAVQALKRAGKEVLLEVKFIREVTPYIKKPSLVSDLPWEGAAPQSPSFSGSEDSGS
180 190 200 210 220 230
230 240 250 260 270 280
pF1KB5 PSSQSFSFHRDRKSIPLKMCYVTRSMALADPENRQLEIHSPDAKHTVILRSKDSATAQAW
:. :. . .::: ::::::...:.... : ::: .:.::::...:.::: ::.:::..:
CCDS10 PKHQNST--KDRKIIPLKMCFAARNLSMPDLENRLIELHSPDSRNTLILRCKDTATAHSW
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB5 FSAIHSNVNDLLTRVIAEVREQLGKTGIAG-SREIRHLGWLAE--KVPGESKKQWKPALV
: :::.:. :: .:.::. .:: :. :: :.:..:..:::: :. : ...::.:.:.
CCDS10 FVAIHTNIMALLPQVLAELNAMLGATSTAGGSKEVKHIAWLAEQAKLDG-GRQQWRPVLM
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB5 VLTEKDLLIYDSMPRRKEAWFSPVHTYPLLATRLVHSGPGKGSPQAGVDLSFATRTGTRQ
..::::::.:: :: ..:: :: :.:::.:::::::: : ::. : ::.::::::.::
CCDS10 AVTEKDLLLYDCMPWTRDAWASPCHSYPLVATRLVHSGSGCRSPSLGSDLTFATRTGSRQ
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB5 GIETHLFRAETSRDLSHWTRSIVQGCHNSAELIAEISTACTYKNQECRLTIHYENGFSIT
::: ::::.:: :::: ::: .::::: .:::: :.: .: ..:: ::::::::::.:.
CCDS10 GIEMHLFRVETHRDLSSWTRILVQGCHAAAELIKEVSLGCMLNGQEVRLTIHYENGFTIS
420 430 440 450 460 470
470 480 490 500 510 520
pF1KB5 TEPQEGAFPKTIIQSPYEKLKMSSDDGIRMLYLDFGGKDGEIQLDLHSCPKPIVFIIHSF
: .:. . . . :.:.::::.::::: ::::::: .::. .:::::::::::..:.:
CCDS10 RE--NGGSSSILYRYPFERLKMSADDGIRNLYLDFGGPEGELTMDLHSCPKPIVFVLHTF
480 490 500 510 520
530
pF1KB5 LSAKITRLGLVA
::::.::.::.
CCDS10 LSAKVTRMGLLV
530 540
>>CCDS13220.1 SNTA1 gene_id:6640|Hs108|chr20 (505 aa)
initn: 1647 init1: 541 opt: 1603 Z-score: 1504.8 bits: 288.1 E(32554): 1.7e-77
Smith-Waterman score: 1665; 50.8% identity (75.6% similar) in 532 aa overlap (15-538:2-505)
10 20 30 40 50
pF1KB5 MAVAAAAAAAGPAGAGGGRAQRSGLLEVLVR-------DRWHKVLVNLSEDALVLSSEEG
:.: :: :.::::. . .::..::..:.::.:..: .:
CCDS13 MASGRRAPRTGLLELRAGAGSGAGGERWQRVLLSLAEDVLTVSPADG
10 20 30 40
60 70 80 90 100 110
pF1KB5 AAAYNGIGTATNGSFCRGAGAGHPGAGGAQPPDSPAGVRTAFTDLPEQVPESISNQKRGV
. . :. . . ::..:::: :: :.::.. :.: :
CCDS13 DPGPEP-GAPREQEPAQLNGAAEPGAG---PP---------------QLPEALLLQRRRV
50 60 70 80
120 130 140 150 160 170
pF1KB5 KVLKQELGGLGISIKGGKENKMPILISKIFKGLAADQTQALYVGDAILSVNGADLRDATH
: : . ::::::::::.::::::::::::::::::::.::.:::::::::: :: .:::
CCDS13 TVRKADAGGLGISIKGGRENKMPILISKIFKGLAADQTEALFVGDAILSVNGEDLSSATH
90 100 110 120 130 140
180 190 200 210 220 230
pF1KB5 DEAVQALKRAGKEVLLEVKYMREATPYVKKGSPVSEIGWETPPPESPRLGGSTSDPPSSQ
:::::.::..::::.::::::....:: :... . .::..:: :: .: :. .
CCDS13 DEAVQVLKKTGKEVVLEVKYMKDVSPYFKNSTGGTSVGWDSPPA-SPLQRQPSSPGPTPR
150 160 170 180 190 200
240 250 260 270 280 290
pF1KB5 SFSFHRDRKSIPLKMCYVTRSMALADPENRQLEIHSPDAKHTVILRSKDSATAQAWFSAI
.:: . : . ::: ::.. . ::: : ::: : :.. :..::.:: :.:..: .::
CCDS13 NFS---EAKHMSLKMAYVSKRCTPNDPEPRYLEICSADGQDTLFLRAKDEASARSWATAI
210 220 230 240 250 260
300 310 320 330 340 350
pF1KB5 HSNVNDLLTRVIAEVREQLGKTGIAGSREIRHLGWLAEKVPGESKKQWKPALVVLTEKDL
...:: : :: :.. :. :. :::..:...:::.:..:. . :.:..::::.:
CCDS13 QAQVNTLTPRVKDELQALLAATSTAGSQDIKQIGWLTEQLPSGGT---APTLALLTEKEL
270 280 290 300 310 320
360 370 380 390 400 410
pF1KB5 LIYDSMPRRKEAWFSPVHTYPLLATRLVHSGPGKGSPQAGVDLSFATRTGTRQGIETHLF
:.: :.:. .:: :..: ::.:::::::::.::: ..:::: :::::.:..::::
CCDS13 LLYLSLPETREALSRPARTAPLIATRLVHSGPSKGSVPYDAELSFALRTGTRHGVDTHLF
330 340 350 360 370 380
420 430 440 450 460 470
pF1KB5 RAETSRDLSHWTRSIVQGCHNSAELIAEISTACTYKNQECRLTIHYENGFSI-TTEPQEG
.:. ..:. :::..:.::: .:: . :.:::::.... : :..: ..::.. ..:: :
CCDS13 SVESPQELAAWTRQLVDGCHRAAEGVQEVSTACTWNGRPCSLSVHIDKGFTLWAAEP--G
390 400 410 420 430
480 490 500 510 520 530
pF1KB5 AFPKTIIQSPYEKLKMSSDDGIRMLYLDFGGKDGEIQLDLHSCPKPIVFIIHSFLSAKIT
: .....:.:::.:::::: .:.::::: .:::::::::::: ::::::::::::.:
CCDS13 AARAVLLRQPFEKLQMSSDDGASLLFLDFGGAEGEIQLDLHSCPKTIVFIIHSFLSAKVT
440 450 460 470 480 490
pF1KB5 RLGLVA
::::.:
CCDS13 RLGLLA
500
>>CCDS46220.1 SNTG2 gene_id:54221|Hs108|chr2 (539 aa)
initn: 431 init1: 331 opt: 349 Z-score: 332.2 bits: 71.2 E(32554): 3.5e-12
Smith-Waterman score: 569; 27.9% identity (59.0% similar) in 458 aa overlap (110-531:71-518)
80 90 100 110 120 130
pF1KB5 GGAQPPDSPAGVRTAFTDLPEQVPESISNQKRGVKVLKQELGGLGISIKGGKENKMPILI
.: : . .: .::::.:::::.:...:..:
CCDS46 YDIRLKLTKEVLTIQKQDVVCVGGSHQGRNRRTVTLRRQPVGGLGLSIKGGSEHNVPVVI
50 60 70 80 90 100
140 150 160 170 180 190
pF1KB5 SKIFKGLAADQTQALYVGDAILSVNGADLRDATHDEAVQALKRAGKEVLLEVKYMREATP
::::. ::::: :.::::.:.::: ...:::.:.:. :. :: :: . :.:.:::
CCDS46 SKIFEDQAADQTGMLFVGDAVLQVNGIHVENATHEEVVHLLRNAGDEVTITVEYLREAPA
110 120 130 140 150 160
200 210 220 230 240
pF1KB5 YVKK--GSP--VSE--IGWETPPPESP-RLGG-STSDPPSSQSFSFHRDRK---------
..: ::: :. : .: .: .:.: :.. ::: : . .: .
CCDS46 FLKLPLGSPGPSSDHSSGASSPLFDSGLHLNGNSSTTAPSSPSSPIAKDPRYEKRWLDTL
170 180 190 200 210 220
250 260 270 280 290 300
pF1KB5 SIPLKMCYVTRSMALADPEN-RQLEIHSPDAKHTVILRSKDSATAQAWFSAIHSNVNDLL
:.::.: ..: : .. .:. . :. . ::: . . :. :. .:. .:
CCDS46 SVPLSMARISRYKAGTEKLRWNAFEVLALDGVSSGILRFYTAQDGTDWLRAVSANIRELT
230 240 250 260 270 280
310 320 330 340 350 360
pF1KB5 TRVIAEVREQLGKTGIAGSREIRHLGWLAEKVPG-ESKKQWKPALVVLTEKDLLIYDSMP
. . .... . : .. :.::. ::. : .:.. ..: ...: .. .... :
CCDS46 LQNM-----KMANKCCSPSDQVVHMGWVNEKLQGADSSQTFRPKFLALKGPSFYVFSTPP
290 300 310 320 330
370 380 390 400
pF1KB5 RRKEAWFSPVHTYPLLATRL-VHS------GPGKGSPQAGV-DLSFATRTGTRQGI----
: .:: : . . ::. ... :. :..: . .:
CCDS46 VSTFDWVRAERTYHLCEVLFKVHKFWLTEDCWLQANLYLGLQDFDFEDQRPYCFSIVAGH
340 350 360 370 380 390
410 420 430 440 450 460
pF1KB5 -ETHLFRAETSRDLSHWTRSIVQGCHNSAELIAEISTACTYKNQECRLTIHYENGFSITT
..:.: .: . .:. : .:. .. .. . . :..... .:. . ::.
CCDS46 GKSHVFNVELGSELAMWEKSFQRATFMEVQRTGSRTYMCSWQGEMLCFTVDFALGFTCF-
400 410 420 430 440 450
470 480 490 500 510 520
pF1KB5 EPQEGAFPKTIIQSPYEKLKMSSDDG---IRMLYLDFGGKDGEIQ-LDLHSCPKPIVFII
:. ... . . .:: ::::: ...:. .. :. : . :.... . .. :
CCDS46 ---ESKTKNVLWRFKFSQLKGSSDDGKTRVKLLFQNLDTKQIETKELEFQDL-RAVLHCI
460 470 480 490 500 510
530
pF1KB5 HSFLSAKITRLGLVA
:::..::.
CCDS46 HSFIAAKVASVDPGFMDSQSLARKYMYSS
520 530
538 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 15:55:05 2016 done: Sun Nov 6 15:55:05 2016
Total Scan time: 3.850 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]